Categories: Big DataDatos y almacenamiento

Dirty Data: qué es y cómo combatirlo

Un informe publicado por Hocelot, startup española, explica que el Dirty Data está configurado por “datos incorrectos, incompletos, desactualizados o duplicados que se encuentran en las bases de datos de las empresas” y es que, advierte, “más de la mitad de los usuarios facilitan datos falsos para las bases de datos de las empresas”.

La firma, que ofrece el servicio Data Standarization & Enhacement, una herramienta para combatir estos “datos sucios” explica que, mientras los datos se han convertido en una herramienta de enorme potencial para la optimización de resultados, se precisa distinguir la información veraz de la fraudulenta.

“Las plataformas de Big Data no tienen en cuenta el Dirty Data, es decir, bases de datos con información incorrecta, incompleta, inexacta, desactualizada o con datos duplicados”.

“Las empresas se enfrentan a un serio problema cuando se lanzan al Big Data, ya que no toda la información que recopilan es veraz. Según nuestros propios estudios más de la mitad de los usuarios aportan al menos un dato falso entre la información que facilitan a las empresas. Además, se calcula que el 25% de la información que poseen las empresas podrían ser datos falsos”, asegura Antonio Camacho, fundador de Hocelot. “El Dirty Data es, por tanto, un nuevo reto que las empresas deben afrontar si quieren reducir los riesgos por pérdidas relacionadas con el fraude de identidad”.

Consideran desde Hocelot que la veracidad de los datos se ha convertido en una cuestión de confianza para las propias empresas, que deben conocer los motivos que llevan a los usuarios a falsear sus datos.

Bárbara Bécares

Informando desde América Latina. Ya he estado reportando desde Colombia, Brasil, Argentina, Perú, Ecuador y Chile. Ahora y durante un tiempo, descubriendo las novedades de México. Soy periodista, apasionada de los viajes y de conocer culturas. Colaboro en www.channelbiz.es y www.siliconweek.com.

NextLa décima serie de AngelHack llega a México »

Previous « Startupbootcamp elige 9 startups del sector fintech

Pure Storage y Kioxia colaboran para impulsar la escalabilidad, la eficiencia y el rendimiento en los centros de datos de hiperescala

Este acuerdo permite una escala rápida al tiempo que reduce el consumo de energía y…

3 días ago

Dirty Data: qué es y cómo combatirlo

Recent Posts

Pure Storage y Kioxia colaboran para impulsar la escalabilidad, la eficiencia y el rendimiento en los centros de datos de hiperescala

MEXDC y el Senado de la República dialogan sobre la relevancia de los Data Centers

Xerox propone sistemas de automatización que optimicen las operaciones de las empresas

Appian, elegida líder en Everest Group’s Process Orchestration Products PEAK Matrix 2024

Las nuevas tecnologías y su impacto en el crecimiento empresarial para 2025

Transformando la ciberseguridad y la gestión de redes: la fusión de la IA y el DNS

Dirty Data: qué es y cómo combatirlo

Related Post

Recent Posts

Pure Storage y Kioxia colaboran para impulsar la escalabilidad, la eficiencia y el rendimiento en los centros de datos de hiperescala

MEXDC y el Senado de la República dialogan sobre la relevancia de los Data Centers

Xerox propone sistemas de automatización que optimicen las operaciones de las empresas

Appian, elegida líder en Everest Group’s Process Orchestration Products PEAK Matrix 2024

Las nuevas tecnologías y su impacto en el crecimiento empresarial para 2025

Transformando la ciberseguridad y la gestión de redes: la fusión de la IA y el DNS