Dirty Data: qué es y cómo combatirlo

Un informe publicado por Hocelot, startup española, explica que el Dirty Data está configurado por “datos incorrectos, incompletos, desactualizados o duplicados que se encuentran en las bases de datos de las empresas” y es que, advierte, “más de la mitad de los usuarios facilitan datos falsos para las bases de datos de las empresas”.

La firma, que ofrece el servicio Data Standarization & Enhacement, una herramienta para combatir estos “datos sucios” explica que, mientras los  datos se han convertido en una herramienta de enorme potencial para la optimización de resultados, se precisa distinguir la información veraz de la fraudulenta.

“Las plataformas de Big Data no tienen en cuenta el Dirty Data, es decir, bases de datos con información incorrecta, incompleta, inexacta, desactualizada o con datos duplicados”.

“Las empresas se enfrentan a un serio problema cuando se lanzan al Big Data, ya que no toda la información que recopilan es veraz. Según nuestros propios estudios más de la mitad de los usuarios aportan al menos un dato falso entre la información que facilitan a las empresas. Además, se calcula que el 25% de la información que poseen las empresas podrían ser datos falsos”, asegura Antonio Camacho, fundador de Hocelot. “El Dirty Data es, por tanto, un nuevo reto que las empresas deben afrontar si quieren reducir los riesgos por pérdidas relacionadas con el fraude de identidad”.

Consideran desde Hocelot que la veracidad de los datos se ha convertido en una cuestión de confianza para las propias empresas, que deben conocer los motivos que llevan a los usuarios a falsear sus datos.

Bárbara Bécares

Informando desde América Latina. Ya he estado reportando desde Colombia, Brasil, Argentina, Perú, Ecuador y Chile. Ahora y durante un tiempo, descubriendo las novedades de México. Soy periodista, apasionada de los viajes y de conocer culturas. Colaboro en www.channelbiz.es y www.siliconweek.com.

Recent Posts

Pure Storage y Kioxia colaboran para impulsar la escalabilidad, la eficiencia y el rendimiento en los centros de datos de hiperescala

Este acuerdo permite una escala rápida al tiempo que reduce el consumo de energía y…

3 días ago

MEXDC y el Senado de la República dialogan sobre la relevancia de los Data Centers

Las líneas de diálogo entre gobierno, industria y academia se centraron en Inversión Tecnológica en…

3 días ago

Xerox propone sistemas de automatización que optimicen las operaciones de las empresas

Por Rafael Hirata, Jefe de Innovación y Desarrollo de Negocios Digitales, responsable de Servicios de…

3 días ago

Appian, elegida líder en Everest Group’s Process Orchestration Products PEAK Matrix 2024

Según Everest Group: “Appian tiene como objetivo ofrecer automatización y orquestación integral de procesos a…

4 días ago

Las nuevas tecnologías y su impacto en el crecimiento empresarial para 2025

Por Uriel Fraire, Regional Sales Manager Mexico de Universal Robots.

4 días ago