¿Por qué el “dark data” puede generar costos ocultos?
Por Fernando Zambrana, Director de Ventas de Nutanix México.
Las empresas de hoy en día recopilan más datos que nunca, y este cúmulo de información sigue creciendo a un ritmo exponencial. Esta situación les permite tomar mejores decisiones de negocio, pero también surgen nuevos desafíos. Hoy en día se generan mayormente (80-90 % según las estimaciones de 2021) datos no estructurados o “dark data”. La tecnología Big Data ofrece enormes posibilidades, pero solo la información está en un formato donde puede ser analizada y procesada correctamente.
Esto parece un problema destinado a salirse de control para muchas organizaciones, pero las nuevas tecnologías de aplicaciones de analíticos y almacenamiento están ayudando a obtener valor de los datos de una forma cada vez más intuitiva y eficaz.
¿Qué son los datos no estructurados y por qué importan para la inteligencia empresarial?
En esta era digital, casi todas las acciones que realizamos generan datos: abrir un sitio web, usar las redes sociales e incluso caminar por la calle con un teléfono inteligente genera datos de GPS. A medida que IoT continúa creciendo año tras año, a un ritmo establecido para alcanzar los 41,6 mil millones de dispositivos para 2025, es fácil ver por qué los datos del mundo se multiplican tan rápidamente.
Algunos de estos datos están estructurados, lo que significa que tienen un formato específico que se puede procesar fácilmente. Un ejemplo básico de datos estructurados sería una base de datos de clientes, donde el nombre, la dirección, el correo electrónico y otros detalles se almacenan en lugares predefinidos.
En cambio, los no estructurados son datos sin procesar que no tienen una estructura organizativa definida, normalmente carecen de representación orientada a caracteres y no se pueden consultar mediante métodos basados en SQL. Algunos ejemplos de datos no estructurados y semiestructurados incluirían publicaciones en redes sociales, mensajes de correo electrónico, documentos, imágenes, videos, archivos de audio y otros tipos de archivos de documentos.
Estos crean desafíos de almacenamiento y administración porque vienen en formatos diferentes y no se pueden buscar fácilmente. Si no se clasifican ni administran, los datos no estructurados pueden llenar rápidamente la infraestructura de almacenamiento, lo que hace que las empresas aumenten exponencialmente los costos.
Consideraciones de almacenamiento para datos no estructurados
Las empresas que están considerando cómo administrar sus datos no estructurados actuales y planean soluciones de almacenamiento de datos, deben considerar varios factores al elegir sistemas e infraestructura de almacenamiento de datos:
- Capacidad y escalabilidad: ¿Cuánto espacio de almacenamiento necesitas? ¿cómo escalarás tus necesidades de almacenamiento en el futuro?
- Rendimiento: Para que cualquier sistema de gestión de datos estratégicos se ajuste a Tu propósito, debe ser lo suficientemente potente como para admitir la cantidad requerida de usuarios que acceden al sistema simultáneamente y procesar datos mediante la búsqueda o clasificación dentro de escalas de tiempo aceptables.
- Accesibilidad: ¿Quién necesita acceso a tus datos diariamente? ¿Tienes diferentes equipos trabajando en todo el mundo? ¿Cómo puedes habilitar un acceso rápido y eficiente a estos equipos mientras mantienes la seguridad e integridad de los datos?
- Seguridad y cumplimiento: ¿cómo garantizarás que tus datos estén a salvo de accesos no autorizados o pérdidas accidentales? ¿Ciertos datos están sujetos a protocolos de seguridad más estrictos que otros datos? ¿Está tu industria sujeta a una legislación específica de protección de datos?
- Facilidad de implementación: Es vital considerar el proceso de creación e implementación de una nueva arquitectura, lo que se necesita en términos de nuevo hardware y software, y cómo se verá afectada tu empresa durante la transición.
- Copia de seguridad y recuperación: El tipo de respaldo más adecuado para tu empresa dependerá de tus necesidades comerciales individuales. También es fundamental anticipar posibles pérdidas o filtraciones de datos y contar con un plan de recuperación de datos.
Los beneficios de administrar adecuadamente los datos
Las organizaciones que dan prioridad a la gestión de datos se benefician de costos de almacenamiento a largo plazo más bajos y, por lo general, experimentan un aumento promedio de los ingresos anuales del 5,32%. Además, tienen un 162 % más de posibilidades de superar a sus competidores.