Tiempo de lectura: 5 minutos

Si Samuel Coleridge estuviera escribiendo el Rima del futuro analista de datosdiría algo así: "Datos, datos por todas partes, ni un byte que procesar..." o algo parecido.

Para todos los chicos guays que no se enamoraron de la literatura inglesa, la cuestión es sencilla: estamos rodeados de más datos que nunca, pero cada vez es más difícil gestionarlos, acceder a ellos y utilizarlos, especialmente los datos no estructurados.

Los volúmenes de datos siguen creciendo exponencialmente. Y, aunque el coste de la infraestructura de almacenamiento está disminuyendo con los avances tecnológicos, el coste real del almacenamiento de datos sigue aumentando debido a la enorme cantidad de datos que manejamos hoy en día. Y si la estrategia tradicional de almacenamiento por triplicado no cubre las necesidades de almacenamiento lo suficiente por sí sola, los datos incluso están aumentando sus propios datos para acelerar el predicamento.

¿Qué hay que hacer? La respuesta se encuentra en la nube, concretamente en CloudFS de Panzura. Analicemos el reto de los datos, repasemos algunas estrategias de mitigación habituales que no funcionan y veamos qué hace CloudFS de forma diferente para controlar la difícil situación actual de los datos no estructurados.

¿De dónde proceden todos estos datos?

Según un reciente informe de IDC, los datos no estructurados crecen a un ritmo del 40% anual, seis veces más rápido que los estructurados. Y eso en el mejor de los casos, teniendo en cuenta que cada vez que los analistas predicen el crecimiento de los datos, se equivocan. Siempre es mucho, mucho más. ¿Por qué? Los datos hacen datos, ad infinitum.

Piense en el análisis: una empresa que lleva 30 años funcionando ha generado muchos datos. Pero, cuando los analizan, generan una potente inteligencia empresarial. También están creando más datos además de los que ya tienen.

Cualquier sector vertical lo demuestra. La sanidad tiene telemetría y datos biológicos de los pacientes. En la industria manufacturera, la identificación por radiofrecuencia (RFID) y el Internet de las cosas (IoT) están presentes en todas las plantas, camiones y almacenes. Las aplicaciones de las redes sociales no son otra cosa que datos no estructurados. Incluso el algoritmo de reconocimiento facial de los timbres wi-fi genera datos cada vez que analiza imágenes de vídeo.

Trabajar con datos no estructurados es todo un reto.

Si los datos no estructurados son el basurero que enciende las pesadillas de todos los responsables de TI, es importante entender qué los convierte en un problema tan caótico.

Para empezar, no está estructurado. Claro. No hay un esquema organizativo concreto para intentar entenderlo. Es un rompecabezas sin caja y con un número desconocido de piezas. Es una manguera de información y la mayoría de las empresas intentan filtrarla con una pajita.

Además, no hay límites para el tipo de datos con los que tienen que trabajar los responsables de TI. Las opciones van desde texto e imágenes hasta audio y vídeo. Es como intentar leer un libro en otro idioma con los ojos vendados. Imposible.

Gestionar datos no estructurados es una pesadilla.

Los datos no estructurados son una pesadilla. Imagínese una habitación llena de niños revoltosos y borrachos de azúcar. Tu trabajo consiste en hacer que sigan las normas, que jueguen bien entre ellos y que no rompan nada. Si usted es responsable de TI, no tiene que lidiar con niños, sino con terabytes de datos.

El almacenamiento es uno de los principales quebraderos de cabeza de la gestión de datos no estructurados: nunca hay suficiente. En cuanto una organización se pone al día, la roca rueda colina abajo y tiene que empezar a empujarla de nuevo.

¿Y la principal causa de dolor informático? La gobernanza de los datos. Los ciberdelincuentes quieren hacerse con los datos, sobre todo con los no estructurados. Si salen a la luz, los responsables de la seguridad de los datos podrían intentar volver a meter la pasta de dientes en el tubo. Buena suerte. ¿Cumplimiento de la normativa? ¿Cómo lo mantienen las empresas cuando ni siquiera están seguras de lo que tienen?

El almacenamiento de datos no estructurados es cada vez más caro.

El almacenamiento de datos no estructurados es un tren desbocado que no se puede parar. Después de tener en cuenta el coste de la infraestructura de almacenamiento, recuerda que hay que hacer copias de seguridad, archivar y proteger todo. Es como mantener una flota de Ferraris: puede que consigas que todo funcione sin problemas, pero el coste (y el estrés) hacen que sea poco probable que disfrutes conduciendo uno.

Parte de la dificultad no estriba únicamente en el caos inherente a los datos no estructurados -recordemos que carecen de lógica, clasificación o jerarquía categórica-, sino que las empresas también tienen que navegar por un ecosistema vivo y dinámico de información que las personas de la organización necesitan.

Esto significa rendimiento, velocidad de acceso y disponibilidad son aspectos críticos en un plan de almacenamiento eficaz. ¿Pueden los usuarios obtener los datos que necesitan cuando los necesitan? ¿Hasta qué punto la lentitud es suficiente? Son preguntas espinosas para un responsable de TI que se enfrenta a un vasto lago de datos no estructurados y sólo tiene a mano estrategias de almacenamiento convencionales.

Piense en la típica arquitectura de almacenamiento de datos de una empresa. Esos datos no están ordenados en un solo lugar. Están en una docena de islas diferentes por toda la organización, y envían una factura por cada ubicación. Aquí hay algo en las instalaciones. Aquí hay más en la nube. Hay duplicados en todas las geografías físicas. Cuanto más dinámica y amplia es una organización, más probable es que sus datos no estructurados estén dispersos por todas partes.

¿Qué puede hacer un director de informática?

Podrían centralizar todos sus datos. Esa es la forma tradicional: consolidar todo en una fuente central de verdad, poner barras de hierro en las ventanas y cerrar la puerta con llave. Pero los usuarios siguen necesitando esos datos, así que ahora están pidiendo a su infraestructura que haga un trabajo pesado con líneas de datos de alta velocidad, complejos mecanismos de bloqueo en la nube y un sistema de archivos global que se parece más a un ancla que a una lancha motora.

En cualquier caso, la solución NAS empresarial tradicional no consolida los datos no estructurados. Lo que hace es empeora. Deja a la gente haciendo copias de las copias de datos en ese punto. Tienen la copia de seguridad externa para protegerse contra la pérdida de datos y la corrupción y el ransomware, pero luego suelen tener una tercera copia más allá de eso en caso de que el centro de datos sea hackeado, comprometido o corrompido.

Independientemente de lo sofisticada que sea una solución de almacenamiento, la eficacia de los datos en un entorno de almacenamiento tradicional tiene un límite. Si son seguros, probablemente sean de difícil acceso y lentos de restaurar. Si es fácil acceder a los datos, probablemente no sean seguros. Todo un enigma.

Y ahora algo completamente diferente...

Panzura CloudFS permite a las organizaciones gestionar sus datos no estructurados sin problemas. Nuestro sistema de archivos basado en la nube proporciona un único punto de gestión para todos los datos no estructurados. Esto incluye los datos almacenados en múltiples sistemas y plataformas, incluidos los entornos locales, basados en la nube e híbridos.

Diseñamos CloudFS intencionadamente para reducir los costes de almacenamiento, mejorar la gestión de los datos y aumentar su seguridad. Cuando las empresas pueden organizar y analizar fácilmente sus montañas de datos no estructurados, resulta mucho más fácil extraer información valiosa y tomar decisiones basadas en datos.

Una de las claves de la capacidad de CloudFS para manejar datos no estructurados es la flexibilidad de las ubicaciones de almacenamiento híbridas: los usuarios pueden almacenar los datos en las instalaciones o en cualquier número de nubes. El lugar donde se almacenan los datos ya no es el factor determinante para acceder a ellos.

Y, debido a la seguridad inherente de un sistema de almacenamiento de datos inmutable, nuestro cifrado garantiza que el ransomware ya ni siquiera sea una amenaza. Simplemente restaura como si nunca hubiera ocurrido, sin perder ni un solo archivo ni perder horas, días y semanas navegando por el caos.

En última instancia, CloudFS ofrece un control sin precedentes de los datos no estructurados, protegiéndolos y facilitando a las empresas el cumplimiento de todas las normativas y estructuras de gobierno que deben abordar. El resultado es una solución de almacenamiento intuitiva y sin fisuras que gestiona los datos no estructurados desde la nube hasta el perímetro a un precio rentable. En pocas palabras, los clientes de Panzura saben dónde están sus datos, qué están haciendo y cómo utilizarlos, todo ello sin siquiera sudar la gota gorda.