Cómo domar los datos no estructurados

By Panzura | Mayo 10, 2023

5 leer en un minuto

Tiempo de lectura: 5 minutos

If Samuel Coleridge were writing the Rime of the Future Data Analyst, it would go something like, “Data, data everywhere, nor a byte to process…” or something like that.

Para todos los chicos guays que no se enamoraron de la literatura inglesa, la cuestión es sencilla: estamos rodeados de más datos que nunca, pero cada vez es más difícil gestionarlos, acceder a ellos y utilizarlos, especialmente los datos no estructurados.

Los volúmenes de datos siguen creciendo exponencialmente. Y, aunque el coste de la infraestructura de almacenamiento está disminuyendo con los avances tecnológicos, el coste real del almacenamiento de datos sigue aumentando debido a la enorme cantidad de datos que manejamos hoy en día. Y si la estrategia tradicional de almacenamiento por triplicado no cubre las necesidades de almacenamiento lo suficiente por sí sola, los datos incluso están aumentando sus propios datos para acelerar el predicamento.

¿Qué hay que hacer? La respuesta se encuentra en la nube, concretamente en CloudFS de Panzura. Analicemos el reto de los datos, repasemos algunas estrategias de mitigación habituales que no funcionan y veamos qué hace CloudFS de forma diferente para controlar la difícil situación actual de los datos no estructurados.

¿De dónde proceden todos estos datos?

According to a recent IDC report, unstructured data is growing at 40% per year, six times faster than structured data. And that’s a best-case scenario considering that every time analysts predict data growth, they get it wrong. It’s always much, much more. Why? Data makes data makes data,ad infinitum.

Piense en el análisis: una empresa que lleva 30 años funcionando ha generado muchos datos. Pero, cuando los analizan, generan una potente inteligencia empresarial. También están creando más datos además de los que ya tienen.

Cualquier sector vertical lo demuestra. La sanidad tiene telemetría y datos biológicos de los pacientes. En la industria manufacturera, la identificación por radiofrecuencia (RFID) y el Internet de las cosas (IoT) están presentes en todas las plantas, camiones y almacenes. Las aplicaciones de las redes sociales no son otra cosa que datos no estructurados. Incluso el algoritmo de reconocimiento facial de los timbres wi-fi genera datos cada vez que analiza imágenes de vídeo.

Trabajar con datos no estructurados es todo un reto.

Si los datos no estructurados son el basurero que enciende las pesadillas de todos los responsables de TI, es importante entender qué los convierte en un problema tan caótico.

For starters, it’s unstructured. Duh. There’s no particular organizational scheme to try to understand it. It’s a puzzle without a box and an unknown number of pieces. It’s a firehose of information and most companies are trying to filter it with a drinking straw.

Además, no hay límites para el tipo de datos con los que tienen que trabajar los responsables de TI. Las opciones van desde texto e imágenes hasta audio y vídeo. Es como intentar leer un libro en otro idioma con los ojos vendados. Imposible.

Gestionar datos no estructurados es una pesadilla.

Los datos no estructurados son una pesadilla. Imagínese una habitación llena de niños revoltosos y borrachos de azúcar. Tu trabajo consiste en hacer que sigan las normas, que jueguen bien entre ellos y que no rompan nada. Si usted es responsable de TI, no tiene que lidiar con niños, sino con terabytes de datos.

El almacenamiento es uno de los principales quebraderos de cabeza de la gestión de datos no estructurados: nunca hay suficiente. En cuanto una organización se pone al día, la roca rueda colina abajo y tiene que empezar a empujarla de nuevo.

¿Y la principal causa de dolor informático? La gobernanza de los datos. Los ciberdelincuentes quieren hacerse con los datos, sobre todo con los no estructurados. Si salen a la luz, los responsables de la seguridad de los datos podrían intentar volver a meter la pasta de dientes en el tubo. Buena suerte. ¿Cumplimiento de la normativa? ¿Cómo lo mantienen las empresas cuando ni siquiera están seguras de lo que tienen?

El almacenamiento de datos no estructurados es cada vez más caro.

El almacenamiento de datos no estructurados es un tren desbocado que no se puede parar. Después de tener en cuenta el coste de la infraestructura de almacenamiento, recuerda que hay que hacer copias de seguridad, archivar y proteger todo. Es como mantener una flota de Ferraris: puede que consigas que todo funcione sin problemas, pero el coste (y el estrés) hacen que sea poco probable que disfrutes conduciendo uno.

Parte de la dificultad no estriba únicamente en el caos inherente a los datos no estructurados -recordemos que carecen de lógica, clasificación o jerarquía categórica-, sino que las empresas también tienen que navegar por un ecosistema vivo y dinámico de información que las personas de la organización necesitan.

That means performance, speed of access, and availability are all critical paths in an effective storage plan. Can people get the data they need when they need it? How slow is fast enough? These are thorny questions for an IT manager facing a vast lake of unstructured data and only conventional storage strategies in hand.

Piense en la típica arquitectura de almacenamiento de datos de una empresa. Esos datos no están ordenados en un solo lugar. Están en una docena de islas diferentes por toda la organización, y envían una factura por cada ubicación. Aquí hay algo en las instalaciones. Aquí hay más en la nube. Hay duplicados en todas las geografías físicas. Cuanto más dinámica y amplia es una organización, más probable es que sus datos no estructurados estén dispersos por todas partes.

¿Qué puede hacer un director de informática?

Podrían centralizar todos sus datos. Esa es la forma tradicional: consolidar todo en una fuente central de verdad, poner barras de hierro en las ventanas y cerrar la puerta con llave. Pero los usuarios siguen necesitando esos datos, así que ahora están pidiendo a su infraestructura que haga un trabajo pesado con líneas de datos de alta velocidad, complejos mecanismos de bloqueo en la nube y un sistema de archivos global que se parece más a un ancla que a una lancha motora.

The traditional enterprise NAS solution doesn’t consolidate unstructured data, anyway. It makes the problem worse. It leaves people making copies of the copies of data at that point. They have the offsite backup copy to protect against data loss and corruption and ransomware, but then they typically have a third copy beyond that in case the data center gets hacked, compromised, or corrupted.

Independientemente de lo sofisticada que sea una solución de almacenamiento, la eficacia de los datos en un entorno de almacenamiento tradicional tiene un límite. Si son seguros, probablemente sean de difícil acceso y lentos de restaurar. Si es fácil acceder a los datos, probablemente no sean seguros. Todo un enigma.

Shift the balance of power in the fight against ransomware.

Descargar el Libro Blanco

Panzura-datasheet-Detect-and-rescue-header-min (1)

Y ahora algo completamente diferente...

Panzura CloudFS empowers organizations to manage their unstructured data seamlessly. Our cloud-based file system provides a single point of management for all unstructured data. This includes data stored across multiple systems and platforms, including on-premises, cloud-based, and hybrid environments.

Diseñamos CloudFS intencionadamente para reducir los costes de almacenamiento, mejorar la gestión de los datos y aumentar su seguridad. Cuando las empresas pueden organizar y analizar fácilmente sus montañas de datos no estructurados, resulta mucho más fácil extraer información valiosa y tomar decisiones basadas en datos.

Una de las claves de la capacidad de CloudFS para manejar datos no estructurados es la flexibilidad de las ubicaciones de almacenamiento híbridas: los usuarios pueden almacenar los datos en las instalaciones o en cualquier número de nubes. El lugar donde se almacenan los datos ya no es el factor determinante para acceder a ellos.

Y, debido a la seguridad inherente de un sistema de almacenamiento de datos inmutable, nuestro cifrado garantiza que el ransomware ya ni siquiera sea una amenaza. Simplemente restaura como si nunca hubiera ocurrido, sin perder ni un solo archivo ni perder horas, días y semanas navegando por el caos.

En última instancia, CloudFS ofrece un control sin precedentes de los datos no estructurados, protegiéndolos y facilitando a las empresas el cumplimiento de todas las normativas y estructuras de gobierno que deben abordar. El resultado es una solución de almacenamiento intuitiva y sin fisuras que gestiona los datos no estructurados desde la nube hasta el perímetro a un precio rentable. En pocas palabras, los clientes de Panzura saben dónde están sus datos, qué están haciendo y cómo utilizarlos, todo ello sin siquiera sudar la gota gorda.

Discover why modern data leaders prefer the Panzura Data Management Platform

Discover why modern data leaders prefer the Panzura Data Management Platform

Cómo domar los datos no estructurados

Reciba noticias del sector, actualizaciones de Panzura y mucho más.

Shift the balance of power in the fight against ransomware.

Hablemos de cómo podemos transformar su negocio y ahorrarle dinero. Mucho dinero.

Discover why modern data leaders prefer the Panzura Data Management Platform

Discover why modern data leaders prefer the Panzura Data Management Platform

Reciba noticias del sector, actualizaciones de Panzura y mucho más.

Shift the balance of power in the fight against ransomware.

Recursos relacionados

Cutting Through the Hype – Hybrid Cloud Storage is Coming of Age

Stop ransomware attacks before they take hold

Panzura CloudFS named a “Top 5 Enterprise Cloud-based NAS Consolidation Solution” by DCIG

Hablemos de cómo podemos transformar su negocio y ahorrarle dinero. Mucho dinero.