Tiempo de lectura: 4 minutos

Es una noticia antigua que los datos no estructurados están creciendo a un ritmo considerable en comparación con cualquier otro tipo de datos.

Es lo que todos hacemos ahora: crear documentos. Hacer una copia y modificarla. Escanear archivos. Hacer fotos. Grabar cualquier cosa. Hacer un seguimiento de todo. Luego, hacer muchas (y muchas) copias por si alguna vez volvemos a necesitar ese documento.

No importa cómo sea la estructura de tu sistema de archivos, la gente tenderá a volcar los archivos donde sea conveniente, hacer copias, nuevas versiones, enviárselas por correo electrónico a los demás, hacer una nueva versión a partir de la enviada por correo electrónico, guardarla, retocarla y empezar de nuevo.

Esto no sólo ocurre dentro de un único sistema NAS local tradicional, sino en toda la empresa.

¿Cuántas veces crees que estás almacenando una versión del mismo archivo? ¿Haciendo una copia de seguridad? ¿Replicándolo a distancia? Las respuestas a estas preguntas suelen ser chocantes, al igual que el coste del simple almacenamiento de ese archivo.

Por ejemplo, una presentación de clientes en PowerPoint.

La presentación original pesa unos 10 MB. Es una presentación excelente, así que todo su equipo de ventas la adopta. Cada vez que la presentan a un posible cliente, toman una copia y modifican algunos detalles.

Cada vez, esa copia es entre un 95% y un 98% idéntica al original (y a todas las demás copias). Tal vez se intercambien el nombre y el logotipo del cliente. Algunos precios pueden variar. La diapositiva de requisitos puede ser diferente.

Sin embargo, el resultado es una multitud de presentaciones muy, muy similares, todas ellas ocupando unos 10MB de espacio de almacenamiento.

El equipo de TI hace una copia de seguridad diaria de todo ello y la almacena. Hacen más copias para almacenarlas fuera de las instalaciones.

La estimación de IDC para 2020 del impacto de este tipo de réplicas es de 1:9. Es decir, un original por cada 9 réplicas.

Eso significa que tu presentación original de 10MB está ocupando efectivamente más de 100MB en el almacenamiento total.

Eso no sólo crea un problema de almacenamiento

Eso es caro, pero mucho más impactante es el problema de gestión de datos que crea.

¿Con qué versión de archivo trabaja su personal? ¿Cómo sigue la evolución de ese archivo? ¿Con cuántas versiones ha acabado? ¿Alguien las utiliza ya?

¿Contienen esos archivos datos sensibles a los que sólo debe acceder un grupo restringido de usuarios? Si es así, ¿cómo se gestiona eso, y qué pasa si los archivos se mueven a un directorio con permisos más abiertos?

Las estadísticas muestran que el 90% de los datos no estructurados no se utilizan después de un año. Y, sin embargo, estos datos deben haber sido importantes -a menudo de forma crítica- para su empresa en algún momento.

Más allá del almacenamiento de datos, el valor de los mismos

La gente se comportará como lo hace la gente: creará y guardará archivos en cualquier lugar y en todas partes. Eso no lo vas a impedir, y nosotros tampoco.

Pero podemos permitirle domar sus datos... para detener la replicación fuera de control y la multitud de versiones de archivos que le dan tanto dolor de cabeza en la gestión de datos.

CloudFS puede desduplicar globalmente para que, en todos sus sitios, no esté almacenando el mismo archivo, o versión del mismo, una y otra vez. Si está ejecutando esa proporción de 1:9, hay un ahorro de almacenamiento de alrededor del 90%.

Como CloudFS es inmutable, no tienes que hacer una copia de seguridad de tus datos. Y si utilizas un almacén de objetos que se replica en 3 sentidos (piensa en AWS S3, Google GCS, Azure BLOB), entonces no necesitas replicarlo de forma remota.

Pero te damos la opción de hacer una "réplica en la nube" en caso de que no confíes en que mantengan tus datos disponibles siempre que los necesites.

Con los datos más controlados, hablemos de arrear a los usuarios.

Localizabilidad

Utilizando la plataforma de gestión de datos Panzura Data Services , puede buscar en CloudFS y en cualquier sistema SMB o NFS de terceros. La búsqueda en Data Services le permite encontrar archivos y, en el caso del sistema de terceros, ver cuántas veces los está almacenando, cuántos años tienen y cuándo se accedió a ellos por última vez.

Visibilidad

Data ServicesLa función de auditoría de CloudFS va mucho más allá de la búsqueda, ya que permite a los administradores ver las acciones de acceso, copia y movimiento, entre otras.

Piense en un caso de uso relacionado con el RGPD: ¿qué tan doloroso sería si le descubrieran copiando datos PII fuera de la EMEA a los Estados Unidos?

Data Services puede alertar al administrador, crear una pista de auditoría de quién miró el archivo, lo copió o lo movió.

Armado con esta información, puede autodenunciarse y demostrar que, aunque se ha producido una infracción técnica, no se ha producido ningún daño y esta filtración de datos no ha infringido el espíritu de la ley.

Dependiendo de su ubicación y de su industria, hay una serie de casos de uso para un registro de auditoría sustancial para la seguridad, la regulación, la retención legal, y muchos otros.

Alerta temprana

Ninguna solución de gestión de datos estaría completa sin utilizar su capacidad para rastrear las acciones de los archivos en tiempo real y reconocer comportamientos anómalos.

CloudFS es inmune al ransomware, por lo que el sistema de archivos en sí mismo no puede verse afectado... pero un aviso temprano de la actividad del ransomware puede ahorrar un valioso tiempo dedicado a identificar los archivos afectados y a recuperarlos utilizando instantáneas.

No pierdas de vista este espacio: Data Services tiene nuevas y emocionantes habilidades que llegarán muy pronto.

El almacenamiento se detiene en el espacio. La gestión de datos aporta valor.

Cuando el foco está en el almacenamiento de datos, no puede estar en el valor de los mismos. La rentabilidad del almacenamiento está ligada a la conservación de los volúmenes de datos, que es el mismo reto con el que luchan todas las organizaciones del planeta.

Con el increíble y continuo crecimiento de los datos no estructurados, nunca habrá suficiente espacio de almacenamiento, sólo decisiones difíciles sobre qué datos conservar y durante cuánto tiempo.

Cambiar el enfoque del almacenamiento de datos a la gestión de los mismos significa ampliar la lente para proteger y obtener valor de un activo, en lugar de consumir una mercancía y decidir qué datos son los que se pueden utilizar.

Esto, a su vez, le impulsa a encontrar formas de controlar el crecimiento innecesario de los datos, hacer que sea rápido y fácil encontrar todo lo que usted y su equipo necesitan, detectar y responder a las amenazas, observar cómo su gente utiliza sus datos y utilizar esas observaciones para desarrollar flujos de trabajo que predigan dónde se necesitarán los datos, y por quién, lograr el cumplimiento de la normativa e impulsar entornos de alto rendimiento potenciando la colaboración donde funciona.