Temps de lecture : 5 minutes

If Samuel Coleridge were writing the Rime of the Future Data Analyst, it would go something like, “Data, data everywhere, nor a byte to process…” or something like that.

Pour tous les enfants cool qui ne sont pas tombés amoureux de la littérature anglaise, l'idée est simple : nous sommes entourés de plus de données que jamais, mais il est de plus en plus difficile de les gérer, d'y accéder et de les utiliser - en particulier les données non structurées.

Les volumes de données continuent de croître de manière exponentielle. Et si le coût de l'infrastructure de stockage diminue grâce aux progrès technologiques, le coût réel du stockage des données continue d'augmenter en raison de la quantité de données que nous traitons aujourd'hui. Et si la stratégie traditionnelle de stockage en trois exemplaires ne suffit pas à répondre aux besoins de stockage, les données se multiplient elles-mêmes, ce qui ne fait qu'aggraver la situation.

Que faire ? La réponse se trouve dans le nuage - Panzura's CloudFS, pour être plus précis. Décortiquons le défi des données, passons en revue certaines stratégies d'atténuation courantes qui ne fonctionnent pas et voyons ce que CloudFS fait différemment pour maîtriser le problème des données non structurées d'aujourd'hui.

D'où proviennent toutes ces données ?

According to a recent IDC report, unstructured data is growing at 40% per year, six times faster than structured data. And that’s a best-case scenario considering that every time analysts predict data growth, they get it wrong. It’s always much, much more. Why? Data makes data makes data,ad infinitum.

Pensez à l'analyse : une entreprise qui fonctionne depuis 30 ans a produit beaucoup de données. Mais lorsqu'elle les analyse, elle génère une intelligence économique puissante. Elle crée également de nouvelles données en plus de celles qu'elle possède déjà.

Un examen plus approfondi de n'importe quel secteur vertical en apporte la preuve. Les soins de santé disposent de la télémétrie et des données biologiques des patients. L'industrie manufacturière dispose de l'identification par radiofréquence (RFID) et de la surveillance de l'internet des objets (IoT) dans chaque usine, chaque camion et chaque magasin. Les applications de médias sociaux ne sont rien d'autre que des données non structurées. Même l'algorithme de reconnaissance faciale des sonnettes de porte alimentées par wi-fi crée des données chaque fois qu'il analyse une séquence vidéo.

Travailler avec des données non structurées est un défi.

Si les données non structurées sont le feu de poubelle qui illumine les cauchemars de tous les responsables informatiques, il est important de comprendre ce qui en fait un problème aussi chaotique.

For starters, it’s unstructured. Duh. There’s no particular organizational scheme to try to understand it. It’s a puzzle without a box and an unknown number of pieces. It’s a firehose of information and most companies are trying to filter it with a drinking straw.

De plus, il n'y a pas de limite au type de données avec lesquelles les responsables informatiques doivent travailler. Les options vont du texte et des images à l'audio et à la vidéo. C'est comme essayer de lire un livre en langue étrangère les yeux bandés. Impossible.

La gestion des données non structurées est un cauchemar.

Les données non structurées sont un véritable cauchemar. Imaginez une pièce remplie d'enfants indisciplinés, sous l'emprise du sucre. Votre travail consiste à leur faire respecter les règles, à les faire jouer gentiment les uns avec les autres et à ne rien casser. Si vous êtes responsable informatique, vous ne vous occupez pas d'enfants, mais de téraoctets de données.

Le stockage est l'un des principaux problèmes liés à la gestion des données non structurées : il n'y en a jamais assez. Dès qu'une organisation rattrape son retard, le rocher dévale la colline et il faut recommencer à le pousser.

Et la plus grande cause de maux informatiques ? La gouvernance des données. Les cybercriminels veulent mettre la main sur les données, en particulier les données non structurées. Si elles sont divulguées, les responsables de la sécurité des données pourraient tout aussi bien essayer de remettre du dentifrice dans le tube. Bonne chance. Conformité réglementaire ? Comment les entreprises peuvent-elles s'y tenir lorsqu'elles ne sont pas sûres de ce qu'elles possèdent ?

Le stockage de données non structurées devient de plus en plus coûteux.

Le stockage des données non structurées est un train en marche qu'il est impossible d'arrêter. Après avoir pris en compte le coût de l'infrastructure de stockage, il faut se rappeler que tout cela doit être sauvegardé, archivé et sécurisé. C'est un peu comme entretenir une flotte de Ferrari - vous pouvez faire en sorte que tout fonctionne bien, mais le coût (et le stress) font qu'il est peu probable que vous ayez un jour le plaisir d'en conduire une.

La difficulté ne réside pas seulement dans le chaos inhérent aux données non structurées - n'oubliez pas qu'elles n'ont ni rime ni raison, ni classification, ni hiérarchie catégorielle - mais aussi dans le fait que les entreprises doivent naviguer dans un écosystème vivant d'informations dont les membres de l'organisation ont besoin.

That means performance, speed of access, and availability are all critical paths in an effective storage plan. Can people get the data they need when they need it? How slow is fast enough? These are thorny questions for an IT manager facing a vast lake of unstructured data and only conventional storage strategies in hand.

Prenons l'exemple d'une architecture de stockage de données d'entreprise classique. Ces données ne sont pas stockées au même endroit. Elles se trouvent sur une douzaine d'îlots différents à travers l'organisation, et elles envoient une facture pour chaque emplacement. Il y a des données sur site. Il y en a d'autres dans le nuage. Il y a des doublons dans les différentes zones géographiques. Plus une organisation est dynamique et étendue, plus il est probable que ses données non structurées soient dispersées partout.

Que doit faire un responsable informatique ?

Ils pourraient centraliser toutes leurs données. C'est la méthode traditionnelle : tout regrouper en une source centrale de vérité, mettre des barres de fer aux fenêtres et verrouiller la porte. Mais les utilisateurs ont toujours besoin de ces données, alors ils demandent à leur infrastructure de faire le gros dos avec des lignes de données à haut débit, des mécanismes complexes de verrouillage des nuages et un système de fichiers global qui ressemble plus à une ancre qu'à un bateau à grande vitesse.

The traditional enterprise NAS solution doesn’t consolidate unstructured data, anyway. It makes the problem worse. It leaves people making copies of the copies of data at that point. They have the offsite backup copy to protect against data loss and corruption and ransomware, but then they typically have a third copy beyond that in case the data center gets hacked, compromised, or corrupted.

Quelle que soit la sophistication d'une solution de stockage, il y a une limite à l'efficacité des données dans un environnement de stockage traditionnel. Si elles sont sécurisées, elles sont probablement difficiles d'accès et lentes à restaurer. S'il est facile d'accéder aux données, elles ne sont probablement pas sécurisées. Une véritable énigme.

Shift the balance of power in the fight against ransomware.

Panzura-datasheet-Detect-and-rescue-header-min (1)

Et maintenant, quelque chose de complètement différent ...

Panzura CloudFS empowers organizations to manage their unstructured data seamlessly. Our cloud-based file system provides a single point of management for all unstructured data. This includes data stored across multiple systems and platforms, including on-premises, cloud-based, and hybrid environments.

Nous avons conçu CloudFS dans le but de réduire les coûts de stockage, d'améliorer la gestion et la sécurité des données. Lorsque les entreprises peuvent facilement organiser et analyser leurs montagnes de données non structurées, il devient beaucoup plus facile d'extraire des informations précieuses et de prendre des décisions basées sur les données.

L'une des clés de la capacité de CloudFS à gérer les données non structurées est la flexibilité des emplacements de stockage hybrides - les utilisateurs peuvent stocker des données sur site ou dans n'importe quel nuage. L'endroit où se trouvent les données n'est plus le facteur déterminant de la manière dont on y accède.

De plus, grâce à la sécurité inhérente à un système de stockage de données immuable, notre cryptage garantit que les ransomwares ne constituent même plus une menace. Il suffit de restaurer comme si rien ne s'était passé, sans perdre un seul fichier ni perdre des heures, des jours et des semaines à naviguer dans le chaos.

En fin de compte, CloudFS offre un contrôle inégalé des données non structurées, les sécurise et permet aux entreprises de se conformer facilement à toutes les réglementations et structures de gouvernance dont elles ont besoin. Le résultat est une solution de stockage intuitive et transparente qui gère les données non structurées depuis le nuage jusqu'à la périphérie, à un prix rentable. En d'autres termes, les clients de Panzura savent où se trouvent leurs données, ce qu'elles font et comment les utiliser, le tout sans le moindre effort.