Categorie
Guide News

Gestione di dati non strutturati, l’era degli archivi ad oggetti

In questo periodo l’appellativo di Big data viene utilizzato per qualsiasi cosa abbia a che fare con lo storage, in questo modo però la gente continua a non capire esattamente a cosa si riferisca tale termine tecnicamente. C’entra con Hadoop? C’entra anche con le Analytics? Per fare chiarezza sull’argomento è necessario suddividere i Grandi Archivi Dati in due tipologie ben distinte: Big Data per analytics e Big Unstructured Data.

I grandi archivi dati per eseguire analisi statistiche sono diventati un paradigma popolare nella scorsa decade, ed anche grazie a questi molti progetti di ricerca sono riusciti ad innovare. Questa nuova tecnologia ha permesso ai ricercatori di qualsiasi campo di studio di catturare dati in quantità elevatissime e con una facilità che prima non era possibile. Si pensi ad un qualsiasi ambito applicativo in cui vengano installati dei sensori che catturano costantemente informazioni su un’attività inviate ad una piattaforma di analisi ed interrogate per discernere informazioni. Dall’agricoltura, all’amministrazione, al campo medico tutte le discipline hanno usufruito fortemente di queste innovazioni.

Da qui però nasceva il problema di far evolvere i tradizionali sistemi di memorizzazione di grandi quantità di dati in tecnologie di database diverse da quella relazionale, che diventava ogni giorno di più obsoleta. Sistemi come MapReduce e Hadoop sono stati allora creati come un’alternativa al modello relazionale ed hanno reso possibile archiviare queste massicce quantità di dati come grandi file concatenati. Era nato il fenomeno del Big Data per dati semi-strutturati.

Oggi stiamo assistendo ad un trend simile per i dati non strutturati. Gli studi mostrano che i requisiti del data storage cresceranno di 30 volte tanto durante la prossima decade. L’80 per cento di questi dati sono file di grandi dimensioni: documenti d’ufficio, film, musica, immagini. In maniera simile a come i database si sono evoluti nello scorso decennio, i file system devono ora evolversi in quanto non sono più il miglior modo per archiviare questi dati. Non sono in grado di scalare sufficientemente e stanno diventando obsoleti.

Lascia un commento