sabato 26 novembre 2011

Dati e non solo


Da circa mezzo secolo uno degli obiettivi degli informatici è stato quello di organizzare, ordinare nonché memorizzare i dati nella maniera più idonea per essere modificati ma soprattutto per essere consultati.
Le basi dati (Database) sono diventate sempre più complesse ma soprattutto sono cresciute in quantità,  occupando spazi di memorizzazione sempre più grandi.  Questi sono  comunemente identificati  con i dischi che equipaggiano gli elaboratori.  Le unità di misura con cui sono stati misurati i volumi dei dati nel corso degli anni si sono evolute conseguentemente alla crecita e, mentre all’inizio l’unità di misura era il Megabyte (1 Milione di caratteri), oggi è sempre più comune l’uso del Petabyte. (1000 Megabytes= Gigabyte, 1000 Gigabyte = 1 Terabyte, 1000 Terabyte = 1 Petabyte; per calcolare il numero di caratteri basta fare la moltiplicazione ).
Questi tipi di Banche Dati sono quelle che supportano tutti i processi automatizzati all’interno di banche , assicurazioni e aziende di ogni genere e dimensioni, pubbliche e private.
Tutti i dati sono organizzati in unità logiche tra loro congruenti, e la ricerca è facilitata da altre strutture chiamate Indici, dove sulla base di chiavi di ricerca predefinite, vengono memorizzati i puntatori alle singole unità logiche (record).
Una simile organizzazione dei dati ha permesso di gestire in maniera controllata la crescita e l’ attendibilità dei dati, cruciale in molti casi per ciascuno di noi, basti pensare che così vengono gestiti i nostri conti correnti o le nostre informazioni sanitarie.
Conseguentemente  con l’avvento dei personal computer e di tutti quegli strumenti ausiliari alla produttività individuale (Word Processor per i testi, fogli elettronici, elaboratori di immagini, ecc..), nonché negli ultimi dieci anni alla crescente digitalizzazione del mondo che ci circonda (video, foto, segnali di controllo), le informazioni sono via via cresciute in maniera del tutto diversa dal mondo dei Database, ordinati e indicizzati.
Quest’ultimi sono definiti Dati Strutturati mentre le rimanenti informazioni (documenti, foto, ecc), che come vedremo tanto "rimanenti" non sono, vengono definiti Dati non Strutturati.
Ben presto lo spazio occupato dai Dati non Strutturati ha superato di gran lunga quanto occupato dai dati memorizzati nei Database, tanto che si stima, oggi, i Dati non Strutturati siano circa l’85 % del totale dell’informazione mondiale relegando al solo 15% la stima per i Dati Strutturati.
Per gestire questa nuova tipologia di informazioni sono nate così nuove tecnologie (gestioni documentali) che avevano l’obiettivo di controllare la crescita vorticosa. Anche queste soluzioni, pur mantenendo ancor oggi la loro validità, si sono rivelate incapaci di arginare il fenomeno .  In effetti non è possibile trattare e organizzare  i documenti come fossero dei record di un normale database e quando è possibile ciò è applicabile solo per un sottoinsieme di essi.
Oggi tutti i Dati non Strutturati sono lasciati dove si trovano. Quando sono accendibili via Internet possono essere catalogati e oggetto di ricerche attraverso i vari motori di ricerca che ne facilitano l’accesso e la fruibilità.
Facebook, i blog, la posta elettronica, i siti web 2.0, sono dei formidabili generatori di informazioni non strutturate che i motori di ricerca ci aiutano a setacciare. Ma il setaccio sembra non bastare più. Cercare e trovare, pur essendo un servizio utilissimo, non soddisfa più le necessità odierne e future.
Tutte queste informazioni che spesso contengono frasi , parole, dialoghi, immagini, video che veicolano spesso sentimenti, comportamenti e stati d’animo di milioni di persone, sono diventati appetibilissimi e oggetto di analisi sempre più raffinate.
Per elaborare queste quantità enormi di dati sono nati nuovi software e si stanno affinando nuove tecnologie di elaborazione, memorizzazione e ricerca. Questa nuova tipologia di dati non a caso è chiamata BIG Data.
I risultati di queste analisi probabilmente impatteranno  anche sulla vita di ciascuno di noi in quanto, sempre più, tutto ciò ce facciamo sarà veicolato attraverso la rete: dai pagamenti fino alle nostre chiacchierate via Skype o Facebook.  Viviamo e vivremo come se qualcuno ci stesse continuamente seguendo, annotando tutto ciò che facciamo.
Orwell non aveva previsto tutto in "1984 ".
Che ne sarà dei Dati Strutturati ? Qualcuno dirà prima o poi, quando le nuove tecnologie di memorizzazione saranno consolidate :
“Perchè non mescolare dati strutturati e non, usando la stessa tecnologia ? “
Così i Database e tutte quelle tecnologie che per più di 50 anni hanno contribuito a fare dell’informatica quasi una scienza esatta saranno definitamente messi da parte.

Nessun commento:

Posta un commento