Da circa mezzo secolo uno degli obiettivi degli informatici
è stato quello di organizzare, ordinare nonché memorizzare i dati nella maniera
più idonea per essere modificati ma soprattutto per essere consultati.
Le basi dati (Database) sono diventate sempre più complesse
ma soprattutto sono cresciute in quantità,
occupando spazi di memorizzazione sempre più grandi. Questi sono comunemente identificati con i dischi che equipaggiano gli
elaboratori. Le unità di misura con cui
sono stati misurati i volumi dei dati nel corso degli anni si sono evolute conseguentemente
alla crecita e, mentre all’inizio l’unità di misura era il Megabyte (1 Milione
di caratteri), oggi è sempre più comune l’uso del Petabyte. (1000 Megabytes=
Gigabyte, 1000 Gigabyte = 1 Terabyte, 1000 Terabyte = 1 Petabyte; per calcolare
il numero di caratteri basta fare la moltiplicazione ).
Questi tipi di Banche Dati sono quelle che supportano tutti i
processi automatizzati all’interno di banche , assicurazioni e aziende di ogni genere
e dimensioni, pubbliche e private.
Tutti i dati sono organizzati in unità logiche tra loro congruenti,
e la ricerca è facilitata da altre strutture chiamate Indici, dove sulla base
di chiavi di ricerca predefinite, vengono memorizzati i puntatori alle singole
unità logiche (record).
Una simile organizzazione dei dati ha permesso di gestire in
maniera controllata la crescita e l’ attendibilità dei dati, cruciale in molti
casi per ciascuno di noi, basti pensare che così vengono gestiti i nostri conti
correnti o le nostre informazioni sanitarie.
Conseguentemente con
l’avvento dei personal computer e di tutti quegli strumenti ausiliari alla
produttività individuale (Word Processor per i testi, fogli elettronici,
elaboratori di immagini, ecc..), nonché negli ultimi dieci anni alla crescente
digitalizzazione del mondo che ci circonda (video, foto, segnali di controllo),
le informazioni sono via via cresciute in maniera del tutto diversa dal mondo dei
Database, ordinati e indicizzati.
Quest’ultimi sono definiti Dati Strutturati mentre le rimanenti informazioni (documenti, foto, ecc), che come vedremo tanto "rimanenti" non sono, vengono definiti Dati non Strutturati.
Ben presto lo spazio occupato dai Dati non Strutturati ha
superato di gran lunga quanto occupato dai dati memorizzati nei Database, tanto
che si stima, oggi, i Dati non Strutturati siano circa l’85 % del totale
dell’informazione mondiale relegando al solo 15% la stima per i Dati Strutturati.
Per gestire questa nuova tipologia di informazioni sono nate
così nuove tecnologie (gestioni documentali) che avevano l’obiettivo di
controllare la crescita vorticosa. Anche queste soluzioni, pur mantenendo ancor oggi
la loro validità, si sono rivelate incapaci di arginare il fenomeno . In effetti non è possibile trattare e
organizzare i documenti come fossero dei
record di un normale database e quando è possibile ciò è applicabile solo per
un sottoinsieme di essi.
Oggi tutti i Dati non Strutturati sono lasciati dove si
trovano. Quando sono accendibili via Internet possono essere catalogati e oggetto
di ricerche attraverso i vari motori di ricerca che ne facilitano l’accesso e
la fruibilità.
Facebook, i blog, la posta elettronica, i siti web 2.0, sono
dei formidabili generatori di informazioni non strutturate che i motori di
ricerca ci aiutano a setacciare. Ma il setaccio sembra non bastare più. Cercare
e trovare, pur essendo un servizio utilissimo, non soddisfa più le necessità
odierne e future.
Tutte queste informazioni che spesso contengono frasi ,
parole, dialoghi, immagini, video che veicolano spesso sentimenti,
comportamenti e stati d’animo di milioni di persone, sono diventati
appetibilissimi e oggetto di analisi sempre più raffinate.
Per elaborare queste quantità enormi di dati sono nati nuovi
software e si stanno affinando nuove tecnologie di elaborazione, memorizzazione
e ricerca. Questa nuova tipologia di dati non a caso è chiamata BIG Data.
I risultati di queste analisi probabilmente impatteranno anche sulla vita di ciascuno di noi in quanto,
sempre più, tutto ciò ce facciamo sarà veicolato attraverso la rete: dai
pagamenti fino alle nostre chiacchierate via Skype o Facebook. Viviamo e vivremo come se qualcuno ci stesse continuamente
seguendo, annotando tutto ciò che facciamo.
Orwell non aveva previsto tutto in "1984 ".
Che ne sarà dei Dati Strutturati ? Qualcuno dirà prima o poi,
quando le nuove tecnologie di memorizzazione saranno consolidate :
“Perchè non mescolare dati strutturati e non, usando la stessa tecnologia ? “
Così i Database e tutte quelle tecnologie che per più di 50
anni hanno contribuito a fare dell’informatica quasi una scienza esatta saranno
definitamente messi da parte.
Nessun commento:
Posta un commento