Quanto valgono i big data? Da quando l’Economist ha annunciato che i dati sono diventati la “risorsa più preziosa nel mondo”, sorpassando nella scala di valore anche il petrolio, le indicazioni della loro importanza non hanno fatto che moltiplicarsi. Dalle leggi varate per regolarne l’utilizzo agli scandali riguardanti la loro mal gestione, passando per il loro massiccio impiego negli ambiti più disparati, i big data sono ormai al centro del dibattito pubblico e sempre più presenti nei piani di razionalizzazione e ottimizzazione delle imprese.
Non è una sorpresa, quindi, che sempre più aziende abbiano iniziato a conservare enormi quantità di dati. Che ad essere accumulate siano informazioni sui clienti, sul ciclo produttivo o sulle vendite, è facile trovarsi a dover gestire flussi di informazioni costanti e non sempre ordinati, arrivando in alcuni casi a database smisurati e impenetrabili, dove il valore stesso dei dati viene sepolto: i famigerati “Data Graveyards”, o cimiteri di dati.
Che cos’è un “Data Graveyard”
“Data Graveyard” è un termine che si applica a database potenzialmente molto diversi tra loro, ma accomunati da modalità di acquisizione, archiviazione e analisi (o mancata analisi) dei dati non sostenibili sul lungo periodo.
I cimiteri di dati possono avere varie forme, ma alcune criticità sono più ricorrenti:
- La presenza di dati inutili o duplicati causa un’estensione del database che non solo influisce negativamente sui costi di storage e di gestione, ma incrementa anche proporzionalmente il rischio di falle nella sicurezza e attacchi hacker.
- Dati dello stesso tipo inseriti però con formule eterogenee e database privi di una grammatica condivisa rendono impossibile un’analisi unitaria dei dati e privano l’azienda di un’importante visione d’insieme su tutti i dati a disposizione.
- Processi di archiviazione sprovvisti di sistemi efficaci di eliminazione dati o tutela della privacy dei dati personali esistono in violazione delle norme imposte dal GDPR, esponendo l’azienda a sanzioni che possono arrivare fino a 20 milioni di euro (o il 4% del fatturato annuale dell’azienda, in base a quale cifra è più alta).
Data Graveyards: un rischio reale per le aziende
Un Data Graveyard costituisce per un’azienda non solo un’occasione sprecata, ma un rischio concreto per la sua reputazione e la sua sicurezza, come hanno più volte dimostrato i fatti di cronaca.
Il caso di “Data Graveyard” più eclatante in Europa risale al 2019, quando l’Autorità tedesca per la protezione dei dati ha multato il gruppo immobiliare Deutsche Wohnen per una violazione del GDPR. La sanzione – della somma di 14,5 milioni di euro – è stata imposta per due trasgressioni: le modalità illecite di archiviazione ed elaborazione di dati sensibili, conservati dall’azienda senza alcun riguardo per le necessarie procedure di eliminazione dei dati degli ex utenti, e l’assenza di un sistema informativo sicuro e progettato per tutelare la privacy.
Avere una grande quantità di dati non necessari aumenta inoltre la vulnerabilità degli archivi in cui sono conservati, e il rischio di gravi violazioni di sicurezza è tanto più alto quanto meno saldamente i database sono governabili. Nel 2018 la catena di hotel Marriott International impiegò mesi per stimare l’entità di un data breach in corso da quattro anni, che coinvolgeva (al netto di tutti i duplicati) un totale di 383 milioni di dati personali comprendenti password, indirizzi mail, date di arrivo e di partenza e numeri di passaporto degli ospiti degli hotel della catena. L’assenza di una infrastruttura informatica progettata per individuare tempestivamente le anomalie è stato uno dei fattori principali che ha portato Marriott International a dover pagare la salata multa di 100 milioni di sterline.
Il tesoro sepolto nei Data Graveyards
Ma allora quanto sono preziosi i big data? La risposta più semplice include una postilla: i dati hanno un altissimo valore per un’azienda, ma solo se trattati in modo virtuoso. La creazione di Data Graveyards espone a rischi concreti, ma un intervento calcolato e incisivo può trasformare un cimitero di dati in un vantaggio competitivo per l’azienda.
La differenza tra i dati che costituiscono un rischio e i dati da cui si può estrarre valore è essenzialmente una questione di Data Quality. Sono infatti i dati uniformi e raccolti con metodi univoci a poter essere studiati, ed è dalla analisi dei dati che i big player arrivano alle conclusioni che guideranno la strategia dell’azienda e, in ultima istanza, ne accresceranno il fatturato.
La trasformazione di un database da Data Graveyard a fonte di spunti per la crescita richiede soluzioni dedicate al caso specifico, lungo un percorso con delle tappe fisse:
- La prima fase è quella di assessment: vengono individuati e studiati i metodi di acquisizione dei dati, i luoghi in cui sono conservati e la forma degli stessi.
- Si procede con la diagnosi delle debolezze, si definisce un perimetro di intervento e un approccio operativo.
- Si effettua una bonifica di tutti i dati a disposizione e contenuti nel perimetro di intervento, deduplicando i dati e uniformandoli a uno standard univoco.
- Infine, si procede a implementare sistemi di archiviazione che uniformino fin dall’acquisizione i dati allo standard stabilito, rendendoli così più facilmente accessibili. Un’operazione indispensabile per adeguarsi ai regolamenti in materia di trattamento dati e, infine, per permettere l’utilizzo degli strumenti di analisi che rileveranno trend e spunti utili a eliminare gli sprechi e ottimizzare la strategia dell’azienda: un vantaggio concreto sulla concorrenza, e il vero tesoro da riscoprire nei Data Graveyards.