La corsa all’accaparramento di dati ha portato le aziende (e non solo) ad ampliare al massimo la propria capacità di raccolta ed archiviazione, ma senza la necessaria distinzione tra “dati utili” e “dati inutili”.
Molti di questi, infatti, non sono utilizzabili da un’organizzazione per ricavare informazioni vantaggiose, per prendere decisioni e sfruttare opportunità.
In questo caso parliamo di “dark data”, dati in eccesso rispetto alle reali possibilità di analisi e gestione dell’azienda che ne è in possesso.
Archiviare dati privi di valore effettivo significa occupare spazio, che invece potrebbe essere liberato per altri dati molto più preziosi, consumare energia e far lievitare i costi di gestione.
I dark data costano e inquinano
Gli analisti di Veritas stimano che la quantità di dati generati nel mondo passerà dai 33 ZB del 2018 a 175 ZB entro il 20253.
Considerando che in media più del 50% di tutti i dati memorizzati dalle organizzazioni mondiali sia “dark”, si potrebbe raggiungere in pochi anni un livello di 91 ZB di dark data, quattro volte il volume attuale.
A livello di infrastrutture, invece, il peso dei dark data sui data center è valutabile come costo economico e in emissioni di biossido di carbonio (CO2).
Secondo il “Global Databerg Report”, considerando anche che il 33% dei dati è “ridondante”, i costi impliciti nell’archiviazione e gestione dei dark data sarà pari a 3.300 miliardi di dollari entro la fine del 2020.
In termini di impatto ambientale, invece, tale attività di storage & management implicherà l’emissione in atmosfera di circa 5,8 milioni di tonnellate di CO2.
Azioni da compiere
Per evitare questa deriva economica e ambientale, la cosa migliore sarebbe approfondire la conoscenza dei dati che si archiviano. Accumulare dati è facile e il cloud storage in fondo è piuttosto economico.
Il problema è che la maggioranza di questi dati non sarà più accessibile (nel tempo si dimentica il come e il perché si sono accumulati), rimanendo un costo.
Accumulare enormi quantità di dati non significa automaticamente ottenere un vantaggio competitivo rispetto ai competitor, ma sicuramente aumenterà costi, inquinamento e rischi.
Secondo gli esperti, bisogna ridurre la quantità di dati archiviati e stabilire priorità: il valore di un dato conservato deve essere direttamente correlato allo scopo per cui è stato raccolto.
Le aziende, inoltre, dovrebbero essere capaci di rendere visibili i dark data e allo stesso tempo di conoscere i propri archivi.
Azioni come il data mapping e data discovery possono aiutare a capire meglio dove sono i dati e a che tipo di informazioni sono correlati.