Big Data: sono un bene o un male?

Parlare di big data con cognizione di causa non è semplice, dal mio punto di vista. Si tratta di un termine ormai inflazionato ma che talvolta è difficile comprendere che implicazioni possa veramente avere sulla vita delle persone. In questo articolo cercherò di dare qualche spunto sull'argomento e poi ovviamente ognuno potrà avere un'opinione diversa! 

Cosa sono i big data? 

Parlare di big data significa riferirsi ad un ampio volume di dati che un'azienda raccoglie a proposito dei suoi utenti. Ci sono tutti quei dati sensibili che a volte rilasciamo ad un ente, come per esempio dati anagrafici, risposte a dei questionari per l'analisi delle nostre abitudini, ecc. E poi ci sono tutti quelli che vengono chiamati metadati, importanti sopratutto nel panorama di internet, che si riferiscono alle informazioni che la piattaforma web raccoglie in merito al nostro comportamento al suo interno (quanto tempo trascorriamo in una sezione del sito, quali click lasciamo, cosa condividiamo, ecc.). I metadati sono una fonte di conoscenza dell'utente talvolta molto più approfondita dei dati stessi, in quanto rivelano in modo più indiretto gusti e preferenze dello user. 

Doug Laney, analista di settore, nei primi anni 2000 formula la ormai nota definizione delle tre V dei big data:

  • Volume. Le organizzazioni raccolgono dati da una grande varietà di sorgenti, incluse transazioni finanziarie, social media, sensori o machine-to-machine. In passato lo storage sarebbe stato un problema, ma le nuove tecnologie ci facilitano il compito. 
  • Velocità. I dati fluiscono ad una velocità senza precedenti e vanno perciò gestiti in maniera tempestiva, da qui la necessità di gestire fiumi di dati in tempo reale o quasi.
  • Varietà. I dati arrivano in qualsiasi tipo di formato - da dati strutturati e numerici in database tradizionali a non strutturati come: documenti di testo, email, video, e audio.

Sono un bene o un male i big data?

Ovviamente la raccolta di questi dati e informazioni è strettamente correlata con la protezione della privacy in quanto un'azienda che raccoglie dati e metadati su di noi, dovrà avere poi il nostro consenso per poterli utilizzare. 

The Economist della settimana scorsa ho trovato un articolo interessante su questo argomento in cui si parla dei pro e dei contro dell'internet che conosciamo oggi. Un punto interessante che l'autore spiega è la distinzione dei due approcci principali che si trovano oggi nella comunità intellettuale: chi è a favore e chi è contro la raccolta dei big data. La scelta di stare più da un altro o dall'altro è dettata anche dal tipo di rete web che si vorrebbe avere: centralizzata o decentralizzata. Mi spiego meglio.

Il primo approccio, definito quello di Thomas Jefferson uno dei padri fondatori dell'America, vede la centralizzazione del web come un pericolo. Centralizzare significa avere pochi grandi colossi che accentrano in loro il potere raccogliendo le informazioni di molti. In effetti è ciò che sta accadendo oggi: ci sono Google, Facebook, Amazon e pochi altri che governano il panorama di internet offrendo servizi a milioni di persone e quindi il potere è centralizzato nelle mani di pochi. Il timore di chi la pensa così è che questa modalità dia meno spazio all'innovazione, alla crescita di nuove idee e prassi in quanto ci si trova a operare in un territorio in cui ci sono rigide regole del gioco stabilite dai colossi. 

Il secondo approccio, che prende spunto dalle idee di Alexander Hamilton, un altro padre fondatore dell'America, vede nella centralizzazione l'opportunità della crescita. Potendo raccogliere tanti dati nelle mani di pochi che hanno gli strumenti e i mezzi per elaborarli, potremo veramente andare incontro ad uno sviluppo significativo. Per esempio lo sviluppo dell'intelligenza artificiale è possibile grazie agli investimenti fatti da poche potenti realtà. Il timore di questo approccio è che se il web fosse decentralizzato, con tanti piccoli centri di potere, a quel punto nessuno avrebbe la forza tale da poter investire per una crescita significativa anche in termini di sviluppo tecnologico.

Conclusione

Non so quale sia la verità o la scelta migliore rispetto alle due correnti principali, ma la cosa interessante è che nel report dell'Economist si parla anche di nuove soluzioni che stanno emergendo e che vedono i due approcci commistionati. Chissà in quale internet ci muoveremo domani, cambia ad una velocità tale per cui fatichiamo a stare al passo. Certo è che probabilmente nessuno dei due pensieri, presi in modo puro ed estremo, è quello che funzionerà al meglio, ma piuttosto ci vorranno contributi su entrambi i fronti.