Tu sei qui

Big Data: presupposti, promesse e limiti

Albertine Meroni
Data Analyst e Coach professionista
2021

Le innovazioni tecnologiche degli ultimi tempi sono state classificate con il nome di “Quarta rivoluzione industriale” (1) per l’effetto dirompente che stanno avendo a livello industriale, aziendale e civile, modificando visibilmente il nostro modo di vivere. Esse coinvolgono non solo ciò che può essere considerato strettamente digitale ma in generale tutti i settori che prevedono strategie di marketing fino anche a ciò che appartiene alla sfera fisica e a quella biologica; da qui la necessità di una seria riflessione sul fenomeno, sulle sue implicazioni, criticità, promesse e limiti.

Provando a individuare i presupposti alla base di questo fenomeno bisogna considerare che negli anni sessanta del secolo scorso, chi doveva gestire grandi quantità di dati doveva disporre di un unico calcolatore molto grande – il “Mainframe Computer” – e per accedere ai dati non aveva altra possibilità che  recarsi fisicamente sul posto. Tra gli anni settanta e ottanta si assiste alla grande rivoluzione dei network per cui i dati possono essere archiviati su più sistemi, questo è uno dei presupposti fondamentali per lo sviluppo dei Big Data come li intendiamo oggi. Un altro importante presupposto è l’avvento di Internet che ha reso possibile accedere all’informazione anche da remoto; non da ultimo l’avvento del Web che ha vertiginosamente incrementato il numero di dati prodotti ogni giorno. Ad oggi, “Big Data” significa interi edifici posti per lo più in zone remote e preferibilmente fredde, con alti consumi energetici dovuti ai server che ospitano per i servizi in Cloud e dovuti agli enormi ed indispensabili impianti di ventilazione per il raffreddamento degli ambienti. A livello tecnologico, “Big Data” significa sistemi di archiviazione in continua evoluzione, per garantire un’archiviazione sicura di dati che possano essere processati, analizzati e interpretati sempre più velocemente. Ma a livello etico e sociale quali sono le implicazioni?

Gli effetti sociali della rivoluzione Big Data – vale a dire, del poter archiviare e  gestire in modo rapido ed efficiente grandi moli di dati – sono stati in primis l’insorgere di discipline per analizzare velocemente queste moli di dati da cui trarre significato, valore economico o indicazioni per le decisioni a seconda dell’ambito di applicazione. Queste discipline a cui mi riferisco appartengono alla cosiddetta Data Science e comprendono l’uso di algoritmi di Machine Learning e di Deep Learning.

A proposito di queste discipline, il professore Angelo Vulpiani, nell’articolo che riproponiamo in questo Speciale (2), mette in guardia dal dilagante rischio di “privilegiare aspetti con finalità immediatamente pratiche a scapito di una solida formazione di base e soprattutto della possibilità di sviluppare senso critico”. Troppo spesso, infatti, si è assistito ad approcci estremamente approssimati arrivando anche a sviluppare una Data Science automatizzata.

Proseguendo nel citare alcuni tra i principali effetti legati ai Big Data, consideriamo l’enorme quantità di dati che gli utenti del web disseminano durante la loro navigazione. A partire dalla collezione di informazioni – quali ad esempio il tempo di permanenza di un’utente su una pagina, i suoi download, gli acquisti effettuati, le sue interazioni con i Social Networks – è nata la pratica della “profilazione utente” che può essere considerata vera e propria merce di scambio a fini pubblicitari. Vedremo più avanti l’importanza del Regolamento europeo in materia di tutela dei dati personali che introduce la regola per cui se il trattamento dei dati è finalizzato ad attività di marketing diretto, l’interessato ha sempre il diritto di opporsi alla profilazione.

Un altro ambito in cui abbondano i dati e conseguentemente l’applicazione di algoritmi di Data Science è quello legato alla sensoristica, anche noto come “Internet of Things” (IoT). Si parla di Smart City, ovverosia “città intelligenti” capaci di gestire con la massima efficienza i propri consumi energetici, in cui semafori intelligenti regolano il traffico e la raccolta e l’analisi con algoritmi di Machine Learning dei dati provenienti dall’Internet of Things aiuterebbe le amministrazioni nelle decisioni. L’IoT non riguarda solo le città, possono essere coinvolti dall’utilizzo di sensori anche le spedizioni postali, il trasporto di merci, gli aeroporti, gli impianti industriali, la manutenzione ferroviaria, la manutenzione elettrica, etc.; il tutto, per avere, oltre ad un monitoraggio della situazione corrente, predizioni sul futiro, come ad esempio eventuali guasti o rallentamenti nel processo.

Un capitolo a parte meriterebbe l’Intelligenza Artificiale (AI) per cui le implicazioni etiche e sociali sono forse ancor più vaste e profonde. In questo caso mi limito a riportare come spunto iniziale la trascrizione di un interessante intervento (anch’esso riproposto nel presente Speciale) tenuto dal noto fisico, inventore e imprenditore Federico Faggin nel 2016 (3) sulla differenza tra intelligenza umana e intelligenza artificiale. Qui Faggin analizza sapientemente cosa intendiamo per coscienza e perché questa non “è una proprietà che emerga dai computer booleani” e definisce l’importanza della comprensione “che è una proprietà fondamentale della coscienza […] e che è ciò che definisce la natura della vera intelligenza”.

Oltre al tema dell’intelligenza artificiale, meriterebbe un approfondimento dedicato anche il tema dei robot e in particolare dei robot antropomorfi, o su temi quali il dibattito sull’opportunità o meno di adottare automobili senza conducente che porterebbe con sé la questione circa la responsabilità penale in caso di incidente causato da tali automobili.

Abbiamo quindi l’impressione, confermata negli anni, di vivere una rivoluzione che viaggia a grande velocità ma in quale direzione? E chi c’è alla guida di questi sviluppi? Siamo metaforicamente su un veicolo senza conducente?

Una convinzione piuttosto diffusa è che le multinazionali protagoniste di questa rivoluzione, anche dette Big Tech o Big Data Provider, e i Social Network in particolare, abbiano un forte potere in quanto detentori dei dati. 

Si tende a immaginare queste aziende come soggetti indipendenti e addirittura sovraordinati. In realtà, come spiega il giornalista Dario Fabbri nel suo approfondimento disponibile sul canale YouTube di Limes (4), due sono gli aspetti fondamentali da tenere presente: il primo è che i Big Tech non dispongono della tecnologia che utilizzano ma ne sono soltanto gestori, e il secondo è che sono in territorio statunitense, per tanto le sorti di queste aziende dipendono direttamente dallo stato federale statunitense e sono tenute ad operare nell’interesse nazionale. Le multinazionali sono tutt’altro che sovraordinate, sono piuttosto ben consapevoli che se lo stato federale approvasse una legge stringente sulla privacy e un’altra di matrice antitrust, come avvenne nel 1890 per il mercato petrolifero, molte di loro ne sarebbero come minimo pesantemente danneggiate.

Nei paesi dell’Unione Europea, invece, il 24 maggio 2016 è entrato in vigore il Regolamento europeo (UE) 2016/679 concernente la tutela delle persone fisiche con riguardo al trattamento dei dati personali e la libera circolazione di tali dati (5). Il Regolamento è divenuto applicabile in tutti gli Stati membri a partire dal 25 maggio 2018. L’entrata in vigore di questo Regolamento, anche noto con l’acronimo GDPR (General Data Protection Regulation) rappresenta un passaggio di fondamentale importanza.

Si legge nel Regolamento Generale sulla protezione dei dati che la comprensione dell’informativa dovrà essere facilitata e il consenso dell’interessato al trattamento dei dati personali dovrà essere esplicito. Evidenza di questo è data dal fatto che all’apertura di qualsiasi pagina web viene fatta richiesta esplicita sul consenso.

Un chiaro esempio di come il GDPR segni una forte differenza tra Unione Europea e Stati Uniti ci viene offerto mettendo a confronto l’incipit dell’articolo del professore Angelo Vulpiani con il GDPR. Il professore Angelo  Vulpiani evidenzia il pericolo legato all’uso degli algoritmi di Machine Learning applicati ai nostri dati ad opera di società di assicurazioni, datori di lavoro, tribunali, citando studi effettuati negli Stati Uniti che mostrano implicazioni sociali preoccupanti. Nell’Unione Europea invece il Regolamento definisce i limiti al trattamento automatizzato dei dati personali. Ad esempio le decisioni che producono effetti giuridici (come la concessione di un prestito) non potranno essere basate esclusivamente sul trattamento automatizzato dei dati. 

Il Regolamento stabilisce criteri rigorosi per i casi di violazione dei dati personali.Un cittadino più informato è un cittadino che può far valere maggiormente i suoi diritti, come ad esempio ripensando al caso citato prima, a proposito di decisioni che producono effetti giuridici un cittadino ha il diritto di opporsi alla decisione adottata sulla base di un trattamento automatizzato o il diritto di ottenere anche l’intervento umano rispetto alla decisione stessa. Inoltre il Regolamento pone le basi per l'esercizio di nuovi diritti, come il  cosiddetto “diritto all’oblio”, grazie al quale gli interessati potranno ottenere la cancellazione dei propri dati personali, oppure il diritto alla “portabilità”, secondo cui gli interessati potranno ottenere che i propri dati personali vengano trasferiti da un titolare del trattamento ad un altro. Ad esempio, si potrà cambiare il provider di posta elettronica senza perdere i contatti e i messaggi salvati.

Di fatto l’Unione Europea è l’unica ad aver emanato un Regolamento che tuteli i suoi cittadini con riguardo al trattamento dei dati personali e alla libera circolazione di tali dati. Forse l’aspetto più significativo è proprio quest’ultimo in quanto il Regolamento stabilisce criteri rigorosi per il trasferimento dei dati al di fuori dell’UE. Resta vietato il trasferimento di dati personali verso Paesi situati al di fuori dell’Unione europea o organizzazioni internazionali che non rispondono agli standard di adeguatezza in materia di tutela dei dati.

L’entrata in vigore del GDPR ha avuto consistenti effetti nelle aziende che si trovano coinvolte nel trattamento dei dati. Queste hanno la necessità di adottare efficaci metodologie di governo del dato e di avere una visione del dato in tutte le sue trasformazioni. Pertanto, si trovano a dover introdurre nuove figure professionali, come ad esempio la figura del “Responsabile della protezione dei dati” (Data Protection Officer o DPO). Inoltre, il Regolamento rende necessario il principio chiave di “privacy by design”, ovverosia garantire la protezione dei dati fin dalla fase di ideazione e progettazione di un protocollo di trattamento o di un sistema.

Per concludere, tengo particolarmente a menzionare uno degli articoli proposti in questo approfondimento: “Big Data. Ecco perché le discipline umanistiche governeranno il digitale”, pubblicato su Avvenire il 23 Gennaio 2018 (6) in cui l’autore, Simone Paliaga, riporta al centro l’importanza di sviluppare senso critico nei giovani e il ruolo fondamentale che devono avere lo studio della filosofia, della poesia e della letteratura “per rendere elastiche e flessibili le menti dei giovani”. Forse accrescere il senso critico di ognuno è davvero l’obiettivo più importante.

C’è il rischio che nel business tecnologico ci si dimentichi di porre al centro l’essere umano. Cosa permette all’essere umano di vivere meglio? A cosa le persone tengono maggiormente? Manca una riflessione collettiva sulla direzione che vogliamo intraprendere anche a proposito di questa “quarta ricoluzione” in cui siamo immersi.

Dalle considerazioni fatte fin qui possiamo forse ammettere che l’idea di dare una direzione a questo fenomeno sia poco realistica: quale autorità istituzionale ne avrebbe la possibilità e la capacità? Tuttavia risulta estremamente importante analizzare il fenomeno, individuarne i limiti e gli effetti sociali per regolamentarlo almeno a livello giuridico. Il Regolamento europeo 2016/679 noto come GDPR è stato il primo importante passo, ma prevede coinvolgimento e conoscenza oltre che da parte dei soggetti direttamente coinvolti anche da parte dei giornalisti e dei cittadini stessi.

Bibliografia

[1] [Bell G. 2018, blog] Preparing for artificial intelligence - the fourth wave of industrialisation | Xero Blog
[2] Angelo Vulpiani “Perché non possiamo scavalcare le teorie” articolo pubblicato su il Manifesto, 20 Ottobre 2019 (http://disf.org/files/vulpiani-manifesto-bigdata.pdf)
[3] Federico Faggin, Conferenza tenuta a Santiago del Chile ad un Congresso sul Futuro, 2016 (http://disf.org/faggin-intelligenza-artificiale)
[4] [Fabbri D. 2021, youtube] Quanto sono potenti i Big Tech? - YouTube
[5] [Regolamento Ue 2016/679]Regolamento Ue 2016/679 - Garante Privacy
[6] Simone Paliaga, “Big Data . Ecco perché le discipline umanistiche governeranno il digitale” articolo pubblicato su Avvenire il 23 Gennaio 2018 (http://disf.org/files/discipline-umanistiche-digitale.pdf)