Data protection

Il Garante Privacy blocca la vendita dell’archivio GEDI a OpenAI: ‘Milioni di dati personali a rischio con chatGPT’

di |

Il Garante Privacy mette in guardia l'editore di repubblica e la Stampa sulla vendita del suo archivio a OpenAI, creatore di ChatGPT: 'Per cedere dati personali e informazioni estremamente delicate all'intelligenza artificiale necessario prendere le dovute cautele'.

Il Garante Privacy avverte GEDI: “Attenzione a vendere i dati personali a OpenAI”. GEDI, l’editore di Repubblica e La Stampa, non può dare in pasto a ChatGPT tutti gli articoli del suo archivio indistintamente, ma deve preventivamente preservare i dati sensibili che si trovano nella smisurata mole delle sue pubblicazioni. Lo ha reso noto il Garante Privacy, mettendo in guardia l’editore sul fatto che non può indiscriminatamente vendere tutti gli articoli del suo archivio senza fare una cernita molto accurata e preventiva per tutelare i dati sensibili delle persone. Nel provvedimento il Garante ricorda che “È vietato trattare dati personali che rivelino l’origine razziale o etnica, le opinioni politiche, le convinzioni religiose o filosofiche, o l’appartenenza sindacale, nonché trattare dati genetici, dati biometrici intesi a identificare in modo univoco una persona fisica, dati relativi alla salute o alla vita sessuale o all’orientamento sessuale della persona”.

Tutti contenuti che negli archivi storici del gruppo GEDI sono ben presenti, basti ricordare che in passato titoli dei giornali non andavano troppo per il sottile in tema di omosessualità e violenza. Anzi, era quasi la norma. Ma dando in pasto all’algoritmo tutto l’archivio del passato darebbe alla macchina un’impostazione valoriale ormai superata e soprattutto in contrasto con le leggi della data protection. Negli archivi risalenti nel tempo c’è di tutto. Oggi il giornalismo ha una sensibilità che in passato non c’era rispetto ai temi sensibili.

(Il link al provvedimento pubblicato oggi dal Garante Privacy).

Avvertimento: attenzione ai dati sensibili

Insomma, prima di vendere i suoi articoli a OpenAI, per addestrare ChatGPT i manager di GEDI dovranno tenere ben conto delle prescrizioni relative alla tutela dei dati sensibili delle persone che vengono citate nei vecchi articoli dei giornali. Una questione che evidentemente il management dell’editore non aveva considerato nella sua delicatezza all’atto dell’annuncio dell’accordo con OpenAI lo scorso 24 settembre, che prevedeva l’avvio della partnership per domani.    

C’è da dire che a livello internazionale accordi analoghi sono già statti siglati ad esempio dal Financial Times, da Bild, Associated Press  e da Le Monde.

Le storie di milioni di persone

Oggi il Garante Privacy ha reso noto di aver inviato un avvertimento formale al Gruppo editoriale, mettendolo in guardia dal possibile rischio per i dati di milioni di persone. Gli archivi digitali dei giornali conservano le storie di milioni di persone, con informazioni, dettagli, dati personali anche estremamente delicati che non possono essere licenziati in uso a terzi per addestrare l’intelligenza artificiale, senza le dovute cautele”, si legge nella nota odierna. Fra le possibili cautele c’è sicuramente anche la necessità di anonimizzare l’identità delle persone in base al tipo di informazioni che vengono trattate.

“Se il Gruppo Gedi, in forza dell’accordo firmato lo scorso 24 settembre con OpenAI, comunicasse a quest’ultima i dati personali contenuti nel proprio archivio, potrebbe violare le disposizioni del Regolamento Ue, con tutte le conseguenze anche di carattere sanzionatorio previste dalla normativa”, prosegue la nota. Basti pensare, ad esempio, a norme come il diritto all’oblio, già in vigore per i motori di ricerca online, che di certo dovranno valere anche per l’Intelligenza Artificiale di OpenAI.

Questo in sintesi l’avvertimento formale che il Garante Privacy ha inviato a Gedi e a tutte le società (Gedi News Network Spa, Gedi Periodi e Servizi Spa, Gedi Digital Srl, Monet Srl e Alfemminile Srl) che sono parte dell’accordo di comunicazione dei contenuti editoriali stipulato con OpenAI. Il provvedimento è stato adottato dopo i primi riscontri forniti dalla società, nell’ambito dell’istruttoria avviata di recente dall’Autorità.

Valutazione d’impatto non sufficiente

“Sulla base delle informazioni ricevute, l’Autorità ritiene che le attività di trattamento sono destinate a coinvolgere un grande volume di dati personali, anche di natura particolare e di carattere giudiziario, e che la valutazione d’impatto, svolta dalla società e trasmessa al Garante, non analizzi sufficientemente la base giuridica in forza della quale l’editore potrebbe cedere o licenziare in uso a terzi i dati personali presenti nel proprio archivio a OpenAI, perché li tratti per addestrare i propri algoritmi”.

C’è il diritto di opposizione, ma l’informazione preventiva agli interessati è insufficiente

Il provvedimento di avvertimento evidenzia, infine, “come non appaiano sufficientemente adempiuti gli obblighi informativi e di trasparenza nei confronti degli interessati e che Gedi non sia nelle condizioni di garantire a questi ultimi i diritti loro spettanti ai sensi della disciplina europea sulla privacy, in particolare il diritto di opposizione”.

OpenAI e GEDI avevano annunciato la partnership lo scorso 24 settembre, per rendere accessibili agli utenti di ChatGPT i contenuti in lingua italiana provenienti dalle testate del Gruppo GEDI.

Con questa partnership, gli utenti di ChatGPT avranno accesso a citazioni, contenuti e link alle pubblicazioni di GEDI, tra cui La Repubblica e La Stampa. La collaborazione era finalizzata a migliorare la rilevanza e l’accesso ai prodotti di OpenAI, inclusi ChatGPT e il prototipo SearchGPT, per gli utenti in Italia.

Denni: ‘Come vendere il letto di un albergo dove hanno già dormito gratis’

Scettico sull’intera operazione Dario Denni, Fondatore di Europio Consulting: “I giornali hanno da sempre fatto causa ai sistemi AI, che con lo scraping (estrazione dati ndr) hanno rubato sistematicamente i loro contenuti – dice Denni – ma non hanno studiato un modo per estrarne valore. Ora i sistemi AI già hanno fatto scraping dei siti dei giornali e quindi vendere gli archivi è come se un albergo vendesse il letto ad un ospite che ha già dormito lì ma non ha pagato la stanza”.

Leggi le altre notizie sull’home page di Key4biz