ChatGPT crea immagini “in stile” Studio Ghibli

ChatGPT, intelligenza artificiale e lo stile Ghibli

Negli ultimi giorni, si legge in un approfondimento del New York Times, i social media sono stati invasi da immagini in stile Studio Ghibli, create con l’ultima versione di ChatGPT di OpenAI (GPT-4o Image Generation). L’aggiornamento ha potenziato enormemente le capacità di generazione di immagini dell’intelligenza artificiale (AI), rendendo possibile trasformare in pochi secondi semplici selfie, meme e scene quotidiane in illustrazioni fiabesche tipiche dell’immaginario di Hayao Miyazaki.
Si parla già di “ghiblification“.

Questa funzione ha avuto un tale successo da mandare in crash il sistema di OpenAI a causa dell’elevato numero di richieste. Ma con essa emergono anche nuove e complesse questioni sul fronte del copyright e del diritto d’autore.

“Il lancio di ChatGPT 26 mesi fa è stato uno dei momenti virali più folli che abbia mai visto e abbiamo aggiunto un milione di utenti in cinque giorni. Abbiamo aggiunto un milione di utenti nell’ultima ora“, ha annunciato ieri sera Sam Altman su X. Probabilmente si tratta dell’effetto Ghibli-Style del generatore di immagini GPT-4o.
Lo stesso Altman ha scritto oggi, sempre sul social, che il generatore di immagini di ChatGPT è gratuitamente accessibile a tutti gli utenti OpenAI.

Grazie ad un nuovo round di finanziamenti, guidato dalla società di investimenti giapponese SoftBank, OpenAI vale oggi più di 300 miliardi di dollari, quasi il doppio di ottobre 2024.

Come funziona la nuova generazione di immagini. E la privacy?

Mentre i precedenti generatori di immagini si basavano su modelli di diffusione (che partono da un’immagine casuale per affinarla progressivamente), ChatGPT ora utilizza un algoritmo autoregressivo. Questo tratta le immagini come se fossero linguaggio, suddividendole in “token” (frammenti), e predicendo le componenti visive più probabili come fa con le parole. Questo approccio consente una maggiore precisione nella creazione di immagini e un migliore collegamento tra parole e componenti visive.

Un vantaggio chiave è che l’IA può attingere all’enorme base di conoscenze di cui dispone, riconoscendo concetti come “stile Ghibli” senza bisogno di descrizioni dettagliate.

Sulla scia delle novità comunicate da OpenAI durante la scorsa settimana, molti utenti, però, stanno anche caricando proprie immagini o fotografie di parenti e amici per creare nuovi contenuti ghiblizzati, per così dire, ma con grandi problemi sul fronte della tutela dei dati personali.
Tali immagini che ritraggono persone in carne ed ossa potrebbero venir utilizzate dalla società per addestrare i modelli di AI. Il problema è che lo potrebbe fare senza chiedere l’autorizzazione al diretto proprietario e sfruttando in modo particolare i volti, per l’estrazione dei dati facciali e biometrici (addestramento particolarmente utile ai fini dello sviluppo di nuovi strumenti legati videosorveglianza intelligente, ma anche per l’integrazione dell’AI nella robotica).

Le AI come motori di stile

In questo lavoro, possiamo considerare l’AI generativa di ChatGPT come un motore di stile. Non memorizza immagini o testi in senso tradizionale, ma apprende schemi e stili da grandi quantità di dati. Non conserva veri frame di film Ghibli, ma codifica la cosiddetta “Ghibli-ness” – ovvero una rappresentazione matematica dello stile Miyazaki. Lo stesso vale per qualsiasi soggetto: “banana-ness”, “cat-ness”, o “corporate email-ness”.

Questa capacità di assorbire e replicare stili permette di mescolare e reinventare, ad esempio creando una “poltrona nello stile di un gatto” o “un paesaggio elfico”.

Si pone un problema di diritto d’autore

Tuttavia, l’uso degli stili altrui pone interrogativi giuridici. Secondo la legge attuale, non è possibile brevettare uno stile: il diritto d’autore protegge solo le opere specifiche, non i generi o gli approcci stilistici. Tuttavia, quando uno stile è così unico da essere parte dell’identità di un artista, la sua replicazione automatica da parte di un’IA può diventare una minaccia.

Greg Rutkowski, artista polacco, ha visto il suo stile riprodotto in oltre 93.000 prompt solo su Stable Diffusion. In risposta, insieme ad altri colleghi, ha avviato una class action nel 2022 contro diverse aziende di AI, accusandole di utilizzare le sue opere senza consenso per addestrare i loro modelli.

Lo stesso Hayao Miyazaki si è espresso in passato in modo critico verso l’uso dell’intelligenza artificiale nella creazione artistica.

Con le IA sempre più potenti e accessibili, ci troviamo di fronte a una trasformazione profonda della creatività. Le tecnologie come ChatGPT offrono strumenti senza precedenti per l’espressione personale e artistica, ma sollevano al contempo la necessità di nuove tutele legali per proteggere l’identità e il lavoro degli artisti (e quindi la stessa creatività come opera d’arte, d’ingegno e culturale). Il futuro dell’arte e del diritto d’autore si gioca oggi su questo nuovo terreno, dove creatività e algoritmi si incontrano.

Leggi le altre notizie sull’home page di Key4biz

Per saperne di più: AI chatGPT Copyright Intelligenza Artificiale Studio Ghibli