Il modello di intelligenza artificiale di nuova generazione di OpenAI “Strawberry” (in precedenza Q*) è in lavorazione, probabilmente con una data di rilascio in autunno. La natura apparentemente avanzata di questo LLM sta alimentando l’entusiasmo attorno al suo lancio, visto ciò che si dice intorno al suo conto, come la capacità di risolvere complessi problemi matematici e persino puzzle di logica verbale.
Secondo fonti e documenti interni esaminati da Reuters il mese scorso, Strawberry rappresenta un significativo progresso nelle capacità di ragionamento dell’AI. A differenza degli attuali modelli che lavorano per generare testo e rispondere a query basate sulle conoscenze esistenti, Strawberry mira a pianificare in anticipo e gestire attività complesse in modo autonomo. OpenAI ha scelto di usare Strawberry per generare più dati sintetici di un certo tipo: problemi di logica e ragionamento, e le loro soluzioni.
Cosa potrà fare l’AI di OpenAI
Per gli utenti di ChatGPT, le implicazioni di Strawberry potrebbero essere trasformative. Mentre le attuali iterazioni hanno impressionato per la capacità di generare testo simile a quello umano e di assistere in vari compiti, spesso l’AI si scontra con problemi complessi e multi-step che richiedono un ragionamento profondo. Strawberry potrebbe colmare questa lacuna. La tecnologia è progettata per eseguire ciò che OpenAI definisce “ricerca approfondita”, consentendo potenzialmente al modello di navigare su internet in modo autonomo per raccogliere e sintetizzare informazioni. Per questo, le future versioni di ChatGPT basate su Strawberry saranno in grado di fornire risposte più accurate, ben studiate e logicamente valide alle query degli utenti. In altre parole, molte meno allucinazioni.
Cos’è Strawberry
Strawberry è un modello linguistico addestrato attraverso la “supervisione del processo”. Si tratta di un flusso grazie al quale, durante l’addestramento, un modello viene “premiato” per aver eseguito correttamente ogni passaggio di ragionamento che lo porterà alla risposta. Al contrario, la maggior parte dei modelli linguistici odierni viene addestrata tramite “supervisione dei risultati”. Ossia, le AI vengono premiate solo se ottengono la risposta corretta.
OpenAI ha sviluppato Strawberry originariamente per creare dati di training per il suo nuovo modello di fondazione, nome in codice Orion. Le versioni precedenti sono state addestrate sull’intera Internet. Il problema era l’assenza di dataset in cui i problemi di matematica e ragionamento vengono risolti passo dopo passo. Strawberry può essere indotta a generare un vasto set di problemi di formazione personalizzati con soluzioni susseguenti, così che l’AI possa imparare a risolverli, con meno allucinazioni in caso di problemi simili.
Oltre a servire da formazione per altri modelli, Strawberry potrà svolgere una serie di altri compiti di alto livello come l’ideazione di strategie di mercato, la risoluzione di giochi di parole come Connections del New York Times e la conduzione di ricerche esaustive su argomenti complessi. Ciò estenderebbe notevolmente il valore dell’AI da puramente commerciale a educativo, campi dove il pensiero potrà essere modellato con molta più profondità. La release di Strawberry fa parte dell’impegno globale di OpenAI di innovare e ampliare i poteri della tecnologia generativa. Uno dei vari progetti basati sul lavoro dell’ex scienziato capo Ilya Sutskever, uscita dall’azienda solo qualche mese fa. Speriamo non per problematiche relative al predominio dell’AI sull’uomo…