Secondo un rapporto di The Information , OpenAI si sta preparando a lanciare il suo modello di intelligenza artificiale potenzialmente basato sul ragionamento e sulla matematica, nome in codice “Strawberry“. L’AI, che potrebbe arrivare entro le prossime due settimane, segna un passo significativo nella ricerca di OpenAI per sviluppare sistemi di intelligenza artificiale più avanzati. La release iniziale sarebbe limitata a un piccolo gruppo di tester. Strawberry, precedentemente noto anche come Q* o Q-Star, è progettato per rafforzare le capacità di ragionamento.
Come funziona il sistema di ragionamento di Strawberry
Sebbene OpenAI non abbia ancora confermato i dettagli relativi al rilascio, si dice che il nuovo modello utilizzi uno stile di pensiero “System 2”, un concetto che lo psicologo Daniel Kahneman ha reso popolare nel suo libro Pensieri lenti e veloci . Il processo prevede una modalità di pensiero lenta, deliberata e analitica per il ragionamento cosciente. Al contrario, il System 1 è veloce, intuitivo ed emotivo.
Per quanto riguarda Strawberry, il sistema impiega significativamente più tempo a “pensare” rispetto al suo attuale modello GPT-4o. The Information riporta che impiegherà 10-20 secondi per elaborare i suoi input e le potenziali risposte prima di condividere una risposta finale per ridurre gli errori.
Visto che è facile fare confusione, Strawberry dovrebbe essere più una modalità che una vera e propria nuova intelligenza artificiale. Di fatto, l’opzione di ragionamento “lento” potrebbe essere integrata nel prossimo ChatGpt, conosciuto come Orion o GPT-5.
Il costo della formazione
Sebbene OpenAI non abbia rilasciato tutti i dettagli riguardanti l’addestramento di GPT-4, il CEO di OpenAI Sam Altman ha stimato che il costo per addestrare GPT-4 fosse “più di” 100 milioni di dollari”. Secondo alcune stime, il modello ha 1,76 trilioni di parametri; alcuni esperti hanno ipotizzato che la formazione dei modelli futuri potrebbe costare centinaia di milioni o addirittura miliardi di dollari, suscitando domande da parte di aziende come Goldman Sachs in merito al ritorno sull’investimento del settore. Nel 2023, Altman disse: “Penso che siamo alla fine dell’era in cui ci saranno questi modelli giganti e li miglioreremo in altri modi”.
Cosa c’entra STaR
Alcuni report di Reuters hanno evidenziato una possibile connessione tra Q*/Strawberry e STaR (Self-Taught Reasoner), altro progetto relativo all’intelligenza artificiale. Le somiglianze sono notevoli: STaR inizia con un piccolo set di esempi che dimostrano un ragionamento passo dopo passo (chiamato “razionale”). Quindi sollecita un modello linguistico di grandi dimensioni (LLM) per generare razionali per un set di dati più ampio di domande che non hanno razionali. Ciò è analogo al fornire all’LLM alcuni esempi elaborati e poi chiedergli di risolvere autonomamente problemi simili. Il processo è anche noto come “bootstrapping” e utilizza le capacità di ragionamento esistenti di un modello linguistico e le migliora iterativamente tramite un ciclo di autoapprendimento.
Ragionamenti a catena
Il ragionamento a catena di pensiero implica la scomposizione di un problema complesso in una serie di passaggi intermedi, ognuno dei quali forma una catena logica per il successivo. Gli esseri umani ragionano in modo simile, rendendo il processo di ragionamento più trasparente e più facile da comprendere rispetto al tradizionale apprendimento profondo, che può scoprire connessioni nascoste tra variabili ma non in modo spiegabile.
Sia STaR che Strawberry potrebbero avere successo nell’affrontare problemi matematici oggi irrisolti o comunque molto difficili da affrontare. Ne sapremo di più tra un paio di settimane.