Corsa all'AI

Claude 3.5 Sonnet è il miglior modello di AI al momento ma nessuno ne parla

di |

Anthropic ha aggiunto la modalità “Artifacts” al suo chatbot, Claude 3.5, per mostrare in tempo reale lo sviluppo di un progetto e dare un nuovo modo di interazione con gli utenti e l'intelligenza artificiale.

La corsa agli armamenti dell’AI continua a ritmo serrato: Anthropic ha lanciato da qualche giorno il suo modello più recente, chiamato Claude 3.5 Sonnet, che afferma possa eguagliare o superare GPT-4o di OpenAI o Gemini di Google in un’ampia gamma di attività. Il problema principale di Claude è che il suo sviluppatore non ha la forza commerciale e di comunicazione degli altri. Per questo, il chatbot di cui più sotto scriviamo rischia di essere relegato ad alternativa invece che a protagonista dell’attuale scenario dell’intelligenza artificiale utile.

Dal lancio, un insieme non così piccolo di esperti ha cominciato a lodare le doti del nuovo nato. Il nuovo modello è già disponibile per gli utenti di Claude sul Web e su iOS , e Anthropic lo sta rendendo disponibile anche agli sviluppatori. Claude 3.5 Sonnet è il modello intermedio della gamma: Anthropic usa il nome Haiku per il suo modello più piccolo, Sonnet per l’opzione intermedia mainstream e Opus per il suo modello di fascia alta. Nomi strani ma non è questo il punto.

La novità di Artifacts

L’azienda afferma che Sonnet supera con un margine piuttosto ampio tutti i concorrenti di pari rango. Il nuovo modello è anche apparentemente due volte più veloce del precedente, una metrica che lascia il tempo che trova visto il ritmo con cui questi progetti evolvono anche nel breve periodo.

Comunque, cos’è che può fare realmente Sonnet? Un buon esempio ci arriva da Giacomo Ciarlini, Head of Content & Education di Datapizza, che ha postato su Linkedin un video delle capacità del modello (visibile nel player di questo articolo).

“La grandissima figata dell’ultimo aggiornamento è che ha aggiunto la modalità artifacts, che mette a disposizione un piccolo banco da lavoro, dove Claude può scrivere componenti per realizzare piccole applicazioni, solo in base alla descrizione. Questo è il miglior modello esistente al momento. A mani basse”.

Insomma, Claude 3.5 Sonnet sembra impressionante: ha superato GPT-4o, Gemini 1.5 Pro e Llama 3 400B di Meta in sette dei nove benchmark complessivi e quattro dei cinque benchmark più usati. Non a caso, Anthropic afferma che Claude 3.5 Sonnet è molto più bravo a scrivere e tradurre codice, gestire flussi di lavoro multi-step, interpretare diagrammi e grafici e trascrivere testo da immagini. Questo nuovo e migliorato supporto è anche apparentemente più bravo a comprendere l’umorismo e può scrivere in un modo molto più umano.

Più Slack che ChatGPT

Un’ulteriore aggiunta è Artifacts, una modalità con cui vedere e interagire con i risultati delle richieste a Claude in tempo reale. Se si chiede al modello di progettare qualcosa, questo può mostrare come appare il progetto per modificarlo direttamente dall’app. Se Claude scrive un’e-mail, possiamo editarla nell’app Claude invece di doverla copiare in un editor di testo. È una piccola funzionalità, ma intelligente: questi strumenti di intelligenza artificiale devono diventare più di semplici chatbot e funzionalità come Artifacts sono sulla strada giusta verso il perseguimento dell’obiettivo.

In generale, Artifacts è molto più vicino a Slack che a ChatGPT, con i modelli di Anthropic al centro dell’intero sistema. E ciò che entusiasma maggiormente è la promessa dello sviluppatore di rendere Artifacts strumenti per i team: “È solo l’inizio di una visione più ampia per Claude.ai, che presto si espanderà per supportare la collaborazione di gruppo. Nel prossimo futuro, i team, e alla fine intere organizzazioni, saranno in grado di centralizzare in modo sicuro le proprie conoscenze, i documenti e il lavoro in corso in un unico spazio condiviso, con Claude che fungerà da compagno su richiesta”.

Leggi le altre notizie sull’home page di Key4biz