Ars Artificialis: una rubrica a cura di Nicola Grandis. Parlare e dialogare sulla migliore approssimazione di Arte Artificiale realizzata sin qui dall’uomo, quella che comunemente viene definita Intelligenza Artificiale. Per leggere tutti gli articoli clicca qui.
DeepSeek, azienda cinese serissima, nata nel mondo della finanza, con profondi collegamenti con la comunità scientifica mondiale e qualche italiano tra le sue fila, rilascia R1 ai primi di Gennaio, anche se diventa mainstream in queste ore.
DeepSeek ha avuto qualche buona idea per fare economia. Rilascia un modello, R1, che è il Temu dell’AI. La loro ricerca deriva dai modelli Llama di Meta, ma mira all’efficienza. Il modello ha molti bias, molti problemi, ma apre una finestra sul futuro dell’AI.
I segnali c’erano tutti. Ilya Sutskever, un signore con diversi Billions a disposizione per lavorare sulla Super-Intelligence lo aveva anche detto dal palco: “l’AI (ndr: attuale) non può scalare oltre coi dati”.
Perché il problema è sostanziale ed ineluttabile: un alfabeto di 26 simboli che forma parole lunghe in media 6 simboli, raccolte in frasi mediamente lunghe 30 parole, non può scalare oltre l’allenamento già effettuato su quasi tutto il web conosciuto. Un Transformer, dopo aver osservato e digerito un allenamento grande come il WWW ha già imparato a fare il Next Token Predictor e non può farlo meglio di così.
Allora cos’è DeepSeek e perché spaventa le borse? R1 è un ottimizzazione delle idee di Llama, full open source, disponibile su cloud cinese ad una cifra molto inferiore rispetto alla competition US e tutto sommato equipollente. 2 USD contro i 60 USD per milione di Token di OpenAI. Allenato con 6MLN di USD contro i 500MLN per round completo di un ChatGPT.
👉 DeepSeek-R1 è il Temu dell’AI
👉 DeepSeek non ha scoperto nulla di sconvolgente, ma ha ottimizzato il processo di training mostrato a tutti da Meta
👉 DeepSeek dimostra una cosa che sapevamo tutti: ogni tecnologia, raggiunta la sua massima capacità espressiva, evolve per ottimizzazione.
Dopo DeepSeek-R1 arriveranno ulteriori sviluppi. Non potendo accrescere la capacità dei Transformers, la ricerca si orienterà in parte sulla loro ottimizzazione. L’altra parte invece si adopererà per superarli con un’altra tecnologia. Che fosse energeticamente e finanziariamente insostenibile questa, altro fattore già dimostrato.
Il mercato penalizza chi più stava spingendo su questa idea, e forse in OpenAI si sta ragionando sul fatto che sarebbe stato il caso di quotarsi prima.
NVidia resta il leader del mercato, indiscussa star dell’AI e fornitrice di picconi per ogni minatore, si riprenderà, ma oggi gli investitori che avevano visto nell’AI una semplice speculazione finanziaria sono fuggiti in massa (il 20%), un altro 20% sta chiedendo a Copilot cosa fare, un 10% di indecisi cronici ed un 50% che prende i popcorn ed attende il rimbalzo.
👉 il grafico sotto?
Un monito per quanti stessero pensando che il solo numero di GPU avrebbe definito il proprio successo. Un caloroso buongiorno a tutti coloro che abbiano mai pensato che la corrente elettrica e gli investimenti in silicio potessero battere l’intelligenza umana.
L’AI, un viaggio appena iniziato.