il futuro secondo Google

SosTech. I segreti di Duplex, il sistema di Google dotato di IA che telefona al posto nostro

di |

Google Duplex è il sistema di intelligenza artificiale nato per telefonare e prendere appuntamenti dal dentista o prenotare un tavolo, il tutto con una voce tutt’altro che robotica, quasi umana, tanto da mostrare addirittura pause e incertezze.

Rubrica settimanale SosTech, frutto della collaborazione tra Key4biz e SosTariffe. Per consultare gli articoli precedenti, clicca qui.

Fateci caso: la gente quasi non parla più al telefono – a parte sui treni, per raccontare all’intero scompartimento la cena allo stellato della sera prima o le vacanze in Thailandia, ma quello è un altro discorso. La gente chatta, crea gruppi su WhatsApp per i motivi più futili, invia messaggi vocali nell’incomprensibile posa dove il telefono viene tenuto in orizzontale davanti alla bocca. Nelle offerte di telefonia mobile ciò che quasi nessuno guarda più – dopo gli ormai antidiluviani SMS – sono i minuti di conversazione, in favore di una richiesta continua di più GB di traffico dati: ne è la prova il fatto che è tutt’altro che difficile, ormai, trovare tariffe con minuti illimitati a prezzi impensabili fino a poco tempo fa (su SosTariffe.it potete trovare le più convenienti disponibili per questo mese).

Insomma, le telefonate piacciono sempre meno. «Telephone culture is disappearing», ha chiosato Alexis C. Madrigal in un articolo sull’Atlantic di qualche settimana fa: si riferiva al fisso, che ormai tutti guardiamo con sospetto perché un buon novanta per cento delle telefonate che arrivano sono, di fatto, puro spam, ma non ci vuole molta fantasia per immaginare come la cara, vecchia comunicazione sincronica stia per andare in pensione.

Google Duplex, la voce più vera del vero

Parlarsi e mettersi d’accordo al volo, sì, è comodo. Ma non si ha quasi mai tempo, e il rischio è di finire per voler parlare cinque minuti e poi rimanere attaccati allo smartphone per mezz’ora. Ed è anche piuttosto scomodo, malgrado gli auricolari wireless abbiano dato una grossa mano e nessuno si stupisca più a vedere la gente che cammina parlando (apparentemente) da sola. Molto meglio ottimizzare i tempi morti con un messaggio vocale o di testo: quando proprio siamo obbligati a dover telefonare ci spazientiamo facilmente, magari il nostro interlocutore è occupato, non ci risponde, o semplicemente non siamo nelle condizioni di parlare ad alta voce. Se devo organizzare una cena al ristorante e sono in ufficio, ad esempio, come faccio per non essere guardato storto dai colleghi?

È più o meno a questi interrogativi che Google voleva rispondere con Google Duplex, il sistema di intelligenza artificiale nato, appunto, per telefonare al posto nostro, prendere appuntamenti dal dentista, prenotare un tavolo in quella trattoria che proprio non vuole saperne di leggere i messaggi di posta elettronica: il tutto con una voce tutt’altro che robotica, quasi umana, che rappresenta la quintessenza della sintesi vocale, tanto da mostrare addirittura (calcolatissime) pause e incertezze.

La seconda demo di Google Duplex

Ma probabilmente Google non si aspettava – o perlomeno non in questi termini – le reazioni quasi univoche alla presentazione di Google Duplex, qualche mese fa durante la sua conferenza annuale, l’I/O 2018. Critiche e allarmi a non finire, Mountain View accusata di ingannare le persone e addirittura di tradirle dando ragione a un clima di sfiducia generalizzato verso le intelligenze artificiali – un po’ come i deep fakes, i video montati con fattezze altrui e ormai indistinguibili dal vero: possiamo giovarci da una situazione in cui non si sa mai se si sta parlando con una macchina o con un essere umano, come nelle più distopiche fantasie di Philip K. Dick?

Non stupisce, quindi, che Google abbia praticamente smesso di parlare di Duplex, almeno fino a qualche giorno fa. Ron Amedeo di Ars Technica, rivista-bibbia della tecnologia USA, ha raccontato di aver ricevuto, insieme ad altri giornalisti, un invito un po’ particolare: non a una classica conferenza stampa, ma a un ristorante thailandese di New York, il THEP, appositamente prenotato nella sua interezza per tutto il giorno. Qui è partita, diciamo così, la “seconda versione” della demo, che i giornalisti non hanno potuto registrare: in compenso è stato fornito un video dove un Google Assistant prenota un tavolo per due, accetta un cambiamento d’orario, ringrazia e saluta, comprendendo perfettamente le risposte del dipendente del ristorante, il tutto condito con espressioni non verbali decisamente umane (“Mmmh-mmh” quando al Google Assistant viene chiesto di aspettare qualche secondo mentre vengono controllate le prenotazioni). E alla fine, ovviamente, notifica all’utente del tavolo prenotato. Impressionante, non c’è che dire.

Il segreto: le possibilità limitate

Forse proprio le limitate possibilità di interazione “normale” in un contesto come quello della prenotazione di un ristorante hanno aiutato Google Duplex a non sbagliare nell’interpretare praticamente nulla di ciò che i giornalisti, su invito degli ingegneri di Google, gli hanno detto durante la dimostrazione, malgrado i non pochi tentativi di confonderlo o di metterlo in difficoltà. Come racconta Amedeo, che nei panni di un impiegato di un ristorante ha preso la prenotazione di Duplex: «Oggi Google Assistant richiede ordini diretti, senza tentennamenti, perfetti per interpretare un commando. Invece Duplex ha gestito la mia comunicazione, goffa e distratta, con il cortese disinteresse di una persona normale». Tra le cose più sorprendenti, il fatto che non ci fosse una singola “voce di Duplex”, ma diverse: ogni telefonata era differente dalla precedente, a volte con voci maschili, a volte femminili, a volte di tono più alto, altre più basso, perfino con una ben percepibile personalità.

Una sola cosa non è mai cambiata: l’inizio della conversazione, in cui Duplex ha dichiarato di essere il servizio di prenotazione automatica di Google e che stava registrando la telefonata. Insomma, l’intento è far capire senza possibilità di dubbi che all’altro capo del telefono non c’è una persona vera.

Il sogno? Gestire le telefonate più noiose in assoluto

Non tutto è rose e fiori: i punti dove c’è ancora da lavorare sono, ad esempio, lo spelling di numeri e lettere. In più, secondo Amedeo il rischio è che l’umanità di Google Duplex possa giocare un po’ contro all’impressione che si vuole dare di sé: nel tentativo di suonare naturale, ogni tanto l’assistente rischia di sembrare sarcastico, strafottente o “troppo” casual, e avere “awesome!” come (nostra) risposta a una prenotazione andata a buon fine presso un ristorante elegante e un po’ snob non è proprio il massimo. Ma ci si lavorerà. Come si lavorerà – e lo speriamo tutti – sulla possibilità di gestire telefonate ben più lunghe e noiose, come quelle relative alla disattivazione di un servizio, che portano via a chiunque intere mezz’ore. Come chiosa Amedeo – e non è facile dargli torto – «qualcosa che non avrei alcun problema a far gestire interamente a un computer».

Fonti:

https://www.theatlantic.com/technology/archive/2018/05/ring-ring-ring-ring/561545/

https://arstechnica.com/gadgets/2018/06/google-duplex-is-calling-we-talk-to-the-revolutionary-but-limited-phone-ai/

Leggi le altre notizie sull’home page di Key4biz