Il 6 dicembre Google ha dimostrato le capacità di Gemini, un’Intelligenza artificiale multimodale tanto potente da lasciare a bocca aperta.
Nel video, per esempio, Gemini riconosce di che materiale è fatta una piccola papera perché, premendola, ha emesso un breve suono. Sommando il rumore dell’aria che esce al fatto che non è stato complicato comprimere l’ignara paperella, l’IA di Google ha dedotto che fosse di gomma.
In seguito, mostrando dei disegni di pianeti, Gemini ha riconosciuto la Terra, Saturno e il Sole suggerendo in quale sequenza metterli per ricalcare la reale distanza dei pianeti dalla nostra stella madre. Poi, semplicemente mostrando una mano emulare i simboli di “sasso, carta e forbice”, Gemini ha riconosciuto quale gioco stesse mimando il suo interlocutore. Tutto ciò (e molto altro ancora) in tempo reale, con latenze brevissime.
Troppo bello per essere vero, e infatti non lo è.
Il video di Gemini è un fake
Cosa vuole dire che il video di Gemini è un fake? Sostanzialmente due cose. La prima è che il video è il risultato di un’accorta post-produzione. Prima è stato girato il video e soltanto in un secondo momento sono state estratte le scene salienti e sottoposte a Gemini affinché ne prendesse visione e avesse il tempo necessario per elaborare delle risposte pertinenti.
In seguito, il video è stato montato per restituire l’impressione che Gemini fosse in grado di rispondere in tempo reale alle domande postegli e leggesse in modo immediato lo scenario che le si presentava davanti.
Il secondo motivo per il quale il video è da considerare un fake è in realtà un dubbio e, in assenza di prove che certificano il contrario, è opportuno credere che Gemini abbia ricevuto un addestramento speciale per rispondere alle domande che le sono state poste. Come se avesse studiato la lezione per benino, attingendo a un set di dati molto limitato e bene definito. Un conto, infatti, è cercare risposte appropriate tra miliardi di informazioni disponibili, altro paio di maniche è trarre conclusioni analizzando un numero circoscritto di dati.
In definitiva, il video di Gemini rappresenta ciò che questa Intelligenza artificiale multimodale potrà ragionevolmente fare, con qualche dubbio sul reale significato dell’avverbio “ragionevolmente” e sui tempi (e la capacità di calcolo) che serviranno per spingere le IA a un simile livello.
Perché non deve stupire
Insomma, il video di Gemini è un fake, ma neppure Google ha sostenuto il contrario tant’è che, come sottolinea The Register, durante i primi secondi si legge che le immagini racchiudono i punti salienti dell’interazione uomo-macchina.
Fino a qui si può sostenere che i tanti video mediante cui si mostrano le capacità delle IA sono post-prodotti: non fanno eccezione le tante sequenze di robot che svolgono compiti specifici e si cimentano persino in balletti seguendo il ritmo della musica. Nessuno sa quanti tentativi sono stati abortiti, quanti altri hanno dato risultati disastrosi e quanti sono miseramente falliti. Nei video si vede sempre il risultato di un montaggio certosino.
Ciò non toglie che continuando a mostrare situazioni irreali, si fa un danno a tutta la ricerca che attira capitali in funzione dei risultati veramente raggiunti e non sulle promesse a tendere, perché Gemini è soltanto questo: l’immagine prorompente di un futuro che appare ancora lontano.
C’è da capire perché Google lo ha fatto e la risposta plausibile, al momento, è soltanto una: l’avanzata di ChatGPT e dei
modelli linguistici su cui Microsoft sta facendo leva, indicano che sul fronte delle Intelligenze artificiali Big G è un passo indietro rispetto alla concorrenza. Giocare in modo poco trasparente, però, non serve a nessuno.- dal lunedì al venerdì dalle ore 10:00 alle ore 20:00
- sabato, domenica e festivi dalle ore 10:00 alle ore 18:00.