Nelle ultime 19 ore, un video virale di Google, che presentava il modello di intelligenza artificiale chiamato Gemini, ha catturato l’attenzione di oltre 1,6 milioni di spettatori su YouTube. Tuttavia, le sorprendenti capacità mostrate nel video potrebbero non essere così impressionanti come sembrano inizialmente.
Google ha ammesso che il video è stato modificato per creare un aspetto più accattivante, rivelando che le risposte dell’intelligenza artificiale sono state accelerate a fini dimostrativi. La descrizione del video includeva questa informazione, ma il riconoscimento vocale e video in tempo reale non erano affatto parte delle abilità di Gemini.
In un post sul blog pubblicato contemporaneamente alla demo, Google ha svelato il dietro le quinte della realizzazione del video. Il gigante di Mountain View Google ha confermato che l’intelligenza artificiale è stata stimolata utilizzando fotogrammi di immagini fisse dal video e inviando suggerimenti tramite testo.
Il video mostra momenti chiave in cui l’intelligenza artificiale risponde alle domande vocali e visive dell’utente. Tuttavia, ciò che sembra essere un’interazione in tempo reale è stato creato utilizzando immagini fisse e istruzioni basate su testo. Ad esempio, la corretta identificazione di un oggetto è stata ottenuta mostrando all’IA un’immagine statica e fornendo un messaggio di testo che spiegava le caratteristiche dell’oggetto.
Google ha specificato che la demo è stata realizzata catturando riprese dal video originale, accorciando le sequenze e utilizzando immagini fisse. La voce fuori campo è stata direttamente tratta dalle istruzioni scritte inserite in Gemini.
Un momento particolarmente interessante nel video è quando l’intelligenza artificiale sembra inventare un gioco chiamato “indovina il Paese”. Tuttavia, il blog di Google rivela che in realtà, all’IA sono state date istruzioni specifiche su come gestire questa parte della demo, e il gioco non è stato creato spontaneamente.
Questi dettagli sollevano interrogativi sulla reale portata delle capacità di Gemini, poiché sembra che l’intelligenza artificiale sia stata guidata da istruzioni e immagini fisse, piuttosto che rispondere in modo dinamico a situazioni in tempo reale.
È interessante notare che il video è stato rilasciato poco dopo il caos senza precedenti nel settore dell’intelligenza artificiale, con il licenziamento e la successiva riassunzione di Sam Altman come CEO di OpenAI. Mentre Google cerca di dimostrare le capacità di Gemini, resta da vedere come questo modello si posizioni rispetto al futuro GPT-4 di OpenAI, soprattutto considerando le recenti dichiarazioni di Altman sulla prossima versione della loro intelligenza artificiale.
Quando si parla di attività sedentarie, si tende spesso a collegarle a rischi per la salute, come obesità, malattie cardiovascolari…
Si torna a parlare di Apple e del suo interesse verso il mercato dei dispositivi pieghevoli. Nonostante l'azienda non abbia…
L'investimento da 140 miliardi di $ di AT&T in 5G, fibra ottica e tecnologia satellitare segna un passo trasformativo nella…
I pacemaker, dispositivi essenziali per regolare il battito cardiaco, hanno rappresentato una svolta nella medicina cardiovascolare. Tuttavia, alcune sfide tecniche,…
Indiana Jones e l'Antico Cerchio rappresenta una vera e propria avventura all'interno della quale gli sviluppatori di MachineGames (editore Bethesda), dopo i grandi…
La nostra capacità di adattarci agli eventi emotivi e di modificarne il comportamento in risposta rappresenta una delle funzioni più…