Immagine di rawpixel.com su Freepik
Nelle ultime 19 ore, un video virale di Google, che presentava il modello di intelligenza artificiale chiamato Gemini, ha catturato l’attenzione di oltre 1,6 milioni di spettatori su YouTube. Tuttavia, le sorprendenti capacità mostrate nel video potrebbero non essere così impressionanti come sembrano inizialmente.
Google ha ammesso che il video è stato modificato per creare un aspetto più accattivante, rivelando che le risposte dell’intelligenza artificiale sono state accelerate a fini dimostrativi. La descrizione del video includeva questa informazione, ma il riconoscimento vocale e video in tempo reale non erano affatto parte delle abilità di Gemini.
In un post sul blog pubblicato contemporaneamente alla demo, Google ha svelato il dietro le quinte della realizzazione del video. Il gigante di Mountain View Google ha confermato che l’intelligenza artificiale è stata stimolata utilizzando fotogrammi di immagini fisse dal video e inviando suggerimenti tramite testo.
Il video mostra momenti chiave in cui l’intelligenza artificiale risponde alle domande vocali e visive dell’utente. Tuttavia, ciò che sembra essere un’interazione in tempo reale è stato creato utilizzando immagini fisse e istruzioni basate su testo. Ad esempio, la corretta identificazione di un oggetto è stata ottenuta mostrando all’IA un’immagine statica e fornendo un messaggio di testo che spiegava le caratteristiche dell’oggetto.
Google ha specificato che la demo è stata realizzata catturando riprese dal video originale, accorciando le sequenze e utilizzando immagini fisse. La voce fuori campo è stata direttamente tratta dalle istruzioni scritte inserite in Gemini.
Un momento particolarmente interessante nel video è quando l’intelligenza artificiale sembra inventare un gioco chiamato “indovina il Paese”. Tuttavia, il blog di Google rivela che in realtà, all’IA sono state date istruzioni specifiche su come gestire questa parte della demo, e il gioco non è stato creato spontaneamente.
Questi dettagli sollevano interrogativi sulla reale portata delle capacità di Gemini, poiché sembra che l’intelligenza artificiale sia stata guidata da istruzioni e immagini fisse, piuttosto che rispondere in modo dinamico a situazioni in tempo reale.
È interessante notare che il video è stato rilasciato poco dopo il caos senza precedenti nel settore dell’intelligenza artificiale, con il licenziamento e la successiva riassunzione di Sam Altman come CEO di OpenAI. Mentre Google cerca di dimostrare le capacità di Gemini, resta da vedere come questo modello si posizioni rispetto al futuro GPT-4 di OpenAI, soprattutto considerando le recenti dichiarazioni di Altman sulla prossima versione della loro intelligenza artificiale.
Nel cuore dell’Irlanda orientale, a circa 50 km da Dublino, sorge Newgrange, un maestoso tumulo funerario costruito intorno al 3100…
L’ipotesi rivoluzionaria della “Quantum Memory Matrix” La fisica moderna potrebbe essere sull’orlo di una nuova svolta. Florian Neukart, professore e…
TikTok è diventato un punto di riferimento per milioni di adolescenti in cerca di informazioni e risposte. Tra i contenuti…
L’esercizio fisico è da tempo considerato uno dei modi più efficaci per mantenere il cervello sano e rallentare il declino…
Un recente studio pubblicato su PNAS rivela che gli smartwatch possono rilevare i primi segnali di malattia ore prima che…
Siete tra coloro che stanno aspettando il lancio di un nuovo modello di AirPods Pro? Ci sono buone notizie per…