Lo scorso anno Maneesh Agrawala, docente di Scienze Informatiche alla Stanford University, ha contribuito a sviluppare una tecnologia di sincronizzazione labiale che ha permesso di ottenere video falsi modificando le parole dei relatori in modo quasi impercettibile. Questo strumento, grazie all’intelligenza artificiale, era in grado di inserire parole che una persona non aveva mai pronunciato, in qualsiasi punto della frase, o togliere parole che aveva pronunciato. Ad occhio nudo, e anche a molti sistemi informatizzati, non ci sarebbe stato niente di strano.

L’intelligenza artificiale per combattere i video falsi

Ma questa tecnologia ha anche fornito nuove e preoccupanti opportunità per creare e diffondere video falsi difficili da smascherare, con il preciso scopo di distorcere la verità. Un recente video del partito repubblicano degli Stati Uniti, ad esempio, ha utilizzato una tecnica più grossolana per rielaborare un’intervista al Vicepresidente Joe Biden.

La scorsa estate, Agrawala e i suoi colleghi di Stanford e della UC Berkeley hanno presentato un approccio basato sull’intelligenza artificiale per riconoscere la tecnologia di sincronizzazione labiale. Il nuovo programma è in grado di individuare con precisione oltre l’80% dei movimenti falsi, riconoscendo minuscoli disallineamenti tra i suoni che le persone emettono e la forma della loro bocca.

L’idea alla base dello studio era quella di cercare le incongruenze tra visemi, cioè i movimenti espressivi del viso mentre si parla, e fonemi, i suoni emessi. In particolare, i ricercatori hanno osservato la bocca della persona quando emetteva i suoni di una “B”, una “M” o una “P”, operazione pressoché impossibile da eseguire senza chiudere saldamente le labbra.

Dapprima i ricercatori hanno tentato di eseguire un’analisi manuale di alcuni fotogrammi dei video. Questa tecnica funzionava, ma richiedeva molto lavoro e tempo. Per questo, sono passati a testare una rete neurale basata sull’intelligenza artificiale per condurre la stessa analisi dopo averla provata a lungo sui video dell’ex presidente Barack Obama. La rete neurale ha individuato ben oltre il 90% delle sincronizzazioni labiali che coinvolgevano lo stesso Obama, anche se, curiosamente, la percentuale di precisione è scesa all’81% circa nell’applicazione ad altri relatori.

