Microsoft, il riconoscimento vocale artificiale affidabile come esseri umani

I ricercatori del team Microsoft Artificial Intelligence and Research hanno annunciato che il loro sistema di riconoscimento vocale è sceso ad un margine d’errore del 5.9%, praticamente il medesimo in cui incorre un dattilografo professionista nel corso di una trascrizione

Il riconoscimento vocale targato Microsoft sta diventando “quasi umano”. Un team di ricercatori del colosso di Redmond sta infatti lavorando ad un nuovo sistema di riconoscimento vocale che riesce da interpretare le frasi con la stessa precisione di un essere umano.

Il livello di precisione “umano” è stato confermato da una prova ad hoc molto popolare nel settore e denominata riconoscimento vocale Switchboard. Il tasso di errore rilevato durante il test è stato di sole 5.9 parole su cento, il che è quasi quanto quello di una persona.

Si tratta del valore migliore mai fatto registrare sino ad oggi da parte di una tecnologia di riconoscimento vocale, migliore di 0.4 punti percentuale rispetto all’ultimo test di solo un mese fa.

Assistente vocale Microsoft News margine errore umano

La nuova tecnologia di Microsoft riesce ad essere così precisa grazie ad un sistema di modelli di linguaggio neurale che associano parole simili fra loro. Grazie a questi nuovi ritrovati tecnologici Microsoft potrà fare importanti passi in avanti sul fronte del riconoscimento vocale, migliorando, ad esempio, l’affidabilità dell’assistente virtuale Cortana e i software per la dettatura vocale.

Ovviamente – come spiegano i ricercatori – la strada da fare è ancora lunga e questo è solo l’inizio. Se è infatti vero che il riconoscimento è migliorato nella vita di tutti i giorni la tecnologia si rivela spesso ancora molto macchinosa nell’utilizzo e fatica a districarsi quando si trova di fronte ad accenti differenti o timbri vocali un po’ particolari.

La “parità con l’essere umano” è raggiunta. Gonfiando il petto di meritato orgoglio, il leader del progetto Cortana Xuedong Huang ha annunciato lo storico traguardo raggiunto dal sistema di riconoscimento vocale disponibile per le piattaforme Windows 10 e Xbox One: il tasso d’errore è sceso di un punto percentuale, dal 6.9 al 5.9%.

LEGGI ANCHE: Microsoft lancia ufficialmente Cortana su iOS ed Android

Per ultimo ma non meno importante è che anche se il sistema di riconoscimento vocale riesce a capire la parola che viene pronunciata, capirne il significato è tutta un’altra storia.