News

Giappone alla Creazione di un ChatGPT più intelligente

Le potenzialità di ChatGPT e dei giganteschi modelli di linguaggio sembrano infinite, ma solo perché il giapponese non è la nostra lingua madre. Dall’altra parte del mondo, molti utenti giapponesi faticano a comunicare con questa intelligenza artificiale (IA) creata dalla società statunitense OpenAI.

 

La Complessità del Linguaggio Giapponese

Come afferma il famoso imprenditore Kazuhiko Nishi, “ChatGPT è ancora troppo ingenuo“. Spesso confonde le parole, genera caratteri strani al limite dell’assurdo o addirittura ignora la lingua a causa delle intricate sfumature del suo vocabolario. Questo ha spinto il Giappone a intraprendere la strada della creazione di una propria versione di ChatGPT: un chatbot in grado di comprendere i testi giapponesi e di generare risposte precise.

Un Chatbot più Radicato nella Cultura Giapponese

Il governo giapponese e i colossi tecnologici come NEC, Fujitsu e SoftBank stanno investendo centinaia di milioni di dollari nella realizzazione di sistemi di intelligenza artificiale basati sulla medesima tecnologia di base dei grandi modelli di linguaggio (LLM), ma con un orientamento specifico alla lingua giapponese, anziché alle traduzioni dall’inglese. Ecco che sorge la sfida, poiché esistono enormi differenze tra le due lingue, che possono ingannare anche la macchina più intelligente.

I LLM in inglese si basano su un alfabeto di sole 26 lettere, che si ripetono in molte altre lingue, come lo spagnolo o il portoghese. Tuttavia, il giapponese opera con due insiemi distinti di 48 caratteri di base, oltre a 2.136 caratteri cinesi o kanji di uso comune. Ogni carattere è diverso dagli altri per forma e significato, pertanto il ChatGPT che conosciamo spesso risulta inadeguato per il giapponese.

In questo contesto, la misteriosa capacità del chatbot di condurre conversazioni simili a quelle umane non trova riscontro in Giappone. Questo ha generato una preoccupazione: che i sistemi di intelligenza artificiale addestrati su insiemi di dati in altre lingue non siano in grado di apprendere la lingua giapponese. “La struttura delle frasi in giapponese è completamente diversa dall’inglese. ChatGPT deve tradurre una richiesta giapponese in inglese, trovare la risposta e poi tradurla nuovamente in giapponese. Date queste complessità, non sorprende che possa avere problemi con la lingua“, spiega Keisuke Sakaguchi, ricercatore presso l’Università di Tohoku

Ma è possibile creare una versione personalizzata di ChatGPT?

 

 

Sensibilità Culturale e LLM Giapponesi

Per valutare quanto i LLM siano sensibili alla cultura giapponese, un gruppo di ricercatori ha lanciato Rakuda: una classificazione di domande aperte su temi giapponesi. Il co-fondatore ha chiesto a ChatGPT di confrontare la fluidità culturale delle risposte e ha concluso che il miglior LLM giapponese open source si colloca al quarto posto in Rakuda, mentre il GPT-4 è al primo.

I LLM solitamente si nutrono di enormi quantità di dati provenienti da fonti pubbliche per apprendere i modelli del linguaggio naturale. Sono addestrati a prevedere la parola successiva basandosi sul contesto delle parole precedenti di un testo, pertanto possono adattarsi per riflettere con precisione le pratiche culturali e la lingua di un paese.

L’Istituto di Tecnologia di Tokyo, l’Università di Tohoku, Fujitsu e il gruppo di centri di ricerca RIKEN stanno ora utilizzando Fugaku, uno dei supercomputer più veloci al mondo, per sviluppare questa nuova versione del chatbot. Si prevede che verrà rilasciato l’anno prossimo come software open source per tutti gli utenti, a differenza di GPT-4 e di altri modelli proprietari.

Nel frattempo, altre aziende giapponesi stanno già mettendo sul mercato le proprie tecnologie LLM. Ora, se si chiede a ChatGPT di scrivere una email di candidatura in giapponese, potrebbe omettere le espressioni standard di cortesia e sembrare una traduzione ovvia dall’inglese. Tuttavia, presto un nuovo chatbot di IA potrebbe contribuire a colmare il divario tra il Giappone e il resto del mondo.

Foto di Mohamed Nohassi su Unsplash

Federica Vitale

Ho studiato Shakespeare all'Università e mi ritrovo a scrivere di tecnologia, smartphone, robot e accessori hi-tech da anni! La SEO? Per me è maschile, ma la rispetto ugualmente. Quando si suol dire "Sappiamo ciò che siamo ma non quello che potremmo essere" (Amleto, l'atto indovinatelo voi!)

Recent Posts

Apple: arriva la promo ufficiale del Black Friday

Anche quest'anno Apple ha deciso di lanciare una promozione speciale in occasione del Black Friday! Per ben 4 giorni, dal…

22 Novembre 2024

Ketamina a basso dosaggio: un trattamento salvavita per la depressione resistente

Negli ultimi anni, la ricerca clinica è rivolta all'attenzione sulla ketamina, un farmaco noto soprattutto come anestetico, per il suo…

22 Novembre 2024

Perché si chiama Black Friday? Origini e significato

Il termine Black Friday ha avuto origini molto diverse rispetto all’attuale associazione con lo shopping. Ecco una panoramica delle tappe…

22 Novembre 2024

Il linguaggio universale delle emozioni: i suoni che ci connettono oltre le parole

I suoni che esprimono emozioni, come risate, pianti, grida di sorpresa o gemme di dolore, sono un fenomeno umano che…

22 Novembre 2024

Cannabis e psicosi negli adolescenti: i percorsi metabolici alla base del rischio

L'uso della cannabis in adolescenza è da tempo associato a un aumento del rischio di sviluppo psicosi, ma i meccanismi…

21 Novembre 2024

Il Limite del Caos del Cervello: Verso Chip per Computer Ultraefficienti

Il cervello umano è un sistema straordinario che opera al limite tra ordine e caos, un punto in cui le…

21 Novembre 2024