Un recente esperimento condotto dal team di Epoch AI ha riunito 60 esperti di matematica per sottoporre sei modelli avanzati di intelligenza artificiale (IA) a un test particolarmente arduo composto da 150 domande. Gli argomenti includevano teoria dei numeri, geometria algebrica e teoria delle categorie, spesso richiedendo giorni di lavoro per essere risolti da umani.
I modelli testati includevano gli ultimi linguaggi IA di OpenAI e DeepMind. Malgrado la possibilità di eseguire subroutine computazionali, i risultati sono stati deludenti: un tasso di risposte corrette del solo 2%.
“L’intelligenza artificiale è ancora lontana dall’essere in grado di risolvere questi problemi… ma mai dire mai,” ha commentato Kevin Buzzard dell’Imperial College di Londra.
I problemi dell’IA: contaminazione e arroganza
L’esperimento ha messo in luce due limiti significativi dell’IA:
- Contaminazione dei dati – Le IA tendono a “ricordare” soluzioni simili da database su cui sono addestrate, generando risposte influenzate anziché nuove deduzioni.
- Confidenza errata – I modelli mostrano spesso una sicurezza ingannevole nelle risposte errate, che rappresenta un problema critico nel loro utilizzo pratico.
Progressi notevoli ma limitati
Nonostante il fallimento in questo test, l’IA ha dimostrato impressionanti risultati in altri contesti:
- Il modello O1 di OpenAI, lanciato a settembre, ottiene punteggi superiori al 90% nei test di matematica standard.
- A luglio, un modello DeepMind ha ottenuto una medaglia d’argento alle Olimpiadi Internazionali di Matematica, un’impresa eccezionale per una IA.
Ma su problemi matematici di punta che richiedono creatività e comprensione profonda, come quelli affrontati nel test “brutale”, l’intelligenza artificiale è ben lontana dall’eguagliare la capacità umana.
Opportunità o minaccia?
L’avanzamento dell’IA nella matematica offre sia speranze sia preoccupazioni. Maia Fraser, matematica dell’Università di Ottawa, ha sottolineato che la possibilità che l’IA superi gli umani non è poi così distante:
“Abbiamo ora la possibilità di intervenire, plasmando queste tecnologie per supportare invece di sostituire la mente umana.”
Come ha osservato il matematico e filosofo Jeremy Avigad:
“L’IA è uno strumento straordinario per ampliare i limiti delle nostre domande, ma non è ancora pronta a rispondere al meglio delle nostre sfide.”
Per ora, il regno matematico resta saldo nelle mani umane, ma il confine si sta lentamente restringendo.
Foto di Gerd Altmann da Pixabay