fbpx Intelligenza artificiale e matematica: dal tre all'esame alla medaglia d'oro alle olimpiadi | Scienza in rete

Intelligenza artificiale e matematica: dal tre all'esame alla medaglia d'oro alle olimpiadi

Tempo di lettura: 6 mins

AlphaGeometry, IA sviluppata da DeepMind, si è dimostrata capace di risolvere il 75% dei problemi delle Olimpiadi Internazionali di Matematica, risultato paragonabile alle medaglie d'oro. È un risultato che evidenzia le potenzialità delle IA specializzate rispetto alle generaliste (come ChatGPT), pur sollevando importanti questioni sul futuro e sull'impatto dell'IA nella matematica e nella nostra quotidianità.

Cinque anni fa, nell'aprile 2019, un team di DeepMind (l'azienda che ha sviluppato AlphaGo, la prima intelligenza artificiale in grado di battere un essere umano al gioco di Go) ha sottoposto a una rete neurale, addestrata appositamente per risolvere esami di matematica, una verifica di seconda superiore. Il risultato? Un deludente F, l'equivalente italiano del tre.  All'inizio del 2024, in un periodo in cui non si fa altro che parlare di intelligenza artificiale, è stato ottenuto un risultato diametralmente opposto: una IA sviluppata da DeepMind in collaborazione con l'università di New York ha risolto correttamente il 75% dei problemi di geometria delle Olimpiadi Internazionali di Matematica (International Mathematical Olympiad, IMO), la più prestigiosa gara internazionale di matematica per studenti delle scuole superiori, raggiungendo i livelli delle medaglie d'oro. Che cosa ci dice questo ennesimo trionfo dell'intelligenza artificiale? Si tratta di una nuova conferma dell'obsolescenza del pensiero umano, oppure di un successo tutto sommato prevedibile?

Per capirlo, dobbiamo andare oltre i titoli sensazionalistici e scoprire com'è fatta AlphaGeometry, l'IA che ha risolto brillantemente i problemi delle IMO.

Anatomia di un'IA

Il nome "intelligenza artificiale" è evocativo, ma allo stesso tempo molto generico: come una bicicletta, un'automobile e un motoscafo sono tutti e tre veicoli, ma con utilizzi molto diversi tra loro, così ci sono tipi di intelligenza artificiale radicalmente diversi e con ambiti di applicabilità altrettanto vari. Dal lancio di ChatGPT, siamo diventati tutti familiari con il termine 'chatbot' (o, per chi ama gli aspetti tecnici, con i Large Language Models, LLM). Si tratta di IA che, in prima approssimazione, generano testi basandosi sull'analisi delle frequenze di enormi quantità di frasi (una stima indica che ChatGPT 3 è stato addestrato su non meno di 500 GB di dati, che corrispondono all'incirca a 100 milioni di pagine scritte).

Non tutta l'IA è riconducibile agli LLM, però. AlphaGeometry, per esempio, sfrutta un principio diverso. In prima approssimazione, si tratta di un sistema composto da due parti: un software tradizionale per la dimostrazione automatica di teoremi, cui è affiancato un LLM addestrato esclusivamente su dimostrazioni di geometria. I problemi di geometria delle IMO vanno risolti mediante delle dimostrazioni. Bisogna, cioè, partire dalle ipotesi fornite da ciascun problema e, sulla loro base, costruire un ragionamento che mostri come mai esse implichino la verità delle conclusioni richieste. Questo tipo di ragionamento deduttivo è, in misura maggiore o minore per diverse branche della matematica, già in parte traducibile in termini algoritmici: esistono fin dagli anni Sessanta del Novecento dei software in grado di dimostrare automaticamente teoremi (ma le basi teoriche precedono addirittura la nascita dei primi computer).

Di quando in quando, questi software tradizionali che non si basano su IA richiedono un aiuto esterno. Fino a pochi anni fa, questo aiuto era fornito esclusivamente da utenti umani. La novità di AlphaGeometry è di aver sostituito agli utenti umani un LLM addestrato specificamente su testi di geometria, con il compito di fornire nuovi dati in input al software per dimostrare teoremi qualora questo si bloccasse. Per esempio, potrebbe suggerire di effettuare delle costruzioni ausiliarie che il dimostratore di teoremi non è in grado di effettuare in autonomia. Il successo di AlphaGeometry alle IMO si può quindi parafrasare così: il team di DeepMind è riuscito ad addestrare un LLM in grado di supportare in modo eccellente un tradizionale dimostratore automatico di teoremi di geometria.

Non si tratta di un risultato isolato: al contrario, già nel 2019 un team di scienziati di Google aveva sviluppato HOList, un'IA per la dimostrazione automatica di teoremi che è stata in grado di ricavare senza alcun aiuto più di 1.200 nuovi risultati corretti. La struttura era simile a quella di AlphaGeometry: a un software tradizionale per effettuare dimostrazioni è stata affiancata un'IA, in quel caso basata sul deep learning.

IA specializzate e IA generaliste

AlphaGeometry e HOList sono IA specializzate. Il termine indica IA addestrate per eseguire pochi compiti specifici, in questo caso dimostrare teoremi. Il termine "specializzate" è contrapposto a "generaliste", che indica invece IA non ottimizzate per compiti particolari. ChatGPT è un esempio di IA generalista, e difficilmente la vedremo vincere medaglie d'oro alle Olimpiadi Internazionali di Matematica. Bisogna però riconoscere che le prestazioni delle IA generaliste, anche in ambito matematico, migliorano a ogni nuova versione rilasciata.

Non bisogna comunque dimenticarne i limiti di applicabilità: si tratta di sistemi che generano degli output spesso generici e che, a un'analisi attenta, si rivelano lacunosi. Inoltre, non consiglierei a nessuno di effettuare calcoli con gli LLM: le cifre del risultato vengono scelte in modo probabilistico e c'è sempre una percentuale di errore, che cresce molto più rapidamente di quanto non cresca la complessità delle operazioni. I software tradizionali di calcolo, basati su algoritmi, rimangono la scelta migliore per questo tipo di compiti: non commettono errori e hanno tempi di esecuzione ottimizzati (e, di conseguenza, anche un costo energetico inferiore).

Quale futuro per l'IA in matematica?

Nonostante le IA, sia specializzate sia generaliste, abbiano ancora diversi limiti, non è possibile sottrarsi alla domanda: come l'IA cambierà la nostra quotidianità? Se lo stanno chiedendo in molti, tra cui matematici di altissimo livello. Per esempio, i numeri di aprile e luglio 2024 del Bulletin of the American Mathematical Society, una delle più prestigiose riviste del settore, sono interamente dedicati a come l'IA cambierà la pratica matematica. Si tratta di un'occasione unica per fermarsi a riflettere su che cosa sia la matematica, quale sia il ruolo delle persone che la praticano quotidianamente, e che valore attribuire alle dimostrazioni (a prescindere da chi le abbia ottenute: esseri umani o software).

In realtà, i matematici non sono estranei alle riflessioni sul ruolo delle dimostrazioni: una breve panoramica di alcuni punti di vista autorevoli è presentata qui. Oggi però occorre affrontare questo tema alla luce della capacità delle IA di sfornare nuove dimostrazioni di altissimo livello a una velocità vertiginosa. Non si tratta solo di domande filosofiche: Terence Tao, medaglia Fields 2006 e più giovane medaglia d'oro alle IMO, è stato incaricato dalla Casa Bianca di guidare delle sperimentazioni per capire quale può essere l'impatto dell'IA nelle scienze; queste ricerche daranno origine a raccomandazioni che influenzeranno le scelte politiche in tema di IA.

IA: prevederne il futuro o vivere il presente?

Pur tenendo conto della sua storia, iniziata nella prima metà del Novecento, l'IA è ancora nella sua infanzia: ogni previsione su quali possano essere i suoi sviluppi futuri rischia di rivelarsi sbagliata. In ogni caso, il periodo di maturazione di questi strumenti non si può evitare e va accolto, pur con tutta la complessità e i dilemmi che solleva. Se non accoglieremo la sfida, saranno altri soggetti, a partire dagli stessi sviluppatori delle IA, a dettare l'agenda e a tracciare la rotta alla quale tutti dovremo adeguarci (una rotta ispirata più da interessi economici e dal motto move fast and break things che non da ideali filantropici).

Un'alternativa più interessante arriva proprio da uno dei contributi al numero di aprile del Bulletin of the American Mathematical Society: riecheggiando Thoreau, la sfida che ci pone l'IA è di «vivere deliberatamente, affrontare solo i fatti essenziali della vita», demandando alle macchine tutto ciò che non è all'altezza dell'intelligenza umana.

Un ringraziamento speciale a Chiara Roglieri per le interessanti discussioni sull’IA e per aver condiviso l’articolo di Scientific American su AlphaGemoetry.

 


Scienza in rete è un giornale senza pubblicità e aperto a tutti per garantire l’indipendenza dell’informazione e il diritto universale alla cittadinanza scientifica. Contribuisci a dar voce alla ricerca sostenendo Scienza in rete. In questo modo, potrai entrare a far parte della nostra comunità e condividere il nostro percorso. Clicca sul pulsante e scegli liberamente quanto donare! Anche una piccola somma è importante. Se vuoi fare una donazione ricorrente, ci consenti di programmare meglio il nostro lavoro e resti comunque libero di interromperla quando credi.


prossimo articolo

Solo il 3,5% delle città europee monitorate ha una buona qualità dell’aria

Inquinamento atmosferico cittadino

Solo 13 città europee tra quelle monitorate su 370 circa rispettano il limite OMS di 5 microgrammi per metro cubo annui di PM2,5. La svedese Uppsala è la prima. Nessuna di queste è italiana. Nonostante la qualità dell'aria e le morti associate sono in continuo calo in Europa, serve fare di più.

Immagine: Uppsala, Lithography by Alexander Nay

La maggior parte delle città europee monitorate non rispetta il nuovo limite dell’OMS del 2021 di 5 microgrammi per metro cubo all’anno di concentrazione di PM2,5. L’esposizione a particolato atmosferico causa accresce il rischio di malattie cardiovascolari, respiratorie, sviluppo di tumori, effetti sul sistema nervoso, effetti sulla gravidanza.