fbpx Superato il test di Turing. Ed è subito polemica | Scienza in rete

Superato il test di Turing. Ed è subito polemica

Primary tabs

Read time: 5 mins

La notizia sta facendo letteralmente il giro del globo: come annunciato dal comunicato stampa della Reading University, in Gran Bretagna, sabato 7 giugno un chatbot (ovvero un programma sviluppato per simulare una conversazione umana) ha superato per la prima volta nella storia il test di Turing.
Il chatbot in questione, messo a punto a San Pietroburgo da Vladimir Veselov ed Eugene Demchenko a partire dal 2001, simula un tredicenne ucraino, ed è stato chiamato Eugene Goostman. “Una storica pietra miliare nel campo dell’intelligenza artificiale”: così recita il comunicato. Ma è davvero di questo che si tratta? Sono in molti a dubitarne.

Che cos’è il test di Turing

Alan Turing, matematico inglese tra i padri fondatori dell’informatica moderna, propose in un saggio del 1950 quello che chiamò “Gioco dell’imitazione”. Il gioco prevede tre persone: A e B (due persone di sesso opposto) e C (l’esaminatore), che può comunicare con entrambi senza poterli vedere, attraverso telescrivente (oggi diremmo “via chat”). Il gioco sta nel vedere con che frequenza C riesce a distinguere A da B. Qui entra in gioco la domanda di Turing: “Che cosa succederebbe se una macchina sostituisse A? L’esaminatore sbaglierebbe con la stessa frequenza?”. Nella sostanza, è questo il test di Turing nella sua versione originale.
Il test superato da Eugene, però, si basa su un altro punto del saggio di Turing: “Credo che entro cinquant’anni sarà possibile programmare computer in grado di partecipare al Gioco dell’imitazione così bene che un interrogante medio non avrà più del 70% di possibilità di operare la corretta identificazione dopo cinque minuti di domande”. Questa, per motivi storici, è diventata la modalità ufficiale per la somministrazione del test di Turing.
Ed è quello che è successo il 7 giugno presso la Royal Society di Londra: 30 esaminatori hanno conversato in parallelo con 5 chatbot e 5 esseri umani, senza alcuna restrizione sugli argomenti di discussione, per un totale di 300 conversazioni. Eugene ha sbaragliato gli sfidanti facendosi scambiare per un effettivo ragazzino ucraino dal 33% degli esaminatori: abbastanza per superare il test di Turing. Qualche esperto in materia potrebbe ricordare che nel 2011 il chatbot Cleverbot raggiunse la percentuale record del 59,3%, ma essendo stato programmato con conversazioni “preconfezionate” si decise che tale prestazione, per quanto notevole, non potesse essere considerata come un effettivo superamento del test.

Molte critiche

Il risultato di Eugene è stato accolto da una larga parte dei commentatori con una forte ondata di scetticismo. Le prime critiche a fioccare sono state di tipo tecnico. In particolare: se un chatbot si finge un ragazzino ucraino, le probabilità di superare il test sono molto più alte. Questo per vari motivi: il suo inglese poco fluente non desterà particolare sospetto (perché si spaccia per ucraino), e analogamente poca diffidenza sorgerà per la sua scarsa capacità di rispondere a domande complesse (si spaccia per un tredicenne). Questo contraddice in qualche modo la regola per cui le discussioni dovessero essere totalmente libere, senza restrizioni.
Il motivo? Se pensaste di conversare con un adolescente che non parla la vostra lingua, probabilmente ci pensereste da soli ad auto-limitarvi. Tutto questo è troppo poco, probabilmente, per poter affermare che i realizzatori di Eugene abbiano “barato”. Ma a queste critiche se ne aggiungono altre di natura “politica”. In primo luogo è quanto mai dubbia la reputazione di Kevin Warwick, uno degli organizzatori della competizione e professore di cibernetica a Reading, noto per essersi definito “il primo cyborg” dopo essersi piantato un chip in un braccio. Secondariamente, molti sono perplessi nel constatare che il trionfo di Eugene sia avvenuto proprio durante il 60° anniversario della morte di Turing, nonché a pochi mesi dal famoso royal pardon, come se si intendesse “cavalcare” la figura di Turing per ottenere visibilità.

Ma quindi Eugene sa pensare?

Lo scetticismo nei confronti del risultato di Eugene non finisce qui, perché molte questioni rimangono aperte sulla validità stessa del test di Turing, nonché sul suo senso effettivo. Qualcuno di voi, per esempio, avrà storto il naso nello scoprire che il test di Turing superato da Eugene non è il test originale ideato da Turing, ma un test basato su una previsione del matematico britannico, su una semplice speculazione di un futuro di-lì-a-mezzo-secolo. Non avreste tutti i torti: per qualcuno, in effetti, questo argomento sarebbe già sufficiente a chiudere qui il discorso.
Ma liquidare così la questione impedirebbe di coglierne gli aspetti più interessanti, anche da un punto di vista filosofico.
Turing fu senz’altro un genio, ma visse in un’epoca in cui il concetto di “intelligenza artificiale” era molto più grezzo di quello odierno. La filosofia alla base delle idee di Turing poggiava su un assunto principale: la mente è un fenomeno meccanico, pertanto l’intelligenza è sostanzialmente una questione computazionale.
Queste idee, valide negli anni Cinquanta, ora sono decisamente superate. I teorici dell’intelligenza artificiale (e dell’intelligenza cognitiva tout court) sostengono da tempo che questo fenomeno è più complesso e comprende svariati concetti come l’apprendimento, il problem solving, la rivelazione di pattern, la capacità di dimostrazione per via logica ecc. Insomma, l’intelligenza non sembra essere puramente ascrivibile al meccanicismo, che è il presupposto alla base del test di Turing. Da questo punto di vista è quasi impossibile sostenere che un chatbot, per quanto straordinario come Eugene, sia realmente intelligente nel senso cognitivo del termine. Non ci sono motivi per credere che un chatbot sia realmente in grado di pensare, né tantomeno che sia dotato di auto-coscienza.
Allo stato attuale delle cose, Eugene è “soltanto” un programma che simula molto bene il modo umano di conversare; non è più intelligente di un qualsiasi altro programma addestrato a fare altre cose che a noi sembrano meno “mentali” o meno “umane”. Proprio per i motivi di cui sopra, secondo le moderne teorie sull’intelligenza artificiale non sarebbe la comunicazione, bensì il comportamento, lo strumento più efficace per trasmettere l’intelligenza.
Se l’intelligenza è anche problem solving, per esempio, come può una macchina dimostrarlo semplicemente comunicando? Persino noi umani avremmo enormi difficoltà a rispondere a domande del tipo “In che modo ti viene un’idea nuova?” oppure “Come fai a scegliere la soluzione migliore a un problema?”.
È evidente che il comportamento dovrà stare alla base di nuovi, e più raffinati, test sull’intelligenza artificiale. La prestazione di Eugene, insomma, non è probabilmente la “pietra miliare” annunciata, ma è un risultato notevole, se non altro – come hanno osservato in molti – perché ora sappiamo che sta diventando sempre più facile confondere chatbot ed esseri umani, con tutte le conseguenze immaginabili nell’area più o meno fantascientifica del cyber-crime.
Ben venga dunque una notizia come questa, che ci fa riflettere su queste tematiche e ci fa prendere coscienza di quanto il test di Turing, troppo spesso mitizzato, sia in realtà un relitto degli albori di un campo che sta evolvendo rapidamente. E che deve continuare a farlo.

Articoli correlati

Scienza in rete è un giornale senza pubblicità e aperto a tutti per garantire l’indipendenza dell’informazione e il diritto universale alla cittadinanza scientifica. Contribuisci a dar voce alla ricerca sostenendo Scienza in rete. In questo modo, potrai entrare a far parte della nostra comunità e condividere il nostro percorso. Clicca sul pulsante e scegli liberamente quanto donare! Anche una piccola somma è importante. Se vuoi fare una donazione ricorrente, ci consenti di programmare meglio il nostro lavoro e resti comunque libero di interromperla quando credi.


prossimo articolo

Superdiffusore: il Lancet ricostruisce la storia di una parola che ha avuto molti significati

Un cerchio tutto formato di capocchie di spillo bianche con al centro un disco tutto formato da capocchie di spillo rosse

“Superdiffusore”. Un termine che in seguito all’epidemia di Covid abbiamo imparato a conoscere tutti. Ma da dove nasce e che cosa significa esattamente? La risposta è meno facile di quello che potrebbe sembrare. Una Historical review pubblicata sul Lancet nell’ottobre scorso ha ripercorso l’articolata storia del termine super diffusore (super spreader), esaminando i diversi contesti in cui si è affermato nella comunicazione su argomenti medici e riflettendo sulla sua natura e sul suo significato. Crediti immagine: DALL-E by ChatGPT 

L’autorevole vocabolario Treccani definisca il termine superdiffusore in maniera univoca: “in caso di epidemia, persona che trasmette il virus a un numero più alto di individui rispetto alle altre”. Un recente articolo del Lancet elenca almeno quattro significati del termine, ormai familiare anche tra il grande pubblico: