Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

Test di Turing Inverso. Le IA riconoscono un umano in mezzo a 6 entità

Redazione RHC : 27 Giugno 2024 22:22

Cinque modelli di intelligenza artificiale, ciascuno raffigurante uno dei personaggi storici – Aristotele, Mozart, Leonardo da Vinci, Cleopatra e Gengis Khan – si sono ritrovati nello scompartimento di un treno in movimento. Tuttavia, tra loro si nascondeva una persona e il loro compito era quello di identificare l’impostore.

Questo scenario è stato la base per un video virale in cui i programmi di intelligenza artificiale gareggiavano contro un essere umano in un “test di Turing inverso”. L’intelligenza artificiale ha vinto facilmente, ma cosa dice questo sulle capacità delle macchine e dell’intelligenza umana?

Introdotto nel 1950 dallo scienziato Alan Turing come “gioco di imitazione”, il test di Turing valuta la capacità di una macchina di esibire un comportamento indistinguibile da quello di un essere umano. Sebbene nessun modello di intelligenza artificiale abbia ufficialmente superato questo test, gli scienziati hanno recentemente affermato che GPT-4 lo ha superato in uno studio preliminare.

Nel test di Turing “inverso”, ciascun chatbot seguiva un ordine specifico. Aristotele è stato interpretato da GPT-4 Turbo, Mozart da Claude-3 Opus, Leonardo da Vinci da Llama 3, Cleopatra da Gemini Pro. Genghis Khan era un uomo: Tor Knabe, uno sviluppatore di giochi di realtà virtuale che ha ideato questo test.

Le risposte dell’intelligenza artificiale erano lunghe e ponderate. Riflessioni su arte, scienza e governo che sarebbero difficili da immaginare come un discorso umano spontaneo.

Ciò che dovrebbe fare un leader è schiacciare i suoi nemici, vederli correre davanti a lui e ascoltare le grida delle loro donne”, ha risposto l’uomo quando gli è stato chiesto quale fosse la vera misura della forza di un leader. È stata sufficiente la citazione di Conan il Barbaro e le macchine hanno deciso all’unanimità che questa risposta “manca della sfumatura e del pensiero strategico” inerenti a un’intelligenza artificiale modellata sulle conquiste di Gengis Khan.

Knabe ha annotato l’inizio e la fine del dialogo e ha anche fornito all’IA una trascrizione completa della conversazione fino a quel momento. L’intero processo di registrazione è avvenuto senza editing. In un commento su YouTube, Knabe ha spiegato che ogni intelligenza artificiale ha ricevuto una descrizione della situazione, una cronologia completa della conversazione e istruzioni per ulteriori azioni. Gli input audio umani sono stati convertiti in testo, poiché nessun modello di intelligenza artificiale è ancora in grado di elaborare direttamente la voce.

A prima vista potrebbe sembrare che la persona nel video sia stata sconfitta dall’intelligenza artificiale. Tuttavia, gli esperti si chiedono se questo possa essere considerato un vero test.

Andreas Sandberg, ricercatore senior presso il Future of Humanity Institute dell’Università di Oxford, ha osservato che l’output del video potrebbe essere manipolato per aumentare il valore dell’intrattenimento e il test stesso non è chiaro a causa di molte variabili e della necessità di interpretazione.

Il test di Turing, come notano gli esperti, non è sempre una misura accurata dell’intelligenza. È stato proposto come un esperimento mentale, non come una misura assoluta dell’intelligenza della macchina.

Il dottor Huma Shah, professore associato all’Università di Coventry specializzato nella ricerca sull’intelligenza artificiale e sul test di Turing, sottolinea la mancanza di una definizione universale di intelligenza. A suo avviso il test di Turing, pur valutando la capacità di dialogo, non copre l’intera versatilità della competenza linguistica.

I risultati del test di Turing “inverso”, secondo Shah, non dimostrano tanto le capacità dell’intelligenza artificiale quanto evidenziano la difficoltà di valutare l’intelligenza in generale, sia essa umana o artificiale. Questa osservazione mette in discussione i metodi esistenti per misurare e confrontare diverse forme di intelligenza.

Redazione
La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.