L'intelligenza artificiale generale esiste già oggi, solo che non ce ne accorgiamo

Non è fantascienza: il dibattito è già in corso

Non si tratta dell’ennesima visione futuristica tratta dai film di fantascienza. È una disputa concreta tra ricercatori: i modelli di intelligenza artificiale attuali — compresi i chatbot più diffusi — soddisfano già le condizioni che noi stessi abbiamo fissato per un’intelligenza paragonabile a quella umana?

Un recente articolo pubblicato su una prestigiosa rivista scientifica ribalta completamente il modo in cui misuriamo la “vera” intelligenza delle macchine. Un gruppo di ricercatori dell’Università della California avanza una tesi controversa: l’intelligenza artificiale generale (AGI – artificial general intelligence) non è un traguardo all’orizzonte, ma un fatto già compiuto.

Secondo loro, i sistemi odierni basati su grandi modelli linguistici (LLM) hanno raggiunto un livello di funzionamento che in pratica soddisfa la definizione di intelligenza generale. Fino a poco tempo fa, la maggior parte delle aziende tecnologiche — da OpenAI ai giganti della Silicon Valley — parlava dell’AGI come del Santo Graal. C’era chi le dava un decennio, chi un anno o due. Parallelamente, una parte dei ricercatori sosteneva che l’architettura LLM fosse un vicolo cieco e che la vera svolta sarebbe arrivata solo con complessi “modelli del mondo” capaci di riflettere meglio la realtà fisica e sociale.

La nuova pubblicazione pone la domanda da una prospettiva completamente diversa: e se stessimo tutti guardando nella direzione sbagliata, senza accorgerci che la soglia tanto attesa è già stata superata? Gli autori sostengono che invece di chiederci “quando raggiungeremo l’AGI” dovremmo interrogarci se non la stiamo già descrivendo proprio adesso, al tempo presente.

Il Test di Turing: una vecchia soglia, nuovi risultati

Uno degli argomenti chiave dei ricercatori è il Test di Turing, la classica concezione del 1950. Esso presuppone che se una persona, durante una conversazione scritta, non riesce a distinguere una macchina da un altro essere umano, possiamo parlare di comportamento intelligente della macchina.

Nell’ultima generazione di chatbot — come i modelli avanzati del tipo ChatGPT e altri sistemi conversazionali sofisticati — iniziamo a vedere situazioni in cui le persone considerano l’IA come un essere umano più spesso di quanto farebbero con reali interlocutori umani. Qualche anno fa, un simile risultato sarebbe stato considerato prova inconfutabile del raggiungimento dell’intelligenza generale delle macchine.

Oggi, paradossalmente, l’asticella viene continuamente alzata. Quando i sistemi cominciano a soddisfare i criteri precedenti, una parte degli esperti sposta le definizioni e richiede ulteriori proprietà dell’intelligenza “vera”. Questo cambiamento nella misurazione dell’intelligenza riflette il nostro rapporto mutevole con la tecnologia e le aspettative che riponiamo nelle macchine.

Dove finisce l’AGI e inizia la superintelligenza

I ricercatori propongono una distinzione netta tra intelligenza artificiale generale e superintelligenza. È un punto essenziale, perché nel dibattito pubblico questi concetti vengono spesso mescolati. Gli autori affermano che riguardo al primo di questi punti siamo già molto vicini — o addirittura oltre la soglia.

Gli LLM di oggi gestiscono programmazione, analisi legale, creazione di contenuti, traduzioni e persino ragionamento matematico — spesso al livello di specialisti. Secondo questa logica, non dobbiamo aspettare che l’IA inizi a battere i record dei geni in ogni campo. Per riconoscere l’intelligenza generale è sufficiente un livello paragonabile a quello di una persona media e ben istruita, con punti di forza in certi compiti e debolezze in altri.

Le caratteristiche chiave che distinguono questi due concetti:

L’AGI gestisce un ampio spettro di compiti al livello umano
La superintelligenza supera significativamente le capacità umane in tutti i settori
L’AGI può presentare debolezze in determinati ambiti
La superintelligenza è in grado di risolvere problemi al di là della portata umana
L’AGI lavora con dati e schemi acquisiti durante il suo addestramento
La superintelligenza genera concetti e teorie completamente nuovi
L’AGI richiede controllo e validazione da parte dell’uomo
La superintelligenza sarebbe autonoma nel processo decisionale

Gli autori sottolineano che aspettarsi che l’AGI innondi la scienza ogni settimana di scoperte rivoluzionarie è irrealistico — non lo pretendiamo nemmeno dalle persone che consideriamo intelligenti. Ciò che conta è la capacità funzionale di affrontare compiti diversificati, non l’eccellenza assoluta in ogni area simultaneamente.

Il “pappagallo stocastico” e le altre obiezioni agli LLM

I detrattori dei modelli linguistici attuali ripetono che si tratta essenzialmente di “pappagalli statistici”: sistemi privi di vera comprensione, che si limitano a combinare frammenti di testo sulla base della probabilità. Secondo loro, l’IA non genera pensieri, si limita ad assemblare frasi dai dati di addestramento.

La nuova analisi tenta di confutare sistematicamente tali obiezioni. Gli autori evidenziano diversi elementi difficili da liquidare con l’argomento “è solo ripetizione di dati”. Tra questi figurano la risoluzione di compiti nuovi e mai visti prima in matematica e logica, la capacità di trasferire conoscenze da un dominio all’altro, la costruzione di modelli causali coerenti durante una conversazione e la gestione di descrizioni di situazioni che richiedono intuizione fisica.

Se un sistema riesce a dedurre la soluzione corretta a un problema che non era presente nei dati di addestramento, è difficile sostenere che “stia semplicemente citando”. Questo non significa che l’IA comprenda il mondo come un essere umano, ma suggerisce che stia accadendo qualcosa di più che una semplice incollatura di frasi. I ricercatori dell’Università della California hanno documentato casi in cui i modelli GPT-4 e Claude risolvevano enigmi logici in modi diversi rispetto agli schemi presenti nei database disponibili.

L’intelligenza richiede un corpo e i sensi?

Una delle linee difensive più cariche di emotività recita: “L’IA non ha un corpo, quindi non è vera intelligenza”. L’essere umano apprende attraverso il movimento, il tatto, il dolore, i sensi. Le macchine operano principalmente con testo, immagini e suoni sotto forma di dati.

Gli autori dell’articolo sono convinti che l’assenza di un corpo fisico non escluda l’intelligenza generale. Sottolineano che i modelli attuali sono capaci di prevedere le conseguenze di azioni, analizzare scene video, interpretare fotografie e registrazioni audio. A questo si aggiunge il settore in rapida crescita denominato Physical AI, ovvero l’integrazione di modelli avanzati con i robot.

I robot dotati di sensori e telecamere iniziano a coniugare le capacità astratte degli LLM con l’azione concreta nell’ambiente. Questo apre uno spazio in cui la macchina non si limita a descrivere un movimento, ma lo esegue e lo corregge in tempo reale. Aziende come Boston Dynamics e Tesla stanno testando l’integrazione di ChatGPT nei robot umanoidi Optimus.

I ricercatori fanno notare che le persone cieche dalla nascita possono manifestare un’elevata intelligenza pur senza percezioni visive. Analogamente, l’IA potrebbe funzionare in modo intelligente anche senza lo spettro completo dei sensi umani. Ciò che conta è l’elaborazione delle informazioni e la capacità di risolvere problemi, non la forma specifica dell’input.

Memoria, autonomia, tempi di apprendimento: sono condizioni necessarie?

Un’ulteriore obiezione ai sistemi attuali sostiene che non dispongono di una memoria autobiografica permanente né di una vera autonomia. Un chatbot termina la sessione e “dimentica” la conversazione, opera entro i limiti stabiliti dall’uomo e non ha continuità di esperienza.

Secondo i ricercatori, queste non sono condizioni obbligatorie per il riconoscimento dell’intelligenza generale. Evidenziano che la memoria a lungo termine può essere aggiunta come strato di sistema, che l’autonomia è una questione di design ed etica — non di capacità cognitive — e che la quantità di dati necessari all’apprendimento non dovrebbe determinare lo status di intelligenza.

Un essere umano impara a guidare un’automobile in decine di ore di pratica. L’IA potrebbe necessitare di milioni di esempi provenienti da simulazioni. Gli autori sottolineano che ciò che conta è il livello finale di competenza raggiunto, non il costo per raggiungerlo. Modelli come GPT-4 Turbo dispongono già oggi di una finestra contestuale fino a 128.000 token, consentendo loro di mantenere la coerenza in conversazioni molto estese.

Il problema delle allucinazioni: il difetto più grave dei modelli attuali

Anche i sostenitori più entusiasti dell’AGI ammettono che i sistemi odierni presentano un difetto serio: la tendenza alle “allucinazioni”. Si tratta della generazione di informazioni che suonano credibili ma sono completamente inventate — da fonti scientifiche fittizie a normative legali inesistenti.

Le aziende che sviluppano i modelli riconoscono che la percentuale di tali errori rimane significativa. Secondo analisi interne di una delle principali organizzazioni del settore, anche nelle generazioni successive del modello ogni decima risposta potrebbe contenere un elemento non conforme ai fatti. OpenAI afferma che le allucinazioni rimangono un problema critico che richiede soluzione.

Gli autori della pubblicazione cercano di attenuare questo argomento osservando che anche gli esseri umani sbagliano spesso, creano falsi ricordi e cedono alle illusioni. I critici replicano che nel caso dell’IA, la portata e la facilità con cui vengono generati nonsense “sicuri di sé” crea un rischio di tutt’altra natura — specialmente in medicina, nel diritto e nella finanza.

Le allucinazioni rimangono uno dei principali motivi per cui molti esperti non vogliono ancora riconoscere che ci troviamo di fronte a una vera intelligenza generale delle macchine. Finché i sistemi non riescono ad distinguere in modo affidabile il fatto dalla finzione, il loro status di AGI resta controverso.

Il problema è la nostra definizione di intelligenza

La tesi finale dei ricercatori colpisce alle fondamenta del dibattito: forse il problema non sta nel fatto che l’IA sia “troppo debole”, ma che la nostra concezione di intelligenza sia troppo ristretta e fortemente antropocentrica.

Gli esseri umani hanno una naturale tendenza a valutare tutto attraverso il prisma della propria specie. Se una macchina pensa in modo diverso, commette errori diversi, apprende in modo diverso — la consideriamo “inferiore”. Gli autori suggeriscono che stiamo cadendo nella trappola dell’antropocentrismo: non vogliamo ammettere che si stia formando un nuovo tipo di intelligenza, diversa dalla nostra ma funzionalmente comparabile.

Questo spiega in parte perché nel dibattito appaia sempre più spesso la parola di moda “superintelligenza”. Spostare l’attenzione su un livello successivo ancora più lontano rimanda il momento in cui dobbiamo chiaramente affermare: l’intelligenza generale delle macchine sta già bussando alla porta — o è già seduta al tavolo accanto a noi.

Ricercatori dell’Università di Stanford hanno pubblicato uno studio che dimostra come i nostri parametri di misurazione dell’intelligenza siano culturalmente condizionati e orientati verso le capacità umane. Forse abbiamo bisogno di un nuovo quadro di riferimento per valutare l’intelligenza non umana.

Cosa significa questo dibattito per l’utente comune dell’IA

La disputa sulle definizioni non è solo un esercizio accademico. Dal fatto che riconosciamo o meno i sistemi attuali come intelligenza generale dipende il modo in cui li regoliamo, quanto ci fidiamo di loro e quali compiti affidiamo loro.

Se consideriamo i modelli attuali come AGI, cresce la pressione verso l’introduzione di quadri normativi più severi e una supervisione più rigorosa delle implementazioni, la richiesta di trasparenza riguardo ai dati di addestramento e alle modalità di funzionamento, un’analisi più approfondita dell’impatto dell’IA sul mercato del lavoro e sulle decisioni politiche, e lo sviluppo di sistemi di verifica dei fatti che “sorveglino” i chatbot.

Dal punto di vista dell’utente, l’approccio critico diventa fondamentale. Anche se l’IA comprende problemi complessi e può consigliare meglio di qualsiasi motore di ricerca, non possiamo ancora prendere le sue risposte come un oracolo infallibile. L’utilizzo efficace di questi strumenti richiede di combinare la loro potenza computazionale con il giudizio umano e la competenza settoriale. Il potere dell’AGI — nel senso proposto dai ricercatori — si manifesta con maggiore forza quando essere umano e sistema lavorano insieme.

Author

Nicolò Balini

Nicolò Balini, meglio conosciuto come Human Safari, è nato nel 1991 a Bergamo ed è considerato il pioniere dei travel vlogger in Italia. Dopo aver studiato nel settore turistico, ha aperto il suo canale YouTube nel 2012, trasformando la sua passione in una professione di riferimento. Nicolò è un esperto di logistica di viaggio, amante dei road trip e della fotografia cinematografica. È famoso per i suoi video "esperienziali" dove testa compagnie aeree, alloggi insoliti e fornisce consigli pratici su come viaggiare low-cost senza sacrificare l'avventura. È anche il fondatore di SiVola, un'importante agenzia di viaggi di gruppo.