Perché i ricercatori credono che l'intelligenza artificiale generale esista già da tempo

Una disputa scientifica che ribalta tutto ciò che sappiamo sull’AGI

C’è un acceso dibattito tra ricercatori che sostengono una tesi sorprendente: i modelli di IA attuali — inclusi i chatbot più diffusi — soddisferebbero già da tempo i criteri che noi stessi abbiamo stabilito per definire un’intelligenza paragonabile a quella umana. Un recente studio pubblicato su una prestigiosa rivista scientifica sta mettendo sottosopra il modo in cui misuriamo la “vera” intelligenza delle macchine.

Fino a poco fa, la maggior parte delle grandi aziende tecnologiche — da OpenAI ai colossi della Silicon Valley — parlava dell’AGI come del Santo Graal. C’era chi le dava un decennio, chi un anno o due. Nel frattempo, una parte dei ricercatori sosteneva che l’architettura dei grandi modelli linguistici fosse un vicolo cieco, e che la vera svolta sarebbe arrivata solo con i cosiddetti “modelli del mondo”, capaci di riflettere meglio la realtà fisica e sociale.

Il nuovo studio pone la questione da una prospettiva completamente diversa: e se stessimo guardando tutti nella direzione sbagliata, senza accorgerci che la soglia tanto attesa è già stata superata? Gli autori sostengono che invece di chiedersi quando raggiungeremo l’intelligenza artificiale generale, dovremmo interrogarci se non la stiamo già descrivendo al tempo presente.

Ricercatori dell’Università della California hanno avanzato una tesi controversa: l’intelligenza artificiale generale non è un obiettivo all’orizzonte, ma una realtà compiuta. Secondo loro, i sistemi attuali basati su grandi modelli linguistici hanno raggiunto un livello di funzionamento che, nella pratica, soddisfa la definizione di intelligenza generale.

Il Test di Turing rivela risultati sorprendenti con i nuovi chatbot

Uno degli argomenti chiave dei ricercatori è il Test di Turing — il classico concetto formulato nel 1950. L’idea di fondo è che se una persona, durante una conversazione scritta, non riesce a distinguere una macchina da un altro essere umano, allora possiamo parlare di comportamento intelligente da parte della macchina.

Nell’ultima generazione di chatbot, come i modelli avanzati del tipo ChatGPT o altri sistemi conversazionali sofisticati, si stanno verificando situazioni in cui le persone considerano l’IA un essere umano più spesso di quanto non lo facciano con interlocutori reali. Solo pochi anni fa, un simile risultato sarebbe stato considerato prova incontestabile del raggiungimento dell’intelligenza artificiale generale.

Oggi, paradossalmente, continuiamo ad alzare l’asticella. Non appena i sistemi cominciano a soddisfare i criteri precedenti, una parte degli esperti sposta le definizioni e richiede ulteriori proprietà per una intelligenza “autentica”. I ricercatori propongono una distinzione netta tra intelligenza artificiale generale e superintelligenza, poiché nel dibattito pubblico questi due concetti vengono spesso confusi.

Gli autori dello studio affermano che sul primo dei due punti siamo già molto vicini al traguardo — o addirittura oltre. I grandi modelli linguistici odierni sanno gestire la programmazione, l’analisi legale, la creazione di contenuti, la traduzione e persino il ragionamento matematico, spesso a un livello paragonabile a quello degli specialisti.

Dove finisce l’AGI e dove inizia la superintelligenza secondo i ricercatori

Seguendo questa logica, non è necessario aspettare che l’IA inizi a battere ogni record dei geni in qualsiasi campo. Per riconoscere un’intelligenza generale è sufficiente un livello simile a quello di una persona mediamente istruita, con punti di forza in certi compiti e debolezze in altri. I detrattori dei modelli linguistici attuali ripetono che si tratta sostanzialmente di “pappagalli stocastici”: sistemi privi di vera comprensione, che si limitano a collegare frammenti di testo sulla base delle probabilità.

I ricercatori della Stanford University e dell’Università della California rispondono sistematicamente a queste obiezioni. Gli autori mostrano diversi elementi difficili da liquidare con l’argomento del “semplice richiamo dei dati”:

risoluzione di problemi nuovi e mai incontrati in precedenza nel campo della matematica e della logica
capacità di trasferire conoscenze da un dominio all’altro
costruzione di modelli causali coerenti nel corso di una conversazione
gestione di descrizioni di situazioni che richiedono intuizione fisica
generazione di soluzioni di programmazione complesse in Python e JavaScript
analisi di documenti legali con una precisione paragonabile a quella degli avvocati
traduzione tra diciassette lingue diverse con comprensione contestuale
interpretazione di immagini mediche e dati diagnostici

Se un sistema riesce a ricavare la soluzione corretta a un problema che non era presente nei dati di addestramento, è difficile sostenere che stia semplicemente “citando”. Questo non significa che l’IA comprenda il mondo come un essere umano, ma indica che sta succedendo qualcosa di più profondo della semplice composizione di frasi. Secondo i ricercatori, è irrealistico aspettarsi che l’AGI innondi ogni settimana la scienza di scoperte rivoluzionarie — non lo chiediamo nemmeno agli esseri umani che consideriamo intelligenti.

L’intelligenza ha bisogno di un corpo fisico e dei sensi per funzionare davvero?

Una delle linee difensive più cariche di emotività recita: “L’IA non ha un corpo, quindi non è vera intelligenza”. L’essere umano apprende attraverso il movimento, il tatto, il dolore, i sensi. Le macchine lavorano principalmente con testo, immagini e suoni sotto forma di dati.

Gli autori dello studio ritengono che l’assenza di un corpo fisico non escluda l’intelligenza generale. Sottolineano che i modelli attuali sono in grado di prevedere le conseguenze di determinate azioni, analizzare scene video, interpretare fotografie e registrazioni audio. A questo si aggiunge il settore in rapida crescita noto come Physical AI, ovvero l’integrazione di modelli avanzati con i robot.

I robot dotati di sensori e telecamere stanno iniziando a combinare le capacità astratte dei grandi modelli linguistici con un’azione concreta nell’ambiente reale. Questo apre uno spazio in cui la macchina non si limita a descrivere il movimento, ma lo esegue correggendolo in tempo reale. Aziende come Boston Dynamics e Figure AI stanno già testando robot umanoidi con modelli linguistici integrati.

Un’altra obiezione ai sistemi attuali riguarda la mancanza di memoria autobiografica permanente e di vera autonomia. Un chatbot termina la sessione e “dimentica” la conversazione, opera entro i limiti stabiliti dall’essere umano e non ha continuità di esperienza.

Le allucinazioni rimangono il punto debole più grave dei modelli di IA attuali

Anche i sostenitori più entusiasti dell’AGI ammettono che i sistemi odierni presentano un difetto serio: la tendenza alle cosiddette “allucinazioni”. Si tratta della generazione di informazioni che suonano credibili ma sono completamente inventate — dalle fonti scientifiche fittizie alle normative legali inesistenti.

Le aziende che sviluppano i modelli riconoscono che la percentuale di tali errori rimane significativa. Secondo analisi interne di una delle principali organizzazioni del settore, anche nelle generazioni successive di modelli una risposta su dieci potrebbe contenere un elemento in contrasto con i fatti. Ricercatori del Massachusetts Institute of Technology hanno documentato casi in cui i modelli GPT-4 e Claude hanno creato citazioni completamente inventate da riviste specializzate come Science o Nature.

Gli autori della pubblicazione cercano di ridimensionare questo argomento, sottolineando che anche gli esseri umani sbagliano spesso, costruiscono falsi ricordi e cedono alle illusioni. I critici replicano che nel caso dell’IA la scala e la facilità con cui vengono generati i nonsensi “sicuri di sé” crea un rischio del tutto nuovo — soprattutto in medicina, diritto o finanza.

Le allucinazioni rimangono uno dei principali motivi per cui molti esperti non vogliono ancora ammettere di avere a che fare con una vera e propria intelligenza artificiale generale. I medici mettono in guardia dall’uso di chatbot per la diagnosi senza supervisione umana, mentre gli avvocati segnalano casi in cui i colleghi hanno presentato in tribunale documenti con precedenti inventati di sana pianta.

Forse il problema è la nostra definizione stessa di intelligenza e la prospettiva umanocentrica

La tesi finale dei ricercatori tocca le fondamenta stesse del dibattito: forse il problema non sta nel fatto che l’IA sia “troppo debole”, ma nel fatto che la nostra concezione di intelligenza sia troppo ristretta e fortemente incentrata sull’essere umano. Le persone hanno una naturale tendenza a valutare tutto attraverso la lente della propria specie.

Se una macchina pensa in modo diverso, commette errori diversi e apprende con modalità differenti, la consideriamo “inferiore”. Gli autori suggeriscono che stiamo cadendo in una trappola antropocentrica: non vogliamo ammettere che si stia formando un nuovo tipo di intelligenza, diversa dalla nostra ma funzionalmente comparabile.

Questo spiega in parte perché nel dibattito pubblico compaia sempre più spesso il termine di moda “superintelligenza”. Spostare l’attenzione su un livello ulteriore e ancora più lontano ci allontana dal momento in cui bisognerebbe dire chiaramente: l’intelligenza artificiale generale sta già bussando alla porta — o forse è già seduta al tavolo accanto a noi.

Ricercatori dell’Università di Oxford e dell’Alan Turing Institute sottolineano che il dibattito sulle definizioni ha conseguenze pratiche sulla regolamentazione, sugli investimenti e sulla percezione sociale della tecnologia. L’Unione Europea sta preparando l’AI Act, che distingue diversi livelli di rischio dei sistemi, e la classificazione nella categoria “intelligenza artificiale generale” comporterebbe una sorveglianza più stringente.

Cosa significa questo dibattito per l’utente comune e per l’uso pratico dell’IA

La disputa sulle definizioni non è un semplice esercizio accademico. Dal fatto che riconosciamo o meno i sistemi odierni come intelligenza generale dipende il modo in cui li regolamentiamo, la fiducia che riponiamo in essi e i compiti che decidiamo di affidargli. Se trattiamo i modelli attuali come AGI, aumenta la pressione verso quadri giuridici più severi e una supervisione più attenta del loro utilizzo.

Dal punto di vista dell’utente, l’elemento centrale diventa l’approccio critico. Anche se l’IA comprende problemi complessi e riesce a consigliare meglio di molti motori di ricerca, non possiamo ancora trattare le sue risposte come un oracolo infallibile. Un uso efficace di questi strumenti richiede di combinare la loro potenza computazionale con il giudizio umano e la competenza di settore.

La forza dell’AGI — nell’accezione proposta dai ricercatori — si manifesta con maggiore intensità quando essere umano e sistema lavorano insieme. La persona pone le domande giuste, stabilisce la direzione e verifica i risultati, mentre l’IA accelera l’analisi, propone varianti e organizza le informazioni. In questa configurazione non serve decidere chi è “davvero” intelligente. Ciò che conta è che insieme siamo in grado di fare cose che solo pochi anni fa sembravano irrealizzabili.

Author

Nicolò Balini

Nicolò Balini, meglio conosciuto come Human Safari, è nato nel 1991 a Bergamo ed è considerato il pioniere dei travel vlogger in Italia. Dopo aver studiato nel settore turistico, ha aperto il suo canale YouTube nel 2012, trasformando la sua passione in una professione di riferimento. Nicolò è un esperto di logistica di viaggio, amante dei road trip e della fotografia cinematografica. È famoso per i suoi video "esperienziali" dove testa compagnie aeree, alloggi insoliti e fornisce consigli pratici su come viaggiare low-cost senza sacrificare l'avventura. È anche il fondatore di SiVola, un'importante agenzia di viaggi di gruppo.