Jensen Huang ha dichiarato l'AGI arrivata. Un benchmark l'ha smentito brutalmente.
La settimana stessa in cui il CEO di NVIDIA proclamava l'intelligenza artificiale generale come realtà, è uscito ARC-AGI-3, il test progettato appositamente per misurare capacità cognitive paragonabili all'uomo. Il risultato è imbarazzante: Gemini ha totalizzato lo 0,37%, GPT ha ottenuto lo 0,26%. Gli esseri umani? 100%. ARC-AGI non misura la capacità di generare testo fluente o risolvere equazioni già viste, ma il ragionamento adattivo su problemi nuovi, esattamente il nucleo dell'intelligenza generale. Il gap tra le dichiarazioni dei CEO e i dati reali non è mai stato così evidente.
In pratica: i modelli attuali sono straordinari in ciò che hanno già visto, ma crollano davanti all'inedito. L'AGI è ancora un obiettivo, non un traguardo tagliato.
Le notizie AI che contano, distillate in 2 minuti.
Gratis, ogni giorno alle 07:00.