La ricorsione è la prossima legge di scala nell'IA

Englishto

Immagina un modello di intelligenza artificiale con soli 7 milioni di parametri, addestrato da zero, che supera modelli centinaia di volte più grandi e addestrati su tutta Internet in problemi come il Sudoku o i famosi test dell'Arc Prize. Sembra impossibile, no? Eppure nel 2025 due lavori accademici hanno mostrato che non serve più gonfiare all'infinito le dimensioni dei modelli per ottenere prestazioni migliori: la vera svolta arriva dalla ricorsione applicata al momento dell'inferenza, cioè quando il modello ragiona, non quando si allena. Quello che si pensava sulle AI era chiaro: più grande è il modello, più potente diventa. Ma questa regola si sta sgretolando. I modelli ricorsivi, come HRM e TRM, dimostrano che il vero salto di qualità non viene solo dalla scala, ma da come il modello riesce a "pensare a più passaggi" — ricorsivamente — durante il ragionamento. La ricorsione, cioè chiamare se stessi più volte con lo stesso set di regole, permette di affrontare problemi che i grandi LLM affrontano solo superficialmente. Prendi Francois Chopard, uno dei protagonisti di questa rivoluzione. Racconta di come, fino al 2016, la speranza nell'AI fosse tutta sulle RNN: modelli ricorsivi che, però, erano limitati da problemi tecnici come la famosa “backpropagation through time”, che faceva impazzire le reti più profonde a causa di errori che si accumulavano o svanivano. Poi sono arrivati i Transformer, che in allenamento fanno tutto in parallelo e saltano questi problemi, ma pagano un prezzo: ogni volta che devono ragionare, devono “ricordare” tutto il contesto — come se ogni volta che leggi una pagina, dovessi portarti dietro l'intero romanzo di Shakespeare. Sembra potente, ma in realtà li blocca su task dove servono vere catene di ragionamento, come ordinare una lista o risolvere un Sudoku. C'è un esempio che non ti dimentichi più: se chiedi a un LLM di ordinare una lista lunga 31 elementi ma il modello ha solo 30 livelli “di profondità”, semplicemente non può farcela. Non è una questione di dati, è una barriera strutturale. Ecco perché HRM e TRM fanno la differenza. HRM, per esempio, prende ispirazione dal cervello umano, dove diverse parti lavorano a frequenze diverse: c'è il livello basso che gestisce dettagli rapidi, e il livello alto che controlla strategie più lente e profonde. Ma la vera magia sta nell'anello di raffinamento esterno, una sorta di "loop" che permette al modello di ripassare più volte sulle sue stesse risposte, migliorandole ogni volta, senza dover crescere in modo esponenziale. E il trucco sta nell'aggirare la vecchia maledizione del backpropagation attraverso una tecnica chiamata “deep equilibrium” e “truncated backpropagation”: invece di propagare gli errori su tutte le ricorsioni, si fermano a un punto e ripartono, creando una sorta di mini-batch ma sulla memoria interna, non sugli input. In pratica, a ogni ciclo, il modello aggiorna due tipi di memoria: una locale, ZL, che lavora sui dettagli, e una più globale, ZH, che tiene traccia della visione d'insieme. Questo schema permette di risolvere problemi che gli LLM affrontano solo con “hack” come il chain of thought, cioè far scrivere passo-passo ogni ragionamento, o delegare a strumenti esterni come funzioni Python. Ma attenzione: anche queste scorciatoie si fermano dove si ferma la conoscenza umana. Se vuoi che un modello scopra un nuovo algoritmo — come il merge sort — senza che nessuno glielo abbia mai insegnato, il chain of thought non basta. La vera ricorsione, invece, può farlo. L'esempio del Sudoku è lampante: il modello ricorsivo può scoprire strategie mai viste, senza bisogno di essere guidato passo passo da dati umani. E c'è di più: il TRM porta all'estremo la semplificazione. Riduce a uno solo i livelli di rete, passa da 27 a 7 milioni di parametri, eppure sale dal 70% all'87% di accuratezza su task come Arc Prize. Questo ribaltare la logica: non serve più “andare solo più in grande”, ma “pensare più in profondità”. E c'è una frase di Mel Mitchell, ricercatrice citata nel podcast, che fotografa il punto: “È sufficiente, non necessario, andare più grandi per migliorare. È sufficiente, non necessario, aggiungere più ricorsione.” La domanda che rimane è: cosa succede se unisci davvero queste due forze? Se domani avrai modelli giganteschi che sanno anche ragionare ricorsivamente, la scala di ciò che possono fare cambierà di nuovo. Non tutti sono convinti che ispirarsi troppo alla biologia sia la via giusta: ogni tanto il machine learning funziona meglio quando si allontana dal cervello umano e si adatta ai computer — come dimostra il passaggio da AlexNet a VGG, dove si sono abbandonate ispirazioni “neuronali” per puntare sulla semplicità che vince sulle GPU. Ma il dato di fatto rimane: la ricorsione permette a modelli minuscoli di battere giganti, purché il problema richieda ragionamento multi-step. Oggi i modelli ricorsivi sono specifici per task: un TRM che sa fare Sudoku non sa risolvere un labirinto, e viceversa. Ma non appena si troverà il modo di generalizzare questa ricorsione, avremo agenti capaci di ragionare davvero “come esseri pensanti”, non solo di imitare testi. La frase da ricordare è questa: la prossima legge di scala dell'AI non sarà solo “più grande è meglio”, ma “più ricorsivo è meglio”. Se questa prospettiva ha cambiato il tuo modo di pensare all'intelligenza artificiale, su Lara Notes puoi segnalarlo con I'm In: non è un like, è il tuo modo di dire che questa visione adesso fa parte di te. E se domani racconterai a qualcuno che un modello minuscolo può battere un gigante grazie alla ricorsione, su Lara Notes puoi taggare la persona con Shared Offline — così quella conversazione non si perde. Questo episodio di Decoded da Y Combinator ti fa risparmiare 34 minuti di ascolto.

0shared

La ricorsione è la prossima legge di scala nell'IA

I'll take...