La recursión es la próxima ley de escala en IA

Englishto

Imagina un modelo de inteligencia artificial con solo 7 millones de parámetros, entrenado desde cero, que supera a modelos cientos de veces más grandes y entrenados en todo Internet en problemas como el sudoku o las famosas pruebas del Arc Prize. Parece imposible, ¿verdad? Sin embargo, en 2025, dos trabajos académicos demostraron que ya no es necesario inflar indefinidamente el tamaño de los modelos para obtener un mejor rendimiento: el verdadero avance proviene de la recursión aplicada en el momento de la inferencia, es decir, cuando el modelo razona, no cuando se entrena. Lo que se pensaba sobre la IA estaba claro: cuanto más grande es el modelo, más potente se vuelve. Pero esta regla se está desmoronando. Los modelos recursivos, como HRM y TRM, demuestran que el verdadero salto de calidad no proviene solo de la escala, sino de cómo el modelo logra «pensar en varios pasos», recursivamente, durante el razonamiento. La recursividad, es decir, llamarse a uno mismo varias veces con el mismo conjunto de reglas, permite abordar problemas que los grandes LLM abordan solo superficialmente. Pongamos por ejemplo a François Chopard, uno de los protagonistas de esta revolución. Cuenta cómo, hasta 2016, la esperanza en la IA se centraba en las RNN: modelos recursivos que, sin embargo, estaban limitados por problemas técnicos como la famosa «retropropagación a través del tiempo», que hacía enloquecer a las redes más profundas debido a errores que se acumulaban o desaparecían. Luego llegaron los Transformers, que en el entrenamiento lo hacen todo en paralelo y se saltan estos problemas, pero pagan un precio: cada vez que tienen que razonar, deben «recordar» todo el contexto, como si cada vez que leyeras una página tuvieras que llevarte encima toda la novela de Shakespeare. Parece potente, pero en realidad los bloquea en tareas en las que se necesitan verdaderas cadenas de razonamiento, como ordenar una lista o resolver un sudoku. Hay un ejemplo que nunca olvidarás: si le pides a un LLM que ordene una lista de 31 elementos, pero el modelo solo tiene 30 niveles «de profundidad», simplemente no puede hacerlo. No es una cuestión de datos, es una barrera estructural. Por eso HRM y TRM marcan la diferencia. HRM, por ejemplo, se inspira en el cerebro humano, donde diferentes partes trabajan a diferentes frecuencias: está el nivel bajo, que gestiona los detalles rápidos, y el nivel alto, que controla las estrategias más lentas y profundas. Pero la verdadera magia está en el anillo de refinamiento externo, una especie de «bucle» que permite al modelo repasar varias veces sus propias respuestas, mejorándolas cada vez, sin tener que crecer exponencialmente. Y el truco está en eludir la vieja maldición de la retropropagación mediante una técnica llamada «deep equilibrium» y «truncated backpropagation»: en lugar de propagar los errores en todas las recursiones, se detienen en un punto y vuelven a empezar, creando una especie de minilote, pero en la memoria interna, no en las entradas. En la práctica, en cada ciclo, el modelo actualiza dos tipos de memoria: una local, ZL, que trabaja en los detalles, y otra más global, ZH, que realiza un seguimiento de la visión de conjunto. Este esquema permite resolver problemas a los que los LLM se enfrentan solo con «hacks» como el «chain of thought», es decir, hacer que escriban paso a paso cada razonamiento, o delegar en herramientas externas como las funciones de Python. Pero atención: incluso estos atajos se detienen donde se detiene el conocimiento humano. Si quieres que un modelo descubra un nuevo algoritmo —como el merge sort— sin que nadie le haya enseñado nunca, el chain of thought no es suficiente. La verdadera recursión, en cambio, puede hacerlo. El ejemplo del sudoku es evidente: el modelo recursivo puede descubrir estrategias nunca vistas, sin necesidad de que los datos humanos lo guíen paso a paso. Y hay más: el TRM lleva la simplificación al extremo. Reduce los niveles de red a uno solo, pasa de 27 a 7 millones de parámetros y, sin embargo, aumenta la precisión del 70 % al 87 % en tareas como Arc Prize. Esto invierte la lógica: ya no es necesario «simplemente ir a lo grande», sino «pensar más en profundidad». Y hay una frase de Mel Mitchell, investigadora citada en el pódcast, que plasma la cuestión: «Es suficiente, no necesario, ir a lo grande para mejorar. Es suficiente, no es necesario, añadir más recursión». La pregunta que queda es: ¿qué pasa si realmente combinas estas dos fuerzas? Si mañana tienes modelos gigantescos que también saben razonar recursivamente, la escala de lo que pueden hacer cambiará de nuevo. No todo el mundo está convencido de que inspirarse demasiado en la biología sea el camino correcto: de vez en cuando, el aprendizaje automático funciona mejor cuando se aleja del cerebro humano y se adapta a los ordenadores, como demuestra el paso de AlexNet a VGG, donde se han abandonado las inspiraciones «neuronales» para centrarse en la simplicidad que gana a las GPU. Pero el hecho es que la recursividad permite a los modelos diminutos vencer a los gigantes, siempre que el problema requiera un razonamiento de varios pasos. Hoy en día, los modelos recursivos son específicos para cada tarea: un TRM que sabe hacer sudokus no sabe resolver un laberinto, y viceversa. Pero tan pronto como se encuentre la manera de generalizar esta recursión, tendremos agentes capaces de razonar realmente «como seres pensantes», no solo de imitar textos. La frase que hay que recordar es esta: la próxima ley de escala de la IA no será solo «cuanto más grande, mejor», sino «cuanto más recursivo, mejor». Si esta perspectiva ha cambiado tu forma de pensar sobre la inteligencia artificial, en Lara Notes puedes indicarlo con I'm In: no es un «me gusta», es tu forma de decir que esta visión ahora forma parte de ti. Y si mañana le cuentas a alguien que un modelo minúsculo puede vencer a un gigante gracias a la recursión, en Lara Notes puedes etiquetar a la persona con Shared Offline, para que esa conversación no se pierda. Este episodio de Decoded de Y Combinator te ahorra 34 minutos de escucha.

0shared

La recursión es la próxima ley de escala en IA

I'll take...