Hogar
El modelo compacto de inteligencia artificial de Samsung supera en razonamiento a sus rivales de mayor tamaño
Un nuevo artículo de un investigador de Samsung especializado en IA explica cómo una red compacta puede superar a los grandes modelos lingüísticos (LLM) en tareas de razonamiento complejas.
En la carrera por el dominio de la IA, el mantra predominante en la industria ha sido "cuanto más grande, mejor". Mientras los gigantes tecnológicos invierten miles de millones en desarrollar modelos cada vez más grandes, Alexia Jolicoeur-Martineau, de Samsung SAIL Montréal, propone un enfoque diferente y más eficiente mediante el modelo recursivo diminuto (TRM).
Con sólo 7 millones de parámetros -menos del 0,01% del tamaño de los mejores LLM-, el TRM logra resultados de vanguardia en pruebas de referencia muy exigentes, como el test de inteligencia ARC-AGI. Los resultados de Samsung ponen en entredicho la creencia generalizada de que la escala es el único camino para el avance de la IA y presentan una alternativa más sostenible y eficiente en cuanto a parámetros.
Superar los límites de la escala
Aunque los LLM destacan en la generación de textos similares a los humanos, su capacidad para manejar razonamientos complejos de varios pasos suele ser frágil. Dado que generan respuestas testigo a testigo, un error al principio puede comprometer toda la solución y dar lugar a una respuesta final incorrecta.
Técnicas como la cadena de pensamiento, en la que un modelo desglosa un problema paso a paso, pretenden mitigar este problema. Sin embargo, estos enfoques son costosos desde el punto de vista computacional, a menudo requieren datos de razonamiento sustanciales y de alta calidad, y aún así pueden producir una lógica errónea. Incluso con estas mejoras, los LLM tienen dificultades para resolver rompecabezas que exigen una ejecución lógica impecable.
La investigación de Samsung se basa en el reciente Modelo de Razonamiento Jerárquico (HRM). El HRM utilizaba dos pequeñas redes neuronales que refinaban recursivamente las respuestas a distintas frecuencias. Aunque prometedor, el modelo era complejo y se basaba en argumentos biológicos inciertos y teoremas de punto fijo que no siempre eran aplicables.
En lugar de la estructura de doble red de HRM, TRM emplea una única red compacta que mejora recursivamente tanto su razonamiento interno como su respuesta propuesta.
El modelo recibe la pregunta, una respuesta inicial y una función de razonamiento latente. A continuación, pasa por varios pasos para refinar su razonamiento basándose en las tres entradas. A partir de este razonamiento mejorado, actualiza su predicción de respuesta final. Todo este proceso puede repetirse hasta 16 veces, lo que permite al modelo autocorregirse progresivamente de un modo muy eficiente desde el punto de vista de los parámetros.
De forma contraintuitiva, el estudio descubrió que una red de dos capas generalizaba mucho mejor que una versión de cuatro capas. El diseño más pequeño parece evitar el sobreajuste, un problema habitual cuando se entrena con conjuntos de datos limitados y especializados.
La TRM también elimina las complejas suposiciones matemáticas de su predecesora. El modelo HRM original tenía que asumir la convergencia de la función a un punto fijo para justificar su entrenamiento. TRM evita esto propagándose hacia atrás a través de su proceso de recursión completo, un cambio que mejoró enormemente el rendimiento, aumentando la precisión de la referencia Sudoku-Extreme del 56,5% al 87,4% en las pruebas de ablación.
El modelo de Samsung pulveriza las pruebas de IA con menos recursos
Los resultados son sorprendentes. En el conjunto de datos Sudoku-Extreme, que utiliza sólo 1.000 ejemplos de entrenamiento, TRM alcanza una precisión del 87,4% en las pruebas, un gran salto desde el 55% de HRM. En Maze-Hard, que consiste en recorrer largos caminos a través de laberintos de 30×30, TRM obtiene un 85,3%, frente al 74,5% de HRM.
Y lo que es más notable, TRM progresa notablemente en el Corpus de Abstracción y Razonamiento (ARC-AGI), una prueba de referencia diseñada para evaluar la verdadera inteligencia fluida en IA. Con sólo 7M de parámetros, TRM alcanza una precisión del 44,6% en ARC-AGI-1 y del 7,8% en ARC-AGI-2. Esto supera a HRM, que utilizó 27 millones de parámetros, e incluso a muchos de los LLM más grandes del mundo. En comparación, Gemini 2.5 Pro obtiene sólo un 4,9% en ARC-AGI-2.
El proceso de entrenamiento de TRM también se ha optimizado. Se ha simplificado un mecanismo adaptativo llamado ACT, que determina cuándo el modelo ha mejorado lo suficiente una respuesta como para seguir adelante, eliminando la necesidad de una costosa segunda pasada hacia delante en cada paso de entrenamiento. Este ajuste no perjudicó a la generalización global.
La investigación de Samsung supone un fuerte contrapunto a la tendencia de construir modelos de IA cada vez más grandes. Demuestra que diseñando arquitecturas capaces de razonar de forma iterativa y autocorregirse, se pueden resolver problemas extremadamente difíciles utilizando sólo una pequeña fracción de los recursos computacionales.
Véase también: El nuevo agente de IA de Google reescribe código para automatizar la corrección de vulnerabilidades

¿Le interesa saber más sobre IA y big data de la mano de los líderes del sector? Asista a la AI & Big Data Expo en Ámsterdam, California y Londres. Este completo evento forma parte de TechEx y se celebra junto con otros importantes eventos tecnológicos como la Cyber Security Expo. Haga clic aquí para obtener más información.
AI News está impulsado por TechForge Media. Descubra aquí otros próximos eventos y seminarios web sobre tecnología empresarial.
Artículo relacionado
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física
Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Un nuevo artículo de un investigador de Samsung especializado en IA explica cómo una red compacta puede superar a los grandes modelos lingüísticos (LLM) en tareas de razonamiento complejas.
En la carrera por el dominio de la IA, el mantra predominante en la industria ha sido "cuanto más grande, mejor". Mientras los gigantes tecnológicos invierten miles de millones en desarrollar modelos cada vez más grandes, Alexia Jolicoeur-Martineau, de Samsung SAIL Montréal, propone un enfoque diferente y más eficiente mediante el modelo recursivo diminuto (TRM).
Con sólo 7 millones de parámetros -menos del 0,01% del tamaño de los mejores LLM-, el TRM logra resultados de vanguardia en pruebas de referencia muy exigentes, como el test de inteligencia ARC-AGI. Los resultados de Samsung ponen en entredicho la creencia generalizada de que la escala es el único camino para el avance de la IA y presentan una alternativa más sostenible y eficiente en cuanto a parámetros.
Superar los límites de la escala
Aunque los LLM destacan en la generación de textos similares a los humanos, su capacidad para manejar razonamientos complejos de varios pasos suele ser frágil. Dado que generan respuestas testigo a testigo, un error al principio puede comprometer toda la solución y dar lugar a una respuesta final incorrecta.
Técnicas como la cadena de pensamiento, en la que un modelo desglosa un problema paso a paso, pretenden mitigar este problema. Sin embargo, estos enfoques son costosos desde el punto de vista computacional, a menudo requieren datos de razonamiento sustanciales y de alta calidad, y aún así pueden producir una lógica errónea. Incluso con estas mejoras, los LLM tienen dificultades para resolver rompecabezas que exigen una ejecución lógica impecable.
La investigación de Samsung se basa en el reciente Modelo de Razonamiento Jerárquico (HRM). El HRM utilizaba dos pequeñas redes neuronales que refinaban recursivamente las respuestas a distintas frecuencias. Aunque prometedor, el modelo era complejo y se basaba en argumentos biológicos inciertos y teoremas de punto fijo que no siempre eran aplicables.
En lugar de la estructura de doble red de HRM, TRM emplea una única red compacta que mejora recursivamente tanto su razonamiento interno como su respuesta propuesta.
El modelo recibe la pregunta, una respuesta inicial y una función de razonamiento latente. A continuación, pasa por varios pasos para refinar su razonamiento basándose en las tres entradas. A partir de este razonamiento mejorado, actualiza su predicción de respuesta final. Todo este proceso puede repetirse hasta 16 veces, lo que permite al modelo autocorregirse progresivamente de un modo muy eficiente desde el punto de vista de los parámetros.
De forma contraintuitiva, el estudio descubrió que una red de dos capas generalizaba mucho mejor que una versión de cuatro capas. El diseño más pequeño parece evitar el sobreajuste, un problema habitual cuando se entrena con conjuntos de datos limitados y especializados.
La TRM también elimina las complejas suposiciones matemáticas de su predecesora. El modelo HRM original tenía que asumir la convergencia de la función a un punto fijo para justificar su entrenamiento. TRM evita esto propagándose hacia atrás a través de su proceso de recursión completo, un cambio que mejoró enormemente el rendimiento, aumentando la precisión de la referencia Sudoku-Extreme del 56,5% al 87,4% en las pruebas de ablación.
El modelo de Samsung pulveriza las pruebas de IA con menos recursos
Los resultados son sorprendentes. En el conjunto de datos Sudoku-Extreme, que utiliza sólo 1.000 ejemplos de entrenamiento, TRM alcanza una precisión del 87,4% en las pruebas, un gran salto desde el 55% de HRM. En Maze-Hard, que consiste en recorrer largos caminos a través de laberintos de 30×30, TRM obtiene un 85,3%, frente al 74,5% de HRM.
Y lo que es más notable, TRM progresa notablemente en el Corpus de Abstracción y Razonamiento (ARC-AGI), una prueba de referencia diseñada para evaluar la verdadera inteligencia fluida en IA. Con sólo 7M de parámetros, TRM alcanza una precisión del 44,6% en ARC-AGI-1 y del 7,8% en ARC-AGI-2. Esto supera a HRM, que utilizó 27 millones de parámetros, e incluso a muchos de los LLM más grandes del mundo. En comparación, Gemini 2.5 Pro obtiene sólo un 4,9% en ARC-AGI-2.
El proceso de entrenamiento de TRM también se ha optimizado. Se ha simplificado un mecanismo adaptativo llamado ACT, que determina cuándo el modelo ha mejorado lo suficiente una respuesta como para seguir adelante, eliminando la necesidad de una costosa segunda pasada hacia delante en cada paso de entrenamiento. Este ajuste no perjudicó a la generalización global.
La investigación de Samsung supone un fuerte contrapunto a la tendencia de construir modelos de IA cada vez más grandes. Demuestra que diseñando arquitecturas capaces de razonar de forma iterativa y autocorregirse, se pueden resolver problemas extremadamente difíciles utilizando sólo una pequeña fracción de los recursos computacionales.
Véase también: El nuevo agente de IA de Google reescribe código para automatizar la corrección de vulnerabilidades

¿Le interesa saber más sobre IA y big data de la mano de los líderes del sector? Asista a la AI & Big Data Expo en Ámsterdam, California y Londres. Este completo evento forma parte de TechEx y se celebra junto con otros importantes eventos tecnológicos como la Cyber Security Expo. Haga clic aquí para obtener más información.
AI News está impulsado por TechForge Media. Descubra aquí otros próximos eventos y seminarios web sobre tecnología empresarial.
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere











