El modelo compacto de inteligencia artificial de Samsung supera en razonamiento a sus rivales de mayor tamaño

Hogar

Noticias

3 de diciembre de 2025

BrianThomas

# ai # models # Samsung

Un nuevo artículo de un investigador de Samsung especializado en IA explica cómo una red compacta puede superar a los grandes modelos lingüísticos (LLM) en tareas de razonamiento complejas.

En la carrera por el dominio de la IA, el mantra predominante en la industria ha sido "cuanto más grande, mejor". Mientras los gigantes tecnológicos invierten miles de millones en desarrollar modelos cada vez más grandes, Alexia Jolicoeur-Martineau, de Samsung SAIL Montréal, propone un enfoque diferente y más eficiente mediante el modelo recursivo diminuto (TRM).

Con sólo 7 millones de parámetros -menos del 0,01% del tamaño de los mejores LLM-, el TRM logra resultados de vanguardia en pruebas de referencia muy exigentes, como el test de inteligencia ARC-AGI. Los resultados de Samsung ponen en entredicho la creencia generalizada de que la escala es el único camino para el avance de la IA y presentan una alternativa más sostenible y eficiente en cuanto a parámetros.

Superar los límites de la escala

Aunque los LLM destacan en la generación de textos similares a los humanos, su capacidad para manejar razonamientos complejos de varios pasos suele ser frágil. Dado que generan respuestas testigo a testigo, un error al principio puede comprometer toda la solución y dar lugar a una respuesta final incorrecta.

Técnicas como la cadena de pensamiento, en la que un modelo desglosa un problema paso a paso, pretenden mitigar este problema. Sin embargo, estos enfoques son costosos desde el punto de vista computacional, a menudo requieren datos de razonamiento sustanciales y de alta calidad, y aún así pueden producir una lógica errónea. Incluso con estas mejoras, los LLM tienen dificultades para resolver rompecabezas que exigen una ejecución lógica impecable.

La investigación de Samsung se basa en el reciente Modelo de Razonamiento Jerárquico (HRM). El HRM utilizaba dos pequeñas redes neuronales que refinaban recursivamente las respuestas a distintas frecuencias. Aunque prometedor, el modelo era complejo y se basaba en argumentos biológicos inciertos y teoremas de punto fijo que no siempre eran aplicables.

En lugar de la estructura de doble red de HRM, TRM emplea una única red compacta que mejora recursivamente tanto su razonamiento interno como su respuesta propuesta.

El modelo recibe la pregunta, una respuesta inicial y una función de razonamiento latente. A continuación, pasa por varios pasos para refinar su razonamiento basándose en las tres entradas. A partir de este razonamiento mejorado, actualiza su predicción de respuesta final. Todo este proceso puede repetirse hasta 16 veces, lo que permite al modelo autocorregirse progresivamente de un modo muy eficiente desde el punto de vista de los parámetros.

De forma contraintuitiva, el estudio descubrió que una red de dos capas generalizaba mucho mejor que una versión de cuatro capas. El diseño más pequeño parece evitar el sobreajuste, un problema habitual cuando se entrena con conjuntos de datos limitados y especializados.

La TRM también elimina las complejas suposiciones matemáticas de su predecesora. El modelo HRM original tenía que asumir la convergencia de la función a un punto fijo para justificar su entrenamiento. TRM evita esto propagándose hacia atrás a través de su proceso de recursión completo, un cambio que mejoró enormemente el rendimiento, aumentando la precisión de la referencia Sudoku-Extreme del 56,5% al 87,4% en las pruebas de ablación.

El modelo de Samsung pulveriza las pruebas de IA con menos recursos

Los resultados son sorprendentes. En el conjunto de datos Sudoku-Extreme, que utiliza sólo 1.000 ejemplos de entrenamiento, TRM alcanza una precisión del 87,4% en las pruebas, un gran salto desde el 55% de HRM. En Maze-Hard, que consiste en recorrer largos caminos a través de laberintos de 30×30, TRM obtiene un 85,3%, frente al 74,5% de HRM.

Y lo que es más notable, TRM progresa notablemente en el Corpus de Abstracción y Razonamiento (ARC-AGI), una prueba de referencia diseñada para evaluar la verdadera inteligencia fluida en IA. Con sólo 7M de parámetros, TRM alcanza una precisión del 44,6% en ARC-AGI-1 y del 7,8% en ARC-AGI-2. Esto supera a HRM, que utilizó 27 millones de parámetros, e incluso a muchos de los LLM más grandes del mundo. En comparación, Gemini 2.5 Pro obtiene sólo un 4,9% en ARC-AGI-2.

El proceso de entrenamiento de TRM también se ha optimizado. Se ha simplificado un mecanismo adaptativo llamado ACT, que determina cuándo el modelo ha mejorado lo suficiente una respuesta como para seguir adelante, eliminando la necesidad de una costosa segunda pasada hacia delante en cada paso de entrenamiento. Este ajuste no perjudicó a la generalización global.

La investigación de Samsung supone un fuerte contrapunto a la tendencia de construir modelos de IA cada vez más grandes. Demuestra que diseñando arquitecturas capaces de razonar de forma iterativa y autocorregirse, se pueden resolver problemas extremadamente difíciles utilizando sólo una pequeña fracción de los recursos computacionales.

Véase también: El nuevo agente de IA de Google reescribe código para automatizar la corrección de vulnerabilidades

¿Le interesa saber más sobre IA y big data de la mano de los líderes del sector? Asista a la AI & Big Data Expo en Ámsterdam, California y Londres. Este completo evento forma parte de TechEx y se celebra junto con otros importantes eventos tecnológicos como la Cyber Security Expo. Haga clic aquí para obtener más información.

AI News está impulsado por TechForge Media. Descubra aquí otros próximos eventos y seminarios web sobre tecnología empresarial.

Artículo relacionado

WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an

Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE

Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere

Recomendaciones de temas especiales relacionados

Negocio

Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas

xix.ai

Productividad

Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas

xix.ai

chatbot

Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes

Descubre los mejores chatbots románticos con IA de 2026 para establecer relaciones auténticas y duraderas. Nuestra lista seleccionada incluye personalidades sólidas y coherentes, comparativas entre versiones gratuitas y de pago, y pruebas en situaciones reales. Encuentra a tu compañero ideal y empieza a construir tu relación hoy mismo en XIX.AI.

10 herramientas

xix.ai

Educación y aprendizaje

Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.

Descubra a los mejores mentores en ciencia de datos y AI de 2026 para dominar SQL, Pandas y flujos de trabajo de aprendizaje automático. Explore nuestra selección cuidadosamente seleccionada y altamente valorada en XIX.AI para obtener orientación poderosa que cambie completamente la situación. Compare las opciones gratuitas con las pagadas y obtenga información basada en casos reales. Desbloquee su dominio de la ciencia de datos hoy mismo.

10 herramientas

xix.ai

chatbot

Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real

Descubre los mejores cursos de 2026 sobre coqueteo y conversación con IA en XIX.AI. Nuestra selección, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a desarrollar tu carisma social y tu confianza en tiempo real. Explora herramientas imprescindibles y revolucionarias con comparativas entre versiones gratuitas y de pago, y clasificaciones que se actualizan semanalmente. Potencia hoy mismo tus habilidades sociales.

10 herramientas

xix.ai

código

Las mejores herramientas de IA para pruebas unitarias automatizadas: genera casos de prueba con Jest, PyTest y JUnit con un solo clic

Descubre las mejores herramientas de IA de 2026 para la automatización de pruebas unitarias. Nuestra selección incluye potentes soluciones revolucionarias que permiten generar casos de prueba para Jest, PyTest y JUnit al instante. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones actualizadas semanalmente en XIX.AI. Aprovecha las ventajas de la IA y aumenta la productividad de tu desarrollo hoy mismo.

10 herramientas

xix.ai