El MIT presenta un marco de inteligencia artificial de autoaprendizaje que va más allá de los modelos estáticos

Hogar

Noticias

14 de octubre de 2025

OliviaJones

# research # mit # LLMs

Investigadores del MIT, pioneros en el autoaprendizaje de la IA

Un equipo del MIT ha desarrollado un innovador sistema denominado SEAL (Self-Adapting Language Models) que permite a grandes modelos lingüísticos evolucionar de forma autónoma sus capacidades. Este avance permite a los sistemas de IA generar sus propios materiales de formación y protocolos de aprendizaje, lo que posibilita la integración permanente de nuevos conocimientos y habilidades.

SEAL representa un avance significativo para las aplicaciones empresariales de IA, sobre todo para los agentes inteligentes que operan en entornos fluidos donde la adaptación continua es crucial. El marco aborda una limitación fundamental de la tecnología LLM actual: el reto de la integración permanente de conocimientos más allá del aprendizaje contextual temporal.

El reto de la adaptación en la IA moderna

Aunque los grandes modelos lingüísticos demuestran unas capacidades impresionantes, su capacidad para aprender e interiorizar realmente nueva información sigue siendo limitada. Los métodos de adaptación actuales, como el ajuste fino o el aprendizaje en contexto, tratan los datos de entrada de forma pasiva, sin optimizarlos para los procesos de aprendizaje del modelo.

"Las aplicaciones empresariales exigen algo más que la recuperación temporal de conocimientos: necesitan una adaptación profunda y duradera", explica Jyo Pari, doctorando del MIT y coautor del artículo. "Tanto si se trata de un asistente de codificación que domina marcos de trabajo propios como de una IA de atención al cliente que aprende las preferencias de los usuarios, este conocimiento debe incrustarse en la arquitectura central del modelo".

La arquitectura SEAL

Visión general del marco SEAL (Fuente: arXiv)

El marco SEAL introduce un novedoso enfoque de aprendizaje por refuerzo en el que los modelos generan "autoediciones", es decir, instrucciones especializadas para actualizar sus propios parámetros. Estas ediciones pueden reestructurar la información, crear ejemplos de entrenamiento sintéticos o incluso definir protocolos de aprendizaje, lo que permite al modelo diseñar su propio plan de estudios.

El sistema funciona mediante dos ciclos de aprendizaje:

Bucle interno: Ejecuta actualizaciones temporales de pesos basadas en ediciones autogeneradas.
Bucle externo: Evalúa la eficacia de las actualizaciones y refuerza las estrategias acertadas.

Este mecanismo de mejora continua combina la generación de datos sintéticos, el aprendizaje por refuerzo y el entrenamiento en tiempo de prueba en un paradigma de aprendizaje cohesivo.

Rendimiento probado en todos los ámbitos

Integración de conocimientos

En las pruebas de retención de conocimientos, los modelos mejorados con SEAL demostraron una precisión del 47% en el recuerdo del contenido de los pasajes sin acceso al material original, superando significativamente tanto al ajuste fino de referencia como a los datos sintéticos generados con GPT-4.1.

Aprendizaje de pocos fragmentos

Cuando se aplicó a problemas de razonamiento abstracto del conjunto de datos ARC, SEAL consiguió un 72,5% de aciertos, lo que supone una mejora espectacular con respecto a los métodos estándar de aprendizaje en contexto.

Aplicaciones empresariales

Ante la creciente preocupación por el agotamiento de los datos de formación de alta calidad, la capacidad de SEAL para autogenerar materiales de aprendizaje ofrece un camino sostenible hacia el futuro. La tecnología permite a los modelos profundizar de forma autónoma en la comprensión de documentos complejos, como trabajos de investigación o informes financieros, mediante la autoexplicación iterativa.

El marco resulta especialmente prometedor para el desarrollo de agentes de IA, ya que permite a los sistemas integrar permanentemente conocimientos operativos procedentes de interacciones con el entorno. A diferencia de los enfoques de programación estática, los agentes potenciados por SEAL pueden hacer evolucionar sus competencias a lo largo del tiempo, reduciendo al mismo tiempo la dependencia de la intervención humana.

Limitaciones actuales

La implementación de SEAL se enfrenta a varias consideraciones prácticas:

Olvido catastrófico: La autoedición continua corre el riesgo de sobrescribir la información aprendida previamente.
Sobrecarga computacional: El proceso de adaptación requiere un tiempo de procesamiento considerable.
Se necesita una aplicación híbrida: La combinación de SEAL con la generación aumentada por recuperación (RAG) puede optimizar la gestión de la memoria.

"Recomendamos a las empresas que apliquen ciclos de actualización programados en lugar de una adaptación continua", aconseja Pari. "Así se equilibran los beneficios de la adaptación con las limitaciones operativas prácticas".

Mejora progresiva de SEAL (Fuente: arXiv)

La investigación demuestra que los modelos lingüísticos no tienen por qué permanecer estáticos tras el entrenamiento inicial. Al aprender a generar y aplicar sus propias actualizaciones, pueden ampliar sus conocimientos de forma autónoma y adaptarse a nuevos retos, una capacidad que podría redefinir la implantación de la IA en las empresas.

Artículo relacionado

Microsoft reduce su plantilla pese a sus sólidos resultados financieros Microsoft anuncia una reestructuración estratégica de su plantillaMicrosoft ha iniciado recortes de personal que afectan a aproximadamente 7.000 empleados, lo que representa el 3% de su plantilla global. Es importante destacar que estos cambios refle

Multiverse AI lanza innovadores modelos en miniatura de alto rendimiento Una empresa europea pionera en el campo de la inteligencia artificial ha presentado unos revolucionarios modelos de tamaño micro que llevan el nombre de cerebros de ave e insecto y demuestran que una

Un estudio de Microsoft revela que más tokens de IA aumentan los errores de razonamiento Nuevos conocimientos sobre la eficacia del razonamiento LLMUna nueva investigación de Microsoft demuestra que las técnicas avanzadas de razonamiento de los grandes modelos lingüísticos no producen mej

comentario (0)

0/200

Entregar

Noticias principales

Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O AI Builder y Power Automate Revolucionan la Sumarización de Documentos Doblaje AI: Guía Definitiva para la Creación de Voz Realista La IA de Cambium transforma la madera de los desechos en madera Duolingo Cambia al Sistema de Energía Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Dos Métodos Gratuitos para una Suscripción de un Año a Perplexity Pro Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada

Más

Presentado