opción
Hogar
Noticias
TreeQuest de Sakana AI mejora el rendimiento de la IA con la colaboración entre varios modelos

TreeQuest de Sakana AI mejora el rendimiento de la IA con la colaboración entre varios modelos

24 de agosto de 2025
68

El laboratorio japonés de IA Sakana AI ha presentado una técnica que permite a varios modelos lingüísticos de gran tamaño (LLM) trabajar juntos y formar un equipo de IA muy eficaz. Con el nombre de Multi-LLM AB-MCTS, este método permite a los modelos participar en el método de ensayo y error, aprovechando sus puntos fuertes únicos para abordar tareas complejas que están fuera del alcance de un solo modelo.

Para las empresas, este enfoque ofrece una forma de construir sistemas de IA más potentes. En lugar de depender de un único proveedor o modelo, las empresas pueden aprovechar dinámicamente los puntos fuertes de varios modelos de frontera, asignando la mejor IA a cada segmento de tareas para lograr resultados óptimos.

Aprovechar la inteligencia colectiva

Los modelos de IA de frontera avanzan rápidamente, cada uno con puntos fuertes y débiles distintos basados en sus datos de formación y su diseño. Un modelo puede brillar en codificación, otro en escritura creativa. El equipo de Sakana AI ve estas diferencias como ventajas, no como defectos.

"Consideramos estas capacidades únicas como herramientas valiosas para construir inteligencia colectiva", señalan los investigadores en su blog. Argumentan que, al igual que los equipos humanos logran grandes avances gracias a la diversidad, los sistemas de IA pueden conseguir más colaborando. "Combinando sus puntos fuertes, los sistemas de IA pueden resolver retos que ningún modelo podría superar por sí solo".

Mejorar el rendimiento en la inferencia

El algoritmo de Sakana AI, una técnica de "escalado en tiempo de inferencia" (también llamado "escalado en tiempo de prueba"), está ganando terreno en la investigación de la IA. A diferencia del "escalado en tiempo de entrenamiento", que se centra en modelos y conjuntos de datos más grandes, el escalado en tiempo de inferencia aumenta el rendimiento optimizando los recursos informáticos tras el entrenamiento.

Un método utiliza el aprendizaje por refuerzo para animar a los modelos a producir secuencias detalladas de cadena de pensamiento (CoT), como se ha visto en modelos como OpenAI o3 y DeepSeek-R1. Otro método, el muestreo repetido, pide al modelo que genere varias soluciones, algo parecido a una lluvia de ideas. El método de Sakana AI refina estos conceptos.

"Nuestro marco mejora el muestreo Best-of-N", explica Takuya Akiba, investigador científico de Sakana AI y coautor del artículo, en una entrevista concedida a VentureBeat. "Mejora técnicas de razonamiento como el CoT ampliado a través del aprendizaje por refuerzo. Al elegir estratégicamente el enfoque de búsqueda y el LLM adecuado, optimiza el rendimiento dentro de unas llamadas limitadas, destacando en tareas complejas."

Funcionamiento de la búsqueda adaptativa por ramas

El núcleo de la técnica es el algoritmo AB-MCTS (Adaptive Branching Monte Carlo Tree Search). Este algoritmo permite a los LLM llevar a cabo un proceso inteligente de prueba y error, equilibrando la "búsqueda más profunda" (refinando una solución prometedora) y la "búsqueda más amplia" (generando nuevas soluciones). AB-MCTS combina estas estrategias, lo que permite al sistema refinar ideas o pivotar hacia otras nuevas cuando es necesario.

Para ello utiliza el algoritmo Monte Carlo Tree Search (MCTS), un algoritmo de toma de decisiones utilizado en AlphaGo de DeepMind. AB-MCTS emplea modelos de probabilidad para decidir si refinar o reiniciar en cada paso.

Diferentes estrategias de escalado del tiempo de prueba Fuente: Sakana AI

Multi-LLM AB-MCTS va más allá al decidir no solo "qué" hacer (refinar o generar), sino también "qué" LLM utilizar. Al principio, el sistema desconoce cuál es el mejor modelo para una tarea, por lo que prueba una combinación de LLM y, con el tiempo, aprende cuáles funcionan mejor y les asigna más trabajo.

Pruebas del equipo de IA

El sistema Multi-LLM AB-MCTS se evaluó en la prueba de referencia ARC-AGI-2, que pone a prueba el razonamiento visual de tipo humano en problemas novedosos, un duro reto para la IA.

El equipo combinó modelos de vanguardia como o4-mini, Gemini 2.5 Pro y DeepSeek-R1.

El modelo colectivo resolvió más del 30% de los 120 problemas de prueba, superando con creces el rendimiento de cualquier modelo individual. El sistema asignó dinámicamente el mejor modelo para cada tarea, identificando rápidamente el LLM más eficaz cuando existía una ruta de solución clara.

AB-MCTS frente a modelos individuales (fuente: Sakana AI)
AB-MCTS frente a modelos individuales Fuente: Sakana AI

Sorprendentemente, el sistema resolvió problemas que antes eran irresolubles para un solo modelo. En un caso, una solución incorrecta de o4-mini fue refinada por DeepSeek-R1 y Gemini-2.5 Pro, que corrigieron el error y dieron la respuesta correcta.

"Esto demuestra que Multi-LLM AB-MCTS puede combinar modelos de frontera para abordar retos que antes eran irresolubles, ampliando los límites de la inteligencia colectiva de IA", afirman los investigadores.

AB-MTCS puede seleccionar diferentes modelos en distintas fases de la resolución de un problema (fuente: Sakana AI)
AB-MTCS puede seleccionar diferentes modelos en distintas fases de la resolución de un problema Fuente: Sakana AI

"Los puntos fuertes y las tendencias de alucinación de cada modelo varían", señala Akiba. "Al emparejar modelos con menores riesgos de alucinación, podemos lograr tanto un razonamiento potente como fiabilidad, abordando una preocupación empresarial clave".

De la investigación al uso práctico

Sakana AI ha lanzado TreeQuest, un framework de código abierto bajo licencia Apache 2.0, que permite a desarrolladores y empresas implementar Multi-LLM AB-MCTS. Su flexible API permite personalizar la puntuación y la lógica para diversas tareas.

"Todavía estamos explorando AB-MCTS para retos empresariales específicos, pero su potencial es evidente", afirma Akiba.

Además de la prueba ARC-AGI-2, AB-MCTS ha tenido éxito en tareas como la codificación compleja y la mejora de la precisión de los modelos de aprendizaje automático.

"AB-MCTS destaca en tareas iterativas de ensayo y error, como la optimización de las métricas de rendimiento del software", añade Akiba. "Por ejemplo, podría reducir automáticamente la latencia de respuesta de los servicios web".

Esta herramienta de código abierto podría hacer posible una nueva generación de aplicaciones empresariales de IA robustas y fiables.

Artículo relacionado
Multiverse Computing lanza un modelo generativo de IA comprimido gratuito Multiverse Computing lanza un modelo generativo de IA comprimido gratuito Los modelos lingüísticos de gran tamaño se enfrentan a un reto importante: su inmenso tamaño. La startup española Multiverse Computing está abordando este problema mediante la creación de modelos comp
Datos secretos de seguimiento revelan el robo de modelos de IA Datos secretos de seguimiento revelan el robo de modelos de IA Un nuevo método puede marcar de forma invisible modelos como ChatGPT en cuestión de segundos sin necesidad de volver a entrenarlos, sin dejar rastro en los resultados estándar y resistiendo todos los
Sistemas de IA engañados para aprobar artículos científicos absurdos Sistemas de IA engañados para aprobar artículos científicos absurdos Una nueva investigación revela que los sistemas de IA ahora pueden producir artículos científicos fraudulentos que otros modelos de IA aceptan erróneamente como auténticos. Estos estudios falsos elude
Recomendaciones de temas especiales relacionados
Creación de cómics Las mejores herramientas de coloración automática con IA para manga: aplica colores planos sin ningún error de coherencia
Las mejores herramientas de coloración automática con IA para manga: aplica colores planos sin ningún error de coherencia

Descubre las mejores herramientas de coloración automática con IA para manga de 2026 en XIX.AI. Nuestra lista seleccionada incluye soluciones revolucionarias y mejor valoradas que aplican colores planos sin ningún error de consistencia, lo que potencia tu productividad. Explora comparativas entre opciones gratuitas y de pago, pruebas en condiciones reales y clasificaciones actualizadas semanalmente para encontrar la opción perfecta para ti. Aprovecha hoy mismo las ventajas de la IA.

10 herramientas
xix.ai
escribiendo Los mejores creadores de perfiles de ficción con IA: cómo generar motivaciones y defectos fatales coherentes para los personajes
Los mejores creadores de perfiles de ficción con IA: cómo generar motivaciones y defectos fatales coherentes para los personajes

Descubre los mejores creadores de perfiles de ficción con IA de 2026 para dar vida a personajes profundos. La selección de XIX.AI incluye herramientas de primera categoría y revolucionarias que generan motivaciones coherentes y defectos fatales. Compara las opciones gratuitas con las de pago mediante pruebas en el mundo real. Libera ahora tu potencial narrativo.

10 herramientas
xix.ai
Negocio El mejor software de optimización de precios con IA: realiza un seguimiento de la competencia y ajusta automáticamente los precios de la tienda
El mejor software de optimización de precios con IA: realiza un seguimiento de la competencia y ajusta automáticamente los precios de la tienda

Descubre el mejor software de optimización de precios con IA de 2026 en XIX.AI. Nuestra selección incluye herramientas de primera categoría y revolucionarias que analizan a la competencia y ajustan automáticamente los precios de tu tienda para maximizar los beneficios. Compara las opciones gratuitas con las de pago mediante pruebas reales. Aprovecha ahora tu ventaja competitiva en materia de precios.

10 herramientas
xix.ai
código Los mejores revisores de código basados en IA: automatiza el cumplimiento de las normas de código limpio y refactoriza los archivos de repositorios heredados
Los mejores revisores de código basados en IA: automatiza el cumplimiento de las normas de código limpio y refactoriza los archivos de repositorios heredados

Descubre los mejores revisores de código con IA de 2026 en XIX.AI. Nuestra lista seleccionada incluye herramientas de primera categoría y revolucionarias para automatizar el cumplimiento de las normas de código limpio y refactorizar archivos de repositorios heredados. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo tu ventaja con la IA.

10 herramientas
xix.ai
Texto a voz Las mejores aplicaciones de síntesis de voz con IA para la dislexia: apoyo al aprendizaje y mejora de la eficiencia en la lectura de los estudiantes
Las mejores aplicaciones de síntesis de voz con IA para la dislexia: apoyo al aprendizaje y mejora de la eficiencia en la lectura de los estudiantes

Descubre las mejores aplicaciones de TTS con IA de 2026, seleccionadas específicamente para ayudar a las personas con dislexia. Nuestra clasificación, elaborada por expertos, compara herramientas gratuitas y de pago, y destaca sus potentes funciones para mejorar la eficiencia en la lectura y el aprendizaje. Explora soluciones innovadoras e imprescindibles para liberar el potencial de los estudiantes. Empieza tu viaje en XIX.AI.

10 herramientas
xix.ai
Creación de cómics Los mejores generadores de IA para manga shonen: crea secuencias de acción trepidantes y efectos de energía
Los mejores generadores de IA para manga shonen: crea secuencias de acción trepidantes y efectos de energía

Descubre los mejores generadores de IA para manga shonen de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas para crear secuencias de acción trepidantes y efectos energéticos dinámicos. Compara las opciones gratuitas con las de pago mediante pruebas reales. ¡Libera tu potencial creativo y empieza a crear manga épico hoy mismo!

15 herramientas
xix.ai
comentario (1)
0/500
JoseJackson
JoseJackson 12 de febrero de 2026 09:00:30 GMT+01:00

Вот это да! Модели ИИ, которые сотрудничают, как настоящая команда? Это напоминает мне о том, как разные эксперты работают вместе над сложным проектом. Интересно, сможет ли этот подход решить проблему узкой специализации ИИ, когда одна модель хороша в одном, но бесполезна в другом. Надеюсь, это не приведёт к тому, что ИИ начнут 'ссориться' между собой из-за разных точек зрения! 🤔

OR