opción
Hogar
Noticias
Un estudio de Microsoft revela que más tokens de IA aumentan los errores de razonamiento

Un estudio de Microsoft revela que más tokens de IA aumentan los errores de razonamiento

29 de septiembre de 2025
78

Nuevos conocimientos sobre la eficacia del razonamiento LLM

Una nueva investigación de Microsoft demuestra que las técnicas avanzadas de razonamiento de los grandes modelos lingüísticos no producen mejoras uniformes en los distintos sistemas de IA. Su innovador estudio analizó cómo respondían nueve de los principales modelos básicos a varios enfoques de escalado durante la inferencia.

Evaluación de los métodos de escalado del tiempo de inferencia

El equipo de investigación aplicó una rigurosa metodología de pruebas en tres técnicas de escalado distintas:

  • La inducción tradicional de la cadena de pensamiento
  • Generación paralela de respuestas con agregación
  • Refinamiento secuencial mediante bucles de retroalimentación
Marco experimental para evaluar el rendimiento del razonamiento

Ocho evaluaciones comparativas exhaustivas proporcionaron escenarios de prueba desafiantes en disciplinas como las matemáticas, el razonamiento científico, la resolución de problemas complejos y el análisis espacial. Varias evaluaciones presentaban niveles de dificultad graduados para examinar cómo se escala el rendimiento con la complejidad del problema.

Descubrimientos clave sobre el rendimiento en razonamiento

La exhaustiva evaluación arrojó varios datos fundamentales para los profesionales de la IA:

  • El aumento del rendimiento de las técnicas de escalado varía drásticamente según la arquitectura del modelo y el ámbito de la tarea.
  • Las respuestas más largas no se correlacionan sistemáticamente con mejores soluciones.
  • Los costes de cálculo fluctúan de forma impredecible incluso para consultas idénticas.
  • En ocasiones, los modelos tradicionales pueden igualar a los modelos de razonamiento especializados mediante un amplio escalado.
  • Los mecanismos de verificación son prometedores para mejorar la eficiencia
Rendimiento frente a coste computacional en distintos modelos y tareas

Implicaciones prácticas para el desarrollo de la IA

Estas conclusiones tienen importantes implicaciones para la aplicación de la IA en las empresas:

La previsibilidad de los costes se perfila como un reto importante, ya que el uso de tokens muestra una gran variabilidad incluso para las respuestas correctas. "Los desarrolladores necesitan modelos con patrones de cálculo coherentes", señala Besmira Nushi, investigadora de Microsoft.

La investigación también identifica la longitud de la respuesta como un indicador potencial de la confianza del modelo, ya que las respuestas excesivamente largas suelen indicar soluciones incorrectas más allá de ciertos umbrales.

Patrones de escalado de inferencias en el rendimiento de GPT-4o

El futuro de los sistemas de razonamiento eficientes

El estudio destaca varias direcciones prometedoras para el desarrollo futuro:

"Los mecanismos de verificación podrían transformar nuestra forma de abordar los problemas de razonamiento", explica Nushi, y sugiere que los sistemas de validación empresarial existentes podrían adaptarse a las aplicaciones de IA. Esta integración permitiría a las interfaces de lenguaje natural aprovechar la lógica de validación especializada.

La investigación subraya la creciente necesidad de soluciones que equilibren la precisión del razonamiento con unos costes computacionales predecibles a medida que los sistemas de IA asumen tareas cada vez más complejas en el mundo real.

Artículo relacionado
Google integra IA autónoma y widgets con código de ambiente en Android Google integra IA autónoma y widgets con código de ambiente en Android Google anunció el martes, durante el evento «Android Show: I/O Edition», una nueva serie de funciones de IA bajo su marca Gemini Intelligence. Estas capacidades incluyen la posibilidad de que la IA ge
El modelo de IA de Meta destaca, pero la identidad de código abierto se ve mermada El modelo de IA de Meta destaca, pero la identidad de código abierto se ve mermada El panorama de la IA de código abierto siempre ha ofrecido numerosas opciones. Durante años, los desarrolladores pudieron acceder a modelos como Mistral, Falcon y un número cada vez mayor de alternati
Un padre demanda a Google y culpa al chatbot Gemini de la ilusión fatal que sufrió su hijo Un padre demanda a Google y culpa al chatbot Gemini de la ilusión fatal que sufrió su hijo Jonathan Gavalas, de 36 años, comenzó a utilizar el chatbot de IA Gemini de Google en agosto de 2025 para que le ayudara con las compras, la redacción de textos y la planificación de viajes. El 2 de o
Recomendaciones de temas especiales relacionados
Negocio Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos
Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas
xix.ai
Productividad Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental
Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas
xix.ai
chatbot Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes
Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes

Descubre los mejores chatbots románticos con IA de 2026 para establecer relaciones auténticas y duraderas. Nuestra lista seleccionada incluye personalidades sólidas y coherentes, comparativas entre versiones gratuitas y de pago, y pruebas en situaciones reales. Encuentra a tu compañero ideal y empieza a construir tu relación hoy mismo en XIX.AI.

10 herramientas
xix.ai
Educación y aprendizaje Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.
Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.

Descubra a los mejores mentores en ciencia de datos y AI de 2026 para dominar SQL, Pandas y flujos de trabajo de aprendizaje automático. Explore nuestra selección cuidadosamente seleccionada y altamente valorada en XIX.AI para obtener orientación poderosa que cambie completamente la situación. Compare las opciones gratuitas con las pagadas y obtenga información basada en casos reales. Desbloquee su dominio de la ciencia de datos hoy mismo.

10 herramientas
xix.ai
chatbot Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real
Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real

Descubre los mejores cursos de 2026 sobre coqueteo y conversación con IA en XIX.AI. Nuestra selección, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a desarrollar tu carisma social y tu confianza en tiempo real. Explora herramientas imprescindibles y revolucionarias con comparativas entre versiones gratuitas y de pago, y clasificaciones que se actualizan semanalmente. Potencia hoy mismo tus habilidades sociales.

10 herramientas
xix.ai
código Las mejores herramientas de IA para pruebas unitarias automatizadas: genera casos de prueba con Jest, PyTest y JUnit con un solo clic
Las mejores herramientas de IA para pruebas unitarias automatizadas: genera casos de prueba con Jest, PyTest y JUnit con un solo clic

Descubre las mejores herramientas de IA de 2026 para la automatización de pruebas unitarias. Nuestra selección incluye potentes soluciones revolucionarias que permiten generar casos de prueba para Jest, PyTest y JUnit al instante. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones actualizadas semanalmente en XIX.AI. Aprovecha las ventajas de la IA y aumenta la productividad de tu desarrollo hoy mismo.

10 herramientas
xix.ai
comentario (1)
0/500
JerryGonzález
JerryGonzález 3 de febrero de 2026 21:02:33 GMT+01:00

この記事には正直驚いたよ!トークン数を増やすほど推論エラーが増えるって…逆に直観に反する結果だね。🤔それってAIをどんどん複雑にする今のトレンドに警鐘を鳴らしてる気がする。コスト増でも性能アップすると思ってたけど、単純に大きければ良いわけじゃないんだ。こんな研究が続けば、AIの最適化って意外とシンプルな方向に行くかも?

OR