El modelo de IA de código abierto Qwen de Alibaba bate récords en razonamiento
El equipo Qwen de Alibaba ha presentado una nueva versión de su modelo de IA de razonamiento de código abierto, con unos resultados de referencia extraordinarios.
Introducing Qwen3-235B-A22B-Thinking-2507. Durante los últimos tres meses, el equipo de Qwen ha estado ampliando intensamente lo que denominan la "capacidad de pensamiento" del modelo, esforzándose por mejorar tanto la calidad como la profundidad de sus procesos de razonamiento.
El resultado es un modelo que realmente brilla en las áreas más exigentes: razonamiento lógico, matemáticas complejas, retos científicos y codificación avanzada. En campos que normalmente exigen experiencia humana, este último modelo de Qwen está estableciendo un nuevo listón para la IA de código abierto.
En las pruebas de razonamiento, el modelo de IA de código abierto más reciente de Qwen obtiene una puntuación de 92,3 en AIME25 y de 74,1 en LiveCodeBench v6 para codificación. También obtiene buenos resultados en evaluaciones de capacidad más amplias, con un 79,7 en Arena-Hard v2, una métrica que evalúa la alineación con las preferencias humanas.

Básicamente, se trata de un modelo de IA de razonamiento a gran escala del equipo Qwen, con un total de 235.000 millones de parámetros. Sin embargo, emplea una arquitectura de Mezcla de Expertos (MDE), lo que significa que sólo un subconjunto de estos parámetros -aproximadamente 22.000 millones- están activos en un momento dado. Imagíneselo como un vasto equipo de 128 especialistas a la espera, en el que sólo trabajan los ocho mejores expertos para una tarea concreta.
Uno de sus atributos más destacados es su excepcional capacidad de memoria. El modelo de IA de razonamiento de código abierto de Qwen admite de forma nativa una longitud de contexto de 262.144 tokens, lo que supone una ventaja significativa para tareas que requieren la comprensión de información extensa.
Para desarrolladores y entusiastas, el equipo de Qwen ha simplificado el proceso de puesta en marcha. El modelo es accesible en Hugging Face y puede desplegarse utilizando herramientas como sglang o vllm para configurar un punto final de API personal. El equipo también destaca su marco Qwen-Agent como el método óptimo para aprovechar las funcionalidades de llamada a herramientas del modelo.
Para alcanzar el máximo rendimiento con este modelo de razonamiento de IA de código abierto, el equipo de Qwen ofrece varias recomendaciones. Aconsejan una longitud de salida de unos 32.768 tokens para tareas estándar, pero para problemas muy complejos, aumentar esta longitud a 81.920 tokens permite a la IA disponer de espacio suficiente para "pensar". También sugieren utilizar instrucciones explícitas en sus indicaciones, como solicitar un enfoque de "razonamiento paso a paso" para problemas matemáticos, para obtener las respuestas más precisas y bien organizadas.
El lanzamiento de este nuevo modelo Qwen ofrece una IA de razonamiento potente y de código abierto capaz de competir con los principales modelos patentados, sobre todo a la hora de abordar retos intrincados e intelectualmente exigentes. Será fascinante observar lo que la comunidad de desarrolladores crea con esta tecnología.
Véase también: Plan de acción sobre IA: El liderazgo de EE.UU. debe ser "indiscutible
¿Está interesado en profundizar sus conocimientos sobre IA y big data de la mano de expertos del sector? Asista a la AI & Big Data Expo en Ámsterdam, California y Londres. Este completo evento se celebra junto con otras importantes conferencias, como la Intelligent Automation Conference, BlockX, la Digital Transformation Week y la Cyber Security & Cloud Expo.
Descubra aquí más eventos y seminarios web sobre tecnología empresarial organizados por TechForge.
Artículo relacionado
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física
Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Recomendaciones de temas especiales relacionados
comentario (1)
0/500
El equipo Qwen de Alibaba ha presentado una nueva versión de su modelo de IA de razonamiento de código abierto, con unos resultados de referencia extraordinarios.
Introducing Qwen3-235B-A22B-Thinking-2507. Durante los últimos tres meses, el equipo de Qwen ha estado ampliando intensamente lo que denominan la "capacidad de pensamiento" del modelo, esforzándose por mejorar tanto la calidad como la profundidad de sus procesos de razonamiento.
El resultado es un modelo que realmente brilla en las áreas más exigentes: razonamiento lógico, matemáticas complejas, retos científicos y codificación avanzada. En campos que normalmente exigen experiencia humana, este último modelo de Qwen está estableciendo un nuevo listón para la IA de código abierto.
En las pruebas de razonamiento, el modelo de IA de código abierto más reciente de Qwen obtiene una puntuación de 92,3 en AIME25 y de 74,1 en LiveCodeBench v6 para codificación. También obtiene buenos resultados en evaluaciones de capacidad más amplias, con un 79,7 en Arena-Hard v2, una métrica que evalúa la alineación con las preferencias humanas.

Básicamente, se trata de un modelo de IA de razonamiento a gran escala del equipo Qwen, con un total de 235.000 millones de parámetros. Sin embargo, emplea una arquitectura de Mezcla de Expertos (MDE), lo que significa que sólo un subconjunto de estos parámetros -aproximadamente 22.000 millones- están activos en un momento dado. Imagíneselo como un vasto equipo de 128 especialistas a la espera, en el que sólo trabajan los ocho mejores expertos para una tarea concreta.
Uno de sus atributos más destacados es su excepcional capacidad de memoria. El modelo de IA de razonamiento de código abierto de Qwen admite de forma nativa una longitud de contexto de 262.144 tokens, lo que supone una ventaja significativa para tareas que requieren la comprensión de información extensa.
Para desarrolladores y entusiastas, el equipo de Qwen ha simplificado el proceso de puesta en marcha. El modelo es accesible en Hugging Face y puede desplegarse utilizando herramientas como sglang o vllm para configurar un punto final de API personal. El equipo también destaca su marco Qwen-Agent como el método óptimo para aprovechar las funcionalidades de llamada a herramientas del modelo.
Para alcanzar el máximo rendimiento con este modelo de razonamiento de IA de código abierto, el equipo de Qwen ofrece varias recomendaciones. Aconsejan una longitud de salida de unos 32.768 tokens para tareas estándar, pero para problemas muy complejos, aumentar esta longitud a 81.920 tokens permite a la IA disponer de espacio suficiente para "pensar". También sugieren utilizar instrucciones explícitas en sus indicaciones, como solicitar un enfoque de "razonamiento paso a paso" para problemas matemáticos, para obtener las respuestas más precisas y bien organizadas.
El lanzamiento de este nuevo modelo Qwen ofrece una IA de razonamiento potente y de código abierto capaz de competir con los principales modelos patentados, sobre todo a la hora de abordar retos intrincados e intelectualmente exigentes. Será fascinante observar lo que la comunidad de desarrolladores crea con esta tecnología.
Véase también: Plan de acción sobre IA: El liderazgo de EE.UU. debe ser "indiscutible
¿Está interesado en profundizar sus conocimientos sobre IA y big data de la mano de expertos del sector? Asista a la AI & Big Data Expo en Ámsterdam, California y Londres. Este completo evento se celebra junto con otras importantes conferencias, como la Intelligent Automation Conference, BlockX, la Digital Transformation Week y la Cyber Security & Cloud Expo.
Descubra aquí más eventos y seminarios web sobre tecnología empresarial organizados por TechForge.
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere





Hogar






