El modelo pequeño Qwen 3.5 de Alibaba planta cara a su rival GPT-4o

Un modelo de 4000 millones de parámetros demuestra que «menos es más» y abre una nueva era para la implementación local de la IA en China
El campo de la IA ha funcionado durante mucho tiempo bajo la creencia de que un mayor número de parámetros equivale a una mayor inteligencia. Sin embargo, la serie Qwen 3.5 de modelos pequeños lanzada recientemente por Alibaba ha proporcionado un ejemplo paradigmático de que «lo pequeño vence a lo grande». En pruebas del mundo real, el modelo Qwen 3.5-4B, con solo 4000 millones de parámetros, se enfrentó cara a cara con el modelo GPT-4o, del que se rumorea que tiene más de 100 000 millones de parámetros, y no solo se mantuvo a la altura, sino que incluso salió ligeramente por delante.
Este desafío entre niveles fue llevado a cabo por la entidad independiente N8 Programs. Los evaluadores seleccionaron al azar 1000 preguntas del mundo real del conjunto de datos WildChat, enfrentando a Qwen 3.5-4B contra GPT-4o en el mismo escenario, con Opus 4.6 —actualmente reconocido como el juez más potente— supervisando la competición. Los resultados fueron sorprendentes: en esta arena de preguntas y respuestas de 1000 rondas, Qwen 3.5-4B logró 499 victorias, 431 derrotas y 70 empates, superando finalmente a GPT-4o.
La cifra más asombrosa es que se especula que GPT-4o posee hasta 200 000 millones de parámetros, mientras que Qwen 3.5-4B cuenta con apenas el 2 % de esa cifra. Esto demuestra el logro de Alibaba de obtener resultados de razonamiento lógico de primer nivel con un gasto mínimo de recursos.
Más allá de su formidable rendimiento, el principal atractivo de la serie Qwen 3.5 reside en su excepcional idoneidad para la implementación local. El lanzamiento oficial incluye cuatro tamaños —0,8B, 2B, 4B y 9B— que abarcan escenarios que van desde dispositivos periféricos de IoT hasta servidores. La versión 4B es especialmente destacable, ya que, en teoría, solo requiere 8 GB de VRAM para funcionar, con 16 GB recomendados para un funcionamiento fluido.
Para los usuarios y desarrolladores habituales, esto representa una forma de «liberación de la potencia de cálculo». Ya no hay necesidad de tarjetas de cálculo profesionales que cuestan decenas de miles; ahora puedes tener un «asistente personal» con un rendimiento que rivaliza con los grandes modelos de primer nivel directamente en tu propio ordenador, o incluso en tu smartphone.
Tal y como ha demostrado el equipo de Qwen : más grande no siempre significa mejor. Una IA que pueda ejecutarse en los propios dispositivos de los usuarios es lo que realmente va a cambiar las reglas del juego para la productividad futura. Con la versión 9B compitiendo directamente con el rendimiento de los grandes modelos de clase 120B, los grandes modelos chinos están demostrando la capacidad innovadora única de China a través de este enfoque de «optimización», revelando a la comunidad global de desarrolladores la fuerza de la IA «Made in China».
Artículo relacionado
¿Cómo proteger los bienes, los edificios y la salud personal?
En un mundo impredecible, la protección se ha convertido en una necesidad estratégica, no solo en una opción. Ya se trate de proteger las finanzas, reforzar los edificios o cuidar la salud personal, l
El navegador con IA Comet se estrena con compatibilidad total con la multitarea en el iPad
El navegador con IA de Perplexity, Comet, ha lanzado oficialmente su versión para iPad, ahora totalmente compatible con iPadOS. La actualización introduce la navegación en múltiples ventanas, compatib
Trace recauda 3 millones de dólares para superar las barreras en la adopción de agentes de IA empresariales
A pesar de su potencial, los agentes de IA han tenido dificultades para ganar terreno en el ámbito empresarial. Una startup emergente cree que el problema fundamental radica en la falta de contexto.Lanzada como parte del grupo de verano 2025 de Y Co
Recomendaciones de temas especiales relacionados
comentario (1)
0/500

Un modelo de 4000 millones de parámetros demuestra que «menos es más» y abre una nueva era para la implementación local de la IA en China
El campo de la IA ha funcionado durante mucho tiempo bajo la creencia de que un mayor número de parámetros equivale a una mayor inteligencia. Sin embargo, la serie
Este desafío entre niveles fue llevado a cabo por la entidad independiente N8 Programs. Los evaluadores seleccionaron al azar 1000 preguntas del mundo real del conjunto de datos WildChat, enfrentando a Qwen 3.5-4B contra GPT-4o en el mismo escenario, con Opus 4.6 —actualmente reconocido como el juez más potente— supervisando la competición. Los resultados fueron sorprendentes: en esta arena de preguntas y respuestas de 1000 rondas, Qwen 3.5-4B logró 499 victorias, 431 derrotas y 70 empates, superando finalmente a GPT-4o.
La cifra más asombrosa es que se especula que GPT-4o posee hasta 200 000 millones de parámetros, mientras que Qwen 3.5-4B cuenta con apenas el 2 % de esa cifra. Esto demuestra el logro de Alibaba de obtener resultados de razonamiento lógico de primer nivel con un gasto mínimo de recursos.
Más allá de su formidable rendimiento, el principal atractivo de la serie Qwen 3.5 reside en su excepcional idoneidad para la implementación local. El lanzamiento oficial incluye cuatro tamaños —0,8B, 2B, 4B y 9B— que abarcan escenarios que van desde dispositivos periféricos de IoT hasta servidores. La versión 4B es especialmente destacable, ya que, en teoría, solo requiere 8 GB de VRAM para funcionar, con 16 GB recomendados para un funcionamiento fluido.
Para los usuarios y desarrolladores habituales, esto representa una forma de «liberación de la potencia de cálculo». Ya no hay necesidad de tarjetas de cálculo profesionales que cuestan decenas de miles; ahora puedes tener un «asistente personal» con un rendimiento que rivaliza con los grandes modelos de primer nivel directamente en tu propio ordenador, o incluso en tu smartphone.
Tal y como ha demostrado el equipo
¿Cómo proteger los bienes, los edificios y la salud personal?
En un mundo impredecible, la protección se ha convertido en una necesidad estratégica, no solo en una opción. Ya se trate de proteger las finanzas, reforzar los edificios o cuidar la salud personal, l
El navegador con IA Comet se estrena con compatibilidad total con la multitarea en el iPad
El navegador con IA de Perplexity, Comet, ha lanzado oficialmente su versión para iPad, ahora totalmente compatible con iPadOS. La actualización introduce la navegación en múltiples ventanas, compatib
Trace recauda 3 millones de dólares para superar las barreras en la adopción de agentes de IA empresariales
A pesar de su potencial, los agentes de IA han tenido dificultades para ganar terreno en el ámbito empresarial. Una startup emergente cree que el problema fundamental radica en la falta de contexto.Lanzada como parte del grupo de verano 2025 de Y Co





Hogar






