Малая модель Qwen 3.5 от Alibaba бросает вызов GPT-4o

Модель с 4 миллиардами параметров доказывает, что «меньше — значит больше», открывая новую эру внедрения локального ИИ в Китае
В сфере ИИ долгое время считалось, что большее количество параметров означает более высокий уровень интеллекта. Однако недавно выпущенная Alibaba серия небольших моделей Qwen 3.5 стала наглядным примером того, что «малое побеждает большое». В реальных тестах модель Qwen 3.5-4B, имеющая всего 4 миллиарда параметров, сошлась в прямом противостоянии с моделью GPT-4o, которая, по слухам, имеет более 100 миллиардов параметров, и не только не уступила, но даже немного опередила соперника.
Этот межуровневый конкурс был организован сторонней организацией N8 Programs. Тестировщики случайным образом отобрали 1000 реальных вопросов из набора данных WildChat, поставив Qwen 3.5-4B и GPT-4o на одну арену, а Opus 4.6 — в настоящее время признанный самым мощным судьей — наблюдал за соревнованием. Результаты оказались неожиданными: в ходе этой серии из 1000 раундов вопросов и ответов Qwen 3.5-4B одержал 499 побед, потерпел 431 поражение и сыграл 70 ничьих, в итоге превзойдя GPT-4o.
Самым поразительным является то, что, по предположениям, GPT-4o обладает до 200 миллиардов параметров, в то время как у Qwen 3.5-4B их всего 2%. Это демонстрирует достижение Alibaba в области логического мышления высшего уровня при минимальных затратах ресурсов.
Помимо впечатляющей производительности, основная привлекательность серии Qwen 3.5 заключается в ее исключительной пригодности для локального развертывания. Официальный релиз включает четыре варианта — 0,8B, 2B, 4B и 9B — охватывающие сценарии от периферийных устройств IoT до серверов. Особого внимания заслуживает версия 4B, для работы которой теоретически требуется всего 8 ГБ VRAM, при этом для плавной работы рекомендуется 16 ГБ.
Для обычных пользователей и разработчиков это представляет собой своего рода «освобождение вычислительной мощности». Больше нет необходимости в профессиональных вычислительных картах, стоимостью в десятки тысяч; теперь вы можете иметь «личный помощник» с производительностью, соперничающей с топовыми крупными моделями, прямо на своем собственном компьютере — или даже смартфоне.
Как продемонстрировала команда Qwen : больше не всегда значит лучше. ИИ, способный работать на собственных устройствах пользователей, — это настоящий прорыв для будущей производительности. Поскольку версия 9B напрямую конкурирует по производительности с крупными моделями класса 120B, китайские крупные модели демонстрируют уникальные инновационные возможности Китая благодаря этому подходу «оптимизации», раскрывая глобальному сообществу разработчиков силу ИИ «Made-in-China».
Связанная статья
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao
Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная
Как защитить имущество, здания и собственное здоровье?
В этом непредсказуемом мире защита стала стратегической необходимостью, а не просто одним из возможных вариантов. Будь то обеспечение финансовой безопасности, укрепление зданий или забота о собственно
Браузер Comet на базе искусственного интеллекта вышел на рынок с полной поддержкой многозадачности на iPad
Браузер Comet от Perplexity, основанный на искусственном интеллекте, официально выпустил версию для iPad, которая теперь полностью совместима с iPadOS. Обновление включает в себя многооконный режим пр
Рекомендации по связанным специальным темам
Комментарии (1)

Модель с 4 миллиардами параметров доказывает, что «меньше — значит больше», открывая новую эру внедрения локального ИИ в Китае
В сфере ИИ долгое время считалось, что большее количество параметров означает более высокий уровень интеллекта. Однако недавно выпущенная Alibaba серия небольших моделей
Этот межуровневый конкурс был организован сторонней организацией N8 Programs. Тестировщики случайным образом отобрали 1000 реальных вопросов из набора данных WildChat, поставив Qwen 3.5-4B и GPT-4o на одну арену, а Opus 4.6 — в настоящее время признанный самым мощным судьей — наблюдал за соревнованием. Результаты оказались неожиданными: в ходе этой серии из 1000 раундов вопросов и ответов Qwen 3.5-4B одержал 499 побед, потерпел 431 поражение и сыграл 70 ничьих, в итоге превзойдя GPT-4o.
Самым поразительным является то, что, по предположениям, GPT-4o обладает до 200 миллиардов параметров, в то время как у Qwen 3.5-4B их всего 2%. Это демонстрирует достижение Alibaba в области логического мышления высшего уровня при минимальных затратах ресурсов.
Помимо впечатляющей производительности, основная привлекательность серии Qwen 3.5 заключается в ее исключительной пригодности для локального развертывания. Официальный релиз включает четыре варианта — 0,8B, 2B, 4B и 9B — охватывающие сценарии от периферийных устройств IoT до серверов. Особого внимания заслуживает версия 4B, для работы которой теоретически требуется всего 8 ГБ VRAM, при этом для плавной работы рекомендуется 16 ГБ.
Для обычных пользователей и разработчиков это представляет собой своего рода «освобождение вычислительной мощности». Больше нет необходимости в профессиональных вычислительных картах, стоимостью в десятки тысяч; теперь вы можете иметь «личный помощник» с производительностью, соперничающей с топовыми крупными моделями, прямо на своем собственном компьютере — или даже смартфоне.
Как продемонстрировала команда
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao
Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная
Как защитить имущество, здания и собственное здоровье?
В этом непредсказуемом мире защита стала стратегической необходимостью, а не просто одним из возможных вариантов. Будь то обеспечение финансовой безопасности, укрепление зданий или забота о собственно
Браузер Comet на базе искусственного интеллекта вышел на рынок с полной поддержкой многозадачности на iPad
Браузер Comet от Perplexity, основанный на искусственном интеллекте, официально выпустил версию для iPad, которая теперь полностью совместима с iPadOS. Обновление включает в себя многооконный режим пр





Дом






