вариант
Параметр модели
7B
Параметр модели
Аффилированная организация
Alibaba
Аффилированная организация
Открытый исходный код
Тип лицензии
Время выпуска
4 февраля 2024 г.
Время выпуска

Введение модели
Qwen1.5 — это бета-версия Qwen2, сохраняющая архитектуру декодерного трансформатора с активацией SwiGLU, RoPE и механизмами внимания с множественными головами. Она предлагает девять размеров моделей и имеет улучшенные возможности многоязычных и чат-моделей, поддерживающих контекст длиной до 32,768 токенов. Все модели имеют включенные системные подсказки для ролевых игр, и код поддерживает нативную реализацию в transformers.
Смахните влево и вправо, чтобы посмотреть больше
Способность к пониманию языка Способность к пониманию языка
Способность к пониманию языка
Часто делает семантические ошибки, что приводит к очевидным логическим отключениям в ответах.
4.5
Объем знаний Объем знаний
Объем знаний
Имеет значительные знания слепых пятен, часто показывающих фактические ошибки и повторяющуюся устаревшую информацию.
5.1
Способность рассуждать Способность рассуждать
Способность рассуждать
Невозможно поддерживать последовательные сети рассуждений, часто вызывая инвертированную причинность или просчеты.
2.2
Сравнение модели
Связанная модель
Qwen3-Next-80B-A3B-Thinking Последняя выпущенная серия Qwen3-Next в моделях Qwen, улучшающая эффективность масштабирования за счет инновационной архитектуры модели.
Qwen3-235B-A22B-Thinking-2507 Qwen3 — это последнее поколение крупных языковых моделей серии Qwen, предлагающее комплексный набор плотных моделей и моделей типа «смесь экспертов» (MoE).
Qwen3-Max-2026-01-23 Новая флагманская модель рассуждений, выпущенная компанией Qwen, представляет две инновации: адаптивный вызов инструментов и масштабирование во время тестирования.
Qwen3-Next-80B-A3B-Thinking Последняя выпущенная серия Qwen3-Next в моделях Qwen, повышающая эффективность масштабирования за счет инновационной архитектуры модели.
Qwen3-235B-A22B-Thinking-2507 Qwen3 - это последнее поколение больших языковых моделей в серии Qwen, предлагающее полный набор моделей с плотной структурой и смесью экспертов (MoE).
Соответствующие документы
Обязательное использование искусственного интеллекта в поисковых системах вызывает массовый отток пользователей, а DuckDuckGo фиксирует резкий рост числа пользователей После того как на конференции Google I/O 2026 было объявлено о полной переработке поисковой системы с использованием искусственного интеллекта, многие пользователи начали искать альтернативы, которые
Xiaohongshu проводит реорганизацию: Конан назначен президентом, созданы отдел искусственного интеллекта Dots и зарубежное подразделение Rednote 30 апреля компания Xiaohongshu разослала всем сотрудникам внутреннее письмо, в котором объявила о начале новой реорганизации. Суть этих изменений заключается в полной интеграции трех бизнес-направлени
Игра «Xiaolongxia» от Tencent превзошла все ожидания: команда увеличила пропускную способность в 10 раз, принесла извинения и выплатила компенсации Компания Tencent официально запустила WorkBuddy — универсального интеллектуального агента на базе искусственного интеллекта, что знаменует собой начало нового этапа в гонке за создание прикладных реше
Главный инвестор Suno: удаление постов не устранит лазейку в законодательстве об авторском праве Долгожданная платформа Suno, создающая музыку с помощью ИИ, столкнулась с серьезной судебной тяжбой по поводу авторских прав, а откровенное замечание ее главного инвестора, возможно, предоставило прот
Выпущена версия Claude Opus 4.7, в которой надежность ценится выше интеллекта В этом году компания Anthropic сохраняет высокие темпы развития, выпуская новые функции почти каждый день. Долгожданная версия Claude Opus 4.7 только что была официально выпущена, и что интересно, в с
Сравнение модели
Начните сравнение
OR