вариант
Параметр модели
N/A
Параметр модели
Аффилированная организация
Alibaba
Аффилированная организация
Закрытый исходный код
Тип лицензии
Время выпуска
28 апреля 2024 г.
Время выпуска
Введение модели
Qwen-Max — это модель API, созданная Alibaba. Это версия 0428
Смахните влево и вправо, чтобы посмотреть больше
Способность к пониманию языка Способность к пониманию языка
Способность к пониманию языка
Часто делает семантические ошибки, что приводит к очевидным логическим отключениям в ответах.
6.2
Объем знаний Объем знаний
Объем знаний
Обладает основными знаниями в основных дисциплинах, но имеет ограниченный охват передовых междисциплинарных полей.
7.6
Способность рассуждать Способность рассуждать
Способность рассуждать
Невозможно поддерживать последовательные сети рассуждений, часто вызывая инвертированную причинность или просчеты.
5.2
Сравнение модели
Связанная модель
Qwen2.5-7B-Instruct Как и Qwen2, модели языка Qwen2.5 поддерживают до 128K токенов и могут генерировать до 8K токенов. Они также сохраняют мультиязычную поддержку более чем для 29 языков, включая китайский, английский, французский, испанский, португальский, немецкий, итальянский, русский, японский, корейский, вьетнамский, тайский, арабский и другие.
Qwen3-32B (Thinking) Qwen3 - это последнее поколение больших языковых моделей в серии Qwen, предлагающая комплексную совокупность плотных и смешанных экспертов (MoE) моделей.
Qwen1.5-72B-Chat Qwen1.5 — это бета-версия Qwen2, сохраняющая архитектуру decoder-only transformer-модели с активацией SwiGLU, RoPE и механизмом внимания с многими головами. Она предлагает девять размеров моделей и имеет усиленные возможности многоязычных и чат-моделей, поддерживающих контекст длиной до 32 768 токенов. Для всех моделей включена система подсказок для ролевых игр, и код поддерживает нативную реализацию в transformers.
Qwen1.5-7B-Chat Qwen1.5 — это бета-версия Qwen2, сохраняющая архитектуру декодерного трансформатора с активацией SwiGLU, RoPE и механизмами внимания с множественными головами. Она предлагает девять размеров моделей и имеет улучшенные возможности многоязычных и чат-моделей, поддерживающих контекст длиной до 32,768 токенов. Все модели имеют включенные системные подсказки для ролевых игр, и код поддерживает нативную реализацию в transformers.
Qwen1.5-14B-Chat Qwen1.5 является бета-версией Qwen2, сохраняя архитектуру декодер-только с активацией SwiGLU, RoPE и механизмом внимания с многими головами. Он предлагает девять размеров моделей и имеет улучшенные возможности многоязычных и чат-моделей, поддерживающих контекст длиной до 32,768 токенов. Все модели имеют включенные системные подсказки для ролевых игр, и код поддерживает нативную реализацию в transformers.
Соответствующие документы
DeepSeek AI: Исследование нового рубежа в искусственном интеллекте В стремительно развивающейся сфере искусственного интеллекта появился смелый новый игрок, готовый нарушить статус-кво. DeepSeek AI, инновационная модель ИИ от китайского технологического стартапа, при
Plaud Note представлен: лучший AI-рекордер голоса на 2025 год? В быстро развивающемся мире инноваций AI устройство Plaud Note выделяется как революционный инструмент, преобразующий способ записи и транскрипции разговоров, встреч и телефонных звонков. Этот компакт
Последняя возможность поднять ваш бренд на новый уровень с помощью побочного мероприятия TechCrunch Sessions: AI Сегодня ваш последний шанс продемонстрировать ваш бренд в центре обсуждений об ИИ во время Недели TechCrunch Sessions: AI, с подачей заявок на проведение побочного мероприятия, закрывающейся сегодня в
Присоединяйтесь к TechCrunch Sessions: AI с гостем и сэкономьте 50% на его билете до 4 мая Интересуетесь будущим AI? Приглашайте друга и погружайтесь вместе!До 4 мая приобретайте билет Early Bird на TechCrunch Sessions: AI, экономьте до $210 и получайте скидку 50% на второй билет для вашего
Anthropic улучшает Claude с помощью бесшовных интеграций инструментов и продвинутых исследований Anthropic представила новые «Интеграции» для Claude, позволяющие искусственному интеллекту напрямую подключаться к вашим любимым рабочим инструментам. Компания также представила улучшенную функцию «Пр
Сравнение модели
Начните сравнение
Вернуться к вершине
OR