вариант
Параметр модели
671B
Параметр модели
Аффилированная организация
DeepSeek
Аффилированная организация
Открытый исходный код
Тип лицензии
Время выпуска
28 мая 2025 г.
Время выпуска

Введение модели
Последняя версия Deepseek R1.
Смахните влево и вправо, чтобы посмотреть больше
Способность к пониманию языка Способность к пониманию языка
Способность к пониманию языка
Способен понимать сложные контексты и генерировать логически когерентные предложения, хотя и иногда выключенные по контролю тона.
8.4
Объем знаний Объем знаний
Объем знаний
Обладает основными знаниями в основных дисциплинах, но имеет ограниченный охват передовых междисциплинарных полей.
8.9
Способность рассуждать Способность рассуждать
Способность рассуждать
Хорошо обрабатывает основные арифметические и простые логические вопросы, но борется с абстрактными проблемами.
6.0
Сравнение модели
Связанная модель
DeepSeek-V3.2 Последняя версия моделей серии Deepseek V3.
DeepSeek-V3.2-Exp Последняя экспериментальная версия моделей серии Deepseek V3.
DeepSeek-R1-0528 Последняя версия Deepseek R1.
DeepSeek-V3-0324 DeepSeek-V3 превосходит другие модели с открытым исходным кодом, такие как Qwen2.5-72B и Llama-3.1-405B, в различных оценках и соответствует производительности ведущих закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.
DeepSeek-V2-Chat-0628 DeepSeek-V2 — это мощная модель языка типа Mixture-of-Experts (MoE), характеризующаяся экономичностью обучения и эффективностью вывода. Она содержит 236 миллиардов общих параметров, из которых 21 миллиард активируется для каждого токена. В сравнении с DeepSeek 67B, DeepSeek-V2 демонстрирует более высокую производительность, при этом экономя 42,5% затрат на обучение, снижая объем KV-кэша на 93,3% и увеличивая максимальную пропускную способность генерации до 5,76 раз.
Соответствующие документы
Xiaohongshu проводит реорганизацию: Конан назначен президентом, созданы отдел искусственного интеллекта Dots и зарубежное подразделение Rednote 30 апреля компания Xiaohongshu разослала всем сотрудникам внутреннее письмо, в котором объявила о начале новой реорганизации. Суть этих изменений заключается в полной интеграции трех бизнес-направлени
Игра «Xiaolongxia» от Tencent превзошла все ожидания: команда увеличила пропускную способность в 10 раз, принесла извинения и выплатила компенсации Компания Tencent официально запустила WorkBuddy — универсального интеллектуального агента на базе искусственного интеллекта, что знаменует собой начало нового этапа в гонке за создание прикладных реше
Главный инвестор Suno: удаление постов не устранит лазейку в законодательстве об авторском праве Долгожданная платформа Suno, создающая музыку с помощью ИИ, столкнулась с серьезной судебной тяжбой по поводу авторских прав, а откровенное замечание ее главного инвестора, возможно, предоставило прот
Выпущена версия Claude Opus 4.7, в которой надежность ценится выше интеллекта В этом году компания Anthropic сохраняет высокие темпы развития, выпуская новые функции почти каждый день. Долгожданная версия Claude Opus 4.7 только что была официально выпущена, и что интересно, в с
Компания Haier представила самый легкий в мире спортивный робот-экзоскелет с искусственным интеллектом, вес которого составляет всего 1,75 кг Группа Haier представила самый легкий в мире спортивный робот-экзоскелет с искусственным интеллектом — Haier Exoskeleton Robot W3. Этот запуск устанавливает новый отраслевой рекорд по легкости и знаме
Сравнение модели
Начните сравнение
OR