вариант
Параметр модели
671B
Параметр модели
Аффилированная организация
DeepSeek
Аффилированная организация
Открытый исходный код
Тип лицензии
Время выпуска
28 мая 2025 г.
Время выпуска

Введение модели
Последняя версия Deepseek R1.
Смахните влево и вправо, чтобы посмотреть больше
Способность к пониманию языка Способность к пониманию языка
Способность к пониманию языка
Способен понимать сложные контексты и генерировать логически когерентные предложения, хотя и иногда выключенные по контролю тона.
8.4
Объем знаний Объем знаний
Объем знаний
Обладает основными знаниями в основных дисциплинах, но имеет ограниченный охват передовых междисциплинарных полей.
8.9
Способность рассуждать Способность рассуждать
Способность рассуждать
Хорошо обрабатывает основные арифметические и простые логические вопросы, но борется с абстрактными проблемами.
6.0
Сравнение модели
Связанная модель
DeepSeek-V3-0324 DeepSeek-V3 превосходит другие модели с открытым исходным кодом, такие как Qwen2.5-72B и Llama-3.1-405B, в различных оценках и соответствует производительности ведущих закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.
DeepSeek-V2-Chat-0628 DeepSeek-V2 — это мощная модель языка типа Mixture-of-Experts (MoE), характеризующаяся экономичностью обучения и эффективностью вывода. Она содержит 236 миллиардов общих параметров, из которых 21 миллиард активируется для каждого токена. В сравнении с DeepSeek 67B, DeepSeek-V2 демонстрирует более высокую производительность, при этом экономя 42,5% затрат на обучение, снижая объем KV-кэша на 93,3% и увеличивая максимальную пропускную способность генерации до 5,76 раз.
DeepSeek-V2.5 DeepSeek-V2.5 — это обновленная версия, объединяющая DeepSeek-V2-Chat и DeepSeek-Coder-V2-Instruct. Новая модель интегрирует общие и программные возможности двух предыдущих версий.
DeepSeek-V3-0324 DeepSeek-V3 превосходит другие открытые модели, такие как Qwen2.5-72B и Llama-3.1-405B, во множестве оценок и соответствует уровню производительности премиальных закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.
DeepSeek-V2-Lite-Chat DeepSeek-V2, сильная модель языка Mixture-of-Experts (MoE), представленная DeepSeek, DeepSeek-V2-Lite — это лёгкая версия этой модели.
Соответствующие документы
ИИ преобразует игры с помощью дипломатии, мета-ИИ и достижений в области обучения с подкреплением Игровой ландшафт претерпевает глубокие изменения благодаря искусственному интеллекту, революционизирующему все - от стратегического геймплея до захватывающего цифрового опыта. ИИ не просто соревнуется
Proton представила чатбота с искусственным интеллектом, ориентированного на конфиденциальность, на фоне растущей обеспокоенности по поводу данных Компания Proton, известная своим безопасным почтовым сервисом Proton Mail, представила Lumo - новаторский ИИ-помощник, созданный с учетом принципов конфиденциальности. Новинка обеспечивает резюмирован
ИИ Gemini от Google представил функцию преобразования фото в видео В последнем обновлении Gemini от Google появилась революционная функция преобразования фотографий в видеоролики на базе модели Veo 3. Эта инновационная функция превращает статичные изображения в восьм
AI Video Mastery: Повышение уровня вирусного контента с помощью умных техник редактирования В современном цифровом ландшафте видеоконтент доминирует в онлайн-пространстве. Однако просто создать видео недостаточно: для максимального эффекта оно должно привлекать зрителей убедительными визуаль
Обзор Samsung Galaxy AI: Реальные преимущества и примеры использования в повседневной жизни Набор Galaxy AI от Samsung вызвал большой ажиотаж в технологической отрасли, но является ли он значимым нововведением или просто перекомпоновкой существующих функций? В нашем подробном анализе мы оцен
Сравнение модели
Начните сравнение
Вернуться к вершине
OR