вариант
Параметр модели
671B
Параметр модели
Аффилированная организация
DeepSeek
Аффилированная организация
Открытый исходный код
Тип лицензии
Время выпуска
19 января 2025 г.
Время выпуска
Введение модели
DeepSeek-R1 - это модель, обученная с использованием масштабируемого усиленного обучения (RL) без применения начального шага тонкой настройки с участием supervision (SFT). Её производительность в математических, программных и логических задачах сравнима с OpenAI-o1.
Способность к пониманию языка Способность к пониманию языка
Способность к пониманию языка
Способен понимать сложные контексты и генерировать логически когерентные предложения, хотя и иногда выключенные по контролю тона.
7.8
Объем знаний Объем знаний
Объем знаний
Обладает основными знаниями в основных дисциплинах, но имеет ограниченный охват передовых междисциплинарных полей.
8.9
Способность рассуждать Способность рассуждать
Способность рассуждать
Способный создавать многоуровневые логические рамки, достигая более 99% точности в сложном математическом моделировании.
9.1
Сравнение модели
Связанная модель
DeepSeek-V2-Chat-0628 DeepSeek-V2 — это мощная модель языка типа Mixture-of-Experts (MoE), характеризующаяся экономичностью обучения и эффективностью вывода. Она содержит 236 миллиардов общих параметров, из которых 21 миллиард активируется для каждого токена. В сравнении с DeepSeek 67B, DeepSeek-V2 демонстрирует более высокую производительность, при этом экономя 42,5% затрат на обучение, снижая объем KV-кэша на 93,3% и увеличивая максимальную пропускную способность генерации до 5,76 раз.
DeepSeek-V2.5 DeepSeek-V2.5 — это обновленная версия, объединяющая DeepSeek-V2-Chat и DeepSeek-Coder-V2-Instruct. Новая модель интегрирует общие и программные возможности двух предыдущих версий.
DeepSeek-V3-0324 DeepSeek-V3 превосходит другие открытые модели, такие как Qwen2.5-72B и Llama-3.1-405B, во множестве оценок и соответствует уровню производительности премиальных закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.
DeepSeek-V2-Lite-Chat DeepSeek-V2, сильная модель языка Mixture-of-Experts (MoE), представленная DeepSeek, DeepSeek-V2-Lite — это лёгкая версия этой модели.
DeepSeek-V2-Chat DeepSeek-V2 — мощная модель языка в формате Mixture-of-Experts (MoE), характеризующаяся экономичным обучением и эффективной инференсом. Она состоит из 236 миллиардов общих параметров, из которых 21 миллиард активируется для каждого токена. В сравнении с DeepSeek 67B, DeepSeek-V2 показывает более высокую производительность, при этом экономит 42.5% затрат на обучение, снижает размер KV-кэша на 93.3% и увеличивает максимальную пропускную способность генерации в 5.76 раза.
Соответствующие документы
OpenAI улучшает ИИ-модель, лежащую в основе Operator Agent OpenAI выводит Operator на новый уровеньOpenAI представляет масштабное обновление для своего автономного ИИ-агента Operator. В скором времени Operator перейдет на модель o3 — одну
Фонд будущего ИИ Google, возможно, должен действовать осторожно Инвестиционная инициатива Google в области ИИ: стратегический поворот на фоне регуляторного вниманияОбъявление Google о создании фонда AI Futures Fund является смелым шагом в стрем
AI YouTube Thumbnail Generator: Увеличьте просмотры видео Сила ИИ В The YouTube Thumbnail Creationin Today Digital Landscape, очаровательная миниатюра YouTube имеет решающее значение для привлечения внимания зрителей. С миллионами видео, конкурирующих за клики, поразительная миниатюра может иметь все значение. AI YouTube Миниатюрные генераторы появились как GAM
Приложения AI Travel: ваше руководство по планированию интеллектуальных поездок в 2025 году Планируете поездку в 2025 году? Если вы еще этого не сделали, вы, скорее всего, слышали о невероятных способах, которым искусственный интеллект (ИИ) изменяет индустрию туристических данных. Приложения AI Travel становятся нормой, обещая упростить и улучшить каждый аспект вашего путешествия. Но как на самом деле работают эти приложения и
Постшаговое руководство по созданию собственного персонализированного чатбота на Coze В современном быстроразвивающемся цифровом мире создание собственного чат-бота может показаться сложной задачей. Но благодаря платформам, таким как Coze, эта ранее трудная задача с
Сравнение модели
Начните сравнение
Вернуться к вершине
OR