Name: DeepSeek-R1-0528
Rating: 1 (36 reviews)
Author: DeepSeek

Дом

Список моделей AL

DeepSeek-R1-0528

Добавить сравнение

671B

Параметр модели

DeepSeek

Аффилированная организация

Открытый исходный код

Тип лицензии

28 мая 2025 г.

Время выпуска

Официальный сайт

Модель документация

Связанные лица

Zhenda Xie

Kai Dong

Qihao Zhu

Daya Guo

Liang Wenfeng

Введение модели

Последняя версия Deepseek R1.

Комплексная оценка Языковый диалог Запас знаний Ассоциация рассуждений Математический расчет Написание кода Команда следующей

Смахните влево и вправо, чтобы посмотреть больше

Способность к пониманию языка

Способен понимать сложные контексты и генерировать логически когерентные предложения, хотя и иногда выключенные по контролю тона.

8.4

Объем знаний

Обладает основными знаниями в основных дисциплинах, но имеет ограниченный охват передовых междисциплинарных полей.

8.9

Способность рассуждать

Хорошо обрабатывает основные арифметические и простые логические вопросы, но борется с абстрактными проблемами.

6.0

Сравнение модели

DeepSeek-R1-0528 vs Qwen2.5-7B-Instruct Как и Qwen2, модели языка Qwen2.5 поддерживают до 128K токенов и могут генерировать до 8K токенов. Они также сохраняют мультиязычную поддержку более чем для 29 языков, включая китайский, английский, французский, испанский, португальский, немецкий, итальянский, русский, японский, корейский, вьетнамский, тайский, арабский и другие.

DeepSeek-R1-0528 vs Hunyuan-T1-20250822 Модель глубоких рассуждений, самостоятельно разработанная Tencent, имеет номер версии hunyuan-t1-20250822.

DeepSeek-R1-0528 vs Spark-X1 Модель вывода Spark X1, выпущенная iFlytek, на основе ведущих отечественных математических задач сравнивает производительность общих задач, таких как вывод, генерация текста и понимание языка, с OpenAI o1 и DeepSeek R1.

DeepSeek-R1-0528 vs Doubao-Seed-1.6-251015 (Thinking) Модель глубоких рассуждений, выпущенная ByteDance, которая поддерживает ручное переключение глубоких рассуждений, и ее производительность значительно улучшена по сравнению с doubao-1.5.

DeepSeek-R1-0528 vs Doubao-Seed-1.6-thinking-250715 Последняя версия модели серии seed, выпущенная ByteDance, которая поддерживает режим мышления.

Связанная модель

DeepSeek-V3.2 Последняя версия моделей серии Deepseek V3.

DeepSeek-V3.2-Exp Последняя экспериментальная версия моделей серии Deepseek V3.

DeepSeek-R1-0528 Последняя версия Deepseek R1.

DeepSeek-V3-0324 DeepSeek-V3 превосходит другие модели с открытым исходным кодом, такие как Qwen2.5-72B и Llama-3.1-405B, в различных оценках и соответствует производительности ведущих закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.

DeepSeek-V2-Chat-0628 DeepSeek-V2 — это мощная модель языка типа Mixture-of-Experts (MoE), характеризующаяся экономичностью обучения и эффективностью вывода. Она содержит 236 миллиардов общих параметров, из которых 21 миллиард активируется для каждого токена. В сравнении с DeepSeek 67B, DeepSeek-V2 демонстрирует более высокую производительность, при этом экономя 42,5% затрат на обучение, снижая объем KV-кэша на 93,3% и увеличивая максимальную пропускную способность генерации до 5,76 раз.

Соответствующие документы

Обязательное использование искусственного интеллекта в поисковых системах вызывает массовый отток пользователей, а DuckDuckGo фиксирует резкий рост числа пользователей После того как на конференции Google I/O 2026 было объявлено о полной переработке поисковой системы с использованием искусственного интеллекта, многие пользователи начали искать альтернативы, которые

Xiaohongshu проводит реорганизацию: Конан назначен президентом, созданы отдел искусственного интеллекта Dots и зарубежное подразделение Rednote 30 апреля компания Xiaohongshu разослала всем сотрудникам внутреннее письмо, в котором объявила о начале новой реорганизации. Суть этих изменений заключается в полной интеграции трех бизнес-направлени

Игра «Xiaolongxia» от Tencent превзошла все ожидания: команда увеличила пропускную способность в 10 раз, принесла извинения и выплатила компенсации Компания Tencent официально запустила WorkBuddy — универсального интеллектуального агента на базе искусственного интеллекта, что знаменует собой начало нового этапа в гонке за создание прикладных реше

Главный инвестор Suno: удаление постов не устранит лазейку в законодательстве об авторском праве Долгожданная платформа Suno, создающая музыку с помощью ИИ, столкнулась с серьезной судебной тяжбой по поводу авторских прав, а откровенное замечание ее главного инвестора, возможно, предоставило прот

Выпущена версия Claude Opus 4.7, в которой надежность ценится выше интеллекта В этом году компания Anthropic сохраняет высокие темпы развития, выпуская новые функции почти каждый день. Долгожданная версия Claude Opus 4.7 только что была официально выпущена, и что интересно, в с

Сравнение модели

Начните сравнение