Дом
DeepSeek представляет модель искусственного интеллекта, способную составить конкуренцию передовым системам

Китайская лаборатория искусственного интеллекта DeepSeek выпустила две предварительные версии своей новейшей крупномасштабной языковой модели DeepSeek V4 — долгожданное обновление прошлогодней модели V3.2 и сопутствующей модели логического вывода R1, которые произвели значительный резонанс в сообществе специалистов по ИИ.
Компания заявляет, что и DeepSeek V4 Flash, и V4 Pro являются моделями «смеси экспертов», каждая из которых имеет контекстное окно объемом 1 миллион токенов — этого достаточно для обработки обширных кодовых баз или документов в рамках запросов. Этот метод «смеси экспертов» активирует только определенное подмножество параметров для каждой задачи, чтобы снизить затраты на вывод.
Модель Pro может похвастаться в общей сложности 1,6 триллионами параметров (из которых 49 миллиардов активных), что делает ее крупнейшей доступной моделью с открытым весом. Она превосходит таких конкурентов, как Kimi K 2.6 от Moonshot AI (1,1 триллиона), M1 от MiniMax (456 миллиардов), и более чем вдвое превосходит по размеру DeepSeek V3.2 (671 миллиард). Более компактная модель V4 Flash содержит 284 миллиарда параметров (13 миллиардов активных).
DeepSeek утверждает, что архитектурные усовершенствования делают обе новые модели более эффективными и производительными, чем DeepSeek V3.2, практически «сокращая разрыв» с текущими ведущими моделями, как с открытым, так и с закрытым исходным кодом, по тестам на логическое мышление.
Лаборатория сообщает, что ее новая модель V4-Pro-Max превосходит аналогичные модели с открытым исходным кодом по тестам на логическое мышление и превосходит производительность GPT-5.2 и Gemini 3.0 Pro от OpenAI по некоторым задачам. По результатам тестов в рамках конкурсов по программированию DeepSeek заявляет, что производительность обеих моделей V4 «сопоставима с GPT-5.4».
Однако модели, по-видимому, немного отстают от передовых моделей в оценках, основанных на знаниях, особенно по сравнению с GPT-5.4 от OpenAI и новейшей Google Gemini 3.1 Pro. Этот разрыв указывает на «траекторию развития, которая отстает от передовых моделей примерно на 3–6 месяцев», по словам лаборатории.
В отличие от многих аналогов с закрытым исходным кодом, поддерживающих генерацию аудио, видео и изображений, как V4 Flash, так и V4 Pro являются моделями, работающими только с текстом.
Ключевым преимуществом является то, что DeepSeek V4 значительно более экономичен, чем современные передовые модели. Меньшая модель V4 Flash стоит 0,14 доллара за миллион входных токенов и 0,28 доллара за миллион выходных токенов, что дешевле, чем GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini и Claude Haiku 4.5. Более крупная модель V4 Pro стоит 0,145 доллара за миллион входных токенов и 3,48 доллара за миллион выходных токенов, что также ниже, чем у Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 и GPT-5.4.
Этот запуск последовал через день после того, как США обвинили Китай в краже интеллектуальной собственности в промышленных масштабах из американских лабораторий ИИ с использованием тысяч прокси-аккаунтов. Сама DeepSeek столкнулась с обвинениями со стороны Anthropic и OpenAI в «дистилляции», или, по сути, копировании их моделей ИИ.
Связанная статья
Модель искусственного интеллекта DeepSeek V3.2 обеспечивает высочайшую производительность при минимальных вычислительных затратах
В то время как крупные технологические компании инвестируют миллиарды в вычислительные мощности для разработки передовых моделей искусственного интеллекта, китайская компания DeepSeek достигла аналоги
Руководители служб безопасности призывают к быстрому регулированию ИИ, ссылаясь на риски таких инструментов, как DeepSeek
В операционных центрах безопасности, особенно среди руководителей служб информационной безопасности (CISO), растет беспокойство по поводу гиганта искусственного интеллекта DeepSeek из Китая.Хотя изнач
Обновление R1 модели искусственного интеллекта DeepSeek вводит более строгую модерацию контента, показали тесты
Новейшая модель рассуждений китайского ИИ-стартапа DeepSeek, усовершенствованная версия системы R1, демонстрирует исключительную производительность в тестах на кодирование, математику и общие знания,
Рекомендации по связанным специальным темам
Комментарии (0)

Китайская лаборатория искусственного интеллекта DeepSeek выпустила две предварительные версии своей новейшей крупномасштабной языковой модели DeepSeek V4 — долгожданное обновление прошлогодней модели V3.2 и сопутствующей модели логического вывода R1, которые произвели значительный резонанс в сообществе специалистов по ИИ.
Компания заявляет, что и DeepSeek V4 Flash, и V4 Pro являются моделями «смеси экспертов», каждая из которых имеет контекстное окно объемом 1 миллион токенов — этого достаточно для обработки обширных кодовых баз или документов в рамках запросов. Этот метод «смеси экспертов» активирует только определенное подмножество параметров для каждой задачи, чтобы снизить затраты на вывод.
Модель Pro может похвастаться в общей сложности 1,6 триллионами параметров (из которых 49 миллиардов активных), что делает ее крупнейшей доступной моделью с открытым весом. Она превосходит таких конкурентов, как Kimi K 2.6 от Moonshot AI (1,1 триллиона), M1 от MiniMax (456 миллиардов), и более чем вдвое превосходит по размеру DeepSeek V3.2 (671 миллиард). Более компактная модель V4 Flash содержит 284 миллиарда параметров (13 миллиардов активных).
DeepSeek утверждает, что архитектурные усовершенствования делают обе новые модели более эффективными и производительными, чем DeepSeek V3.2, практически «сокращая разрыв» с текущими ведущими моделями, как с открытым, так и с закрытым исходным кодом, по тестам на логическое мышление.
Лаборатория сообщает, что ее новая модель V4-Pro-Max превосходит аналогичные модели с открытым исходным кодом по тестам на логическое мышление и превосходит производительность GPT-5.2 и Gemini 3.0 Pro от OpenAI по некоторым задачам. По результатам тестов в рамках конкурсов по программированию DeepSeek заявляет, что производительность обеих моделей V4 «сопоставима с GPT-5.4».
Однако модели, по-видимому, немного отстают от передовых моделей в оценках, основанных на знаниях, особенно по сравнению с GPT-5.4 от OpenAI и новейшей Google Gemini 3.1 Pro. Этот разрыв указывает на «траекторию развития, которая отстает от передовых моделей примерно на 3–6 месяцев», по словам лаборатории.
В отличие от многих аналогов с закрытым исходным кодом, поддерживающих генерацию аудио, видео и изображений, как V4 Flash, так и V4 Pro являются моделями, работающими только с текстом.
Ключевым преимуществом является то, что DeepSeek V4 значительно более экономичен, чем современные передовые модели. Меньшая модель V4 Flash стоит 0,14 доллара за миллион входных токенов и 0,28 доллара за миллион выходных токенов, что дешевле, чем GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini и Claude Haiku 4.5. Более крупная модель V4 Pro стоит 0,145 доллара за миллион входных токенов и 3,48 доллара за миллион выходных токенов, что также ниже, чем у Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 и GPT-5.4.
Этот запуск последовал через день после того, как США обвинили Китай в краже интеллектуальной собственности в промышленных масштабах из американских лабораторий ИИ с использованием тысяч прокси-аккаунтов. Сама DeepSeek столкнулась с обвинениями со стороны Anthropic и OpenAI в «дистилляции», или, по сути, копировании их моделей ИИ.
Модель искусственного интеллекта DeepSeek V3.2 обеспечивает высочайшую производительность при минимальных вычислительных затратах
В то время как крупные технологические компании инвестируют миллиарды в вычислительные мощности для разработки передовых моделей искусственного интеллекта, китайская компания DeepSeek достигла аналоги
Руководители служб безопасности призывают к быстрому регулированию ИИ, ссылаясь на риски таких инструментов, как DeepSeek
В операционных центрах безопасности, особенно среди руководителей служб информационной безопасности (CISO), растет беспокойство по поводу гиганта искусственного интеллекта DeepSeek из Китая.Хотя изнач
Обновление R1 модели искусственного интеллекта DeepSeek вводит более строгую модерацию контента, показали тесты
Новейшая модель рассуждений китайского ИИ-стартапа DeepSeek, усовершенствованная версия системы R1, демонстрирует исключительную производительность в тестах на кодирование, математику и общие знания,











