DeepSeek V4 планируется запустить в апреле вместе с моделью Mengyuan от Tencent

Согласно эксклюзивному отчету BaiMing Lab, долгожданные DeepSeek V4 и новая модель MixFormer, разработанная Яо Шуню, должны быть официально представлены в апреле 2026 года. DeepSeek V4 — это мультимодальная крупномасштабная модель, разработка которой возглавляет Лян Вэньфэн. Ожидается, что после тщательной доработки она позволит добиться значительных прорывов в области кодирования и долговременной памяти. Этот запуск соответствует направлению исследований команды DeepSeek в последние годы, особенно в области обработки визуального контента и возможностей поиска на базе искусственного интеллекта.
Исследования Лян Вэньфэна сосредоточены на изучении механизмов «условной памяти». В январе 2026 года он опубликовал статью под названием «Условная память через масштабируемый поиск», в которой изложил ключевые теории. Кроме того, в декабре 2025 года он выпустил еще одно исследование «mHC: Manifold-Constrained Hyper-Connections», которое дополнительно оптимизирует базовую архитектуру. Эта работа направлена на устранение известных ограничений моделей Transformer, касающихся памяти и стабильности обучения. DeepSeek V4 не только обладает мощной мультимодальной вычислительной мощностью, но и проходит глубокую оптимизацию для отечественных чипов, стремясь стать базовой моделью, полностью опирающейся на отечественную вычислительную инфраструктуру.
Одновременно с этим в апреле планируется выпуск новой модели Яо Шуню «MixFormer». С декабря 2025 года Яо занимает должность главного научного сотрудника по искусственному интеллекту в исполнительном комитете Tencent, а также курирует отделы инфраструктуры ИИ и крупных языковых моделей. В феврале 2026 года он представил CL-bench — новый тестовый набор для оценки «контекстуального обучения», в котором особое внимание уделяется обработке длинных контекстов и удобству использования агентами. Согласно отчетам, новая модель Яо будет содержать около 3 миллиардов параметров, при этом его команда с самого начала ставит во главу угла практическое применение, а не просто соревнование по масштабу параметров.
Предстоящий запуск обеих моделей вызвал значительный интерес на рынке, подчеркнув ускоренный прогресс Китая в области искусственного интеллекта. Будь то усовершенствования DeepSeek V4 в области долгосрочной памяти или улучшения модели MixFormer от Tencent в оценке реальных задач, обе инициативы в основном направлены на то, как будущие крупные модели могут быть более эффективно интегрированы в производственные среды.
Связанная статья
Gmail запускает персонализированный почтовый ящик с искусственным интеллектом, обзоры на основе ИИ в поиске и другие функции
Google представил новый почтовый ящик Gmail на базе искусственного интеллекта, который предоставляет персонализированную сводку ваших задач и держит вас в курсе важных новостей. Кроме того, в Gmail по
В городе Цзибо открылась первая в провинции Шаньдун база по созданию комиксов с использованием искусственного интеллекта от Baidu
27 апреля провинция Шаньдун достигла важной вехи в сфере цифрового культурного творчества, официально открыв в Педагогическом колледже Цзыбо свою первую базу по созданию комиксов с использованием иску
Сандберг и Клегг вошли в совет директоров Nscale, а стартап «Stargate Norway» достиг оценки в 14,6 млрд долларов
На фоне резкого роста спроса на центры обработки данных, способные обеспечивать вычисления для ИИ в больших масштабах, британская компания Nscale, занимающаяся инфраструктурой для ИИ и поддерживаемая
Рекомендации по связанным специальным темам
Комментарии (0)

Согласно эксклюзивному отчету BaiMing Lab, долгожданные DeepSeek V4 и новая модель MixFormer, разработанная Яо Шуню, должны быть официально представлены в апреле 2026 года. DeepSeek V4 — это мультимодальная крупномасштабная модель, разработка которой возглавляет Лян Вэньфэн. Ожидается, что после тщательной доработки она позволит добиться значительных прорывов в области кодирования и долговременной памяти. Этот запуск соответствует направлению исследований команды DeepSeek в последние годы, особенно в области обработки визуального контента и возможностей поиска на базе искусственного интеллекта.
Исследования Лян Вэньфэна сосредоточены на изучении механизмов «условной памяти». В январе 2026 года он опубликовал статью под названием «Условная память через масштабируемый поиск», в которой изложил ключевые теории. Кроме того, в декабре 2025 года он выпустил еще одно исследование «mHC: Manifold-Constrained Hyper-Connections», которое дополнительно оптимизирует базовую архитектуру. Эта работа направлена на устранение известных ограничений моделей Transformer, касающихся памяти и стабильности обучения. DeepSeek V4 не только обладает мощной мультимодальной вычислительной мощностью, но и проходит глубокую оптимизацию для отечественных чипов, стремясь стать базовой моделью, полностью опирающейся на отечественную вычислительную инфраструктуру.
Одновременно с этим в апреле планируется выпуск новой модели Яо Шуню «MixFormer». С декабря 2025 года Яо занимает должность главного научного сотрудника по искусственному интеллекту в исполнительном комитете Tencent, а также курирует отделы инфраструктуры ИИ и крупных языковых моделей. В феврале 2026 года он представил CL-bench — новый тестовый набор для оценки «контекстуального обучения», в котором особое внимание уделяется обработке длинных контекстов и удобству использования агентами. Согласно отчетам, новая модель Яо будет содержать около 3 миллиардов параметров, при этом его команда с самого начала ставит во главу угла практическое применение, а не просто соревнование по масштабу параметров.
Предстоящий запуск обеих моделей вызвал значительный интерес на рынке, подчеркнув ускоренный прогресс Китая в области искусственного интеллекта. Будь то усовершенствования DeepSeek V4 в области долгосрочной памяти или улучшения модели MixFormer от Tencent в оценке реальных задач, обе инициативы в основном направлены на то, как будущие крупные модели могут быть более эффективно интегрированы в производственные среды.
Gmail запускает персонализированный почтовый ящик с искусственным интеллектом, обзоры на основе ИИ в поиске и другие функции
Google представил новый почтовый ящик Gmail на базе искусственного интеллекта, который предоставляет персонализированную сводку ваших задач и держит вас в курсе важных новостей. Кроме того, в Gmail по
В городе Цзибо открылась первая в провинции Шаньдун база по созданию комиксов с использованием искусственного интеллекта от Baidu
27 апреля провинция Шаньдун достигла важной вехи в сфере цифрового культурного творчества, официально открыв в Педагогическом колледже Цзыбо свою первую базу по созданию комиксов с использованием иску
Сандберг и Клегг вошли в совет директоров Nscale, а стартап «Stargate Norway» достиг оценки в 14,6 млрд долларов
На фоне резкого роста спроса на центры обработки данных, способные обеспечивать вычисления для ИИ в больших масштабах, британская компания Nscale, занимающаяся инфраструктурой для ИИ и поддерживаемая





Дом






