вариант
Дом
Срочные новости
Содержание
MarkSanchez
MarkSanchez
11 февраля 2026 г.

Ant Group открыла исходный код своей мультимодальной модели искусственного интеллекта Ming-Flash-Omni 2.0. По имеющимся данным, она превосходит такие модели, как Gemini 2.5 Pro, по некоторым показателям в области понимания речи и изображений, редактирования изображений и генерации звука. Ключевой особенностью является унифицированная генерация звука, позволяющая воспроизводить речь, звуковые эффекты и музыку на одной дорожке на основе подсказок на естественном языке. Модель построена на архитектуре Ling 2.0 на основе MoE и разработана как многоразовая база для разработчиков, чтобы упростить разработку мультимодальных приложений.

Ant Group открыла исходный код своей мультимодальной модели искусственного интеллекта Ming-Flash-Omni 2.0. По имеющимся данным, она превосходит такие модели, как Gemini 2.5 Pro, по некоторым показателям в области понимания речи и изображений, редактирования изображений и генерации звука. Ключевой особенностью является унифицированная генерация звука, позволяющая воспроизводить речь, звуковые эффекты и музыку на одной дорожке на основе подсказок на естественном языке. Модель построена на архитектуре Ling 2.0 на основе MoE и разработана как многоразовая база для разработчиков, чтобы упростить разработку мультимодальных приложений.
OR