Дом

Новости

Qwen 3.5-Omni побил рекорд, достигнув 215 баллов по шкале SOTA, и положил начало эре искусственного интеллекта, охватывающего все чувства

Qwen 3.5-Omni побил рекорд, достигнув 215 баллов по шкале SOTA, и положил начало эре искусственного интеллекта, охватывающего все чувства

6 апреля 2026 г.

MichaelMartinez

123

Вчера вечером компания Tongyi Lab официально представила новую мультимодальную крупномасштабную модель Qwen3.5-Omni. По сравнению со своей предшественницей эта модель демонстрирует значительный скачок в области понимания, взаимодействия и выполнения задач, превращая ИИ из «ассистента, привязанного к экрану» в «интеллектуального агента, понимающего физический мир».

Основные усовершенствования: полная мультимодальность и 215 тестов SOTA

Qwen3.5-Omni обладает собственной архитектурой «Full Modality», позволяющей ей беспрепятственно обрабатывать текст, изображения, аудио и видео. В ходе оценок, охватывающих аудиовизуальный анализ, рассуждения, диалог и перевод, модель достигла 215 результатов, соответствующих современному уровню развития (SOTA). Примечательно, что ее общие возможности понимания и распознавания аудио превзошли такие модели, как Gemini-3.1Pro, в то время как ее визуальные и текстовые показатели остаются на высшем уровне, соответствуя аналогичной модели Qwen3.5 аналогичного масштаба.

Техническая архитектура: Hybrid-Attention MoE

Модель основана на классической архитектуре Thinker-Talker с фундаментальной переработкой архитектуры:

Thinker (Центр понимания): Модернизирован до Hybrid-Attention Mixture of Experts (MoE), поддерживающего сверхдлинный контекст из 256K токенов. Это позволяет ему обрабатывать до 10 часов аудио или 1 час видео, точно улавливая мельчайшие детали в длинных последовательностях с помощью технологии TMRoPE.

Talker (центр выражения): включает новую технологию ARIA и кодирование RVQ, заменяя вычислительно сложные процессы DiT. Это не только решает распространенные проблемы генерации аудио, такие как пропуск слов и неправильное произношение цифр, но и наделяет модель надежными возможностями управления голосом в реальном времени.

Реальные приложения: от кодирования настроения до клонирования голоса

Возможности Qwen3.5-Omni позволяют реализовать несколько революционных сценариев применения:

Естественное кодирование Vibe: модель демонстрирует впечатляющее понимание и генерацию кода без специального обучения, что позволяет ей создавать код Python или прототипы интерфейса непосредственно на основе логики видео.

Взаимодействие в реальном времени, подобное человеческому: поддерживает семантические прерывания. Может различать фоновый шум (например, кашель) и намеренные прерывания, а пользователи могут регулировать тон (например, «радостный») и громкость с помощью простых инструкций.

Детальный анализ видео: Может генерировать структурированные субтитры с отметками времени, точно идентифицируя действия, смену фоновой музыки и переходы камеры в видео.

Персонализированное клонирование голоса: пользователи могут создать очень естественный, персонализированный «цифровой голос», загрузив короткий аудиофрагмент; поддерживается 113 языков.

Qwen3.5-Omni теперь доступен на платформе Alibaba Cloud BaiLian в версиях Plus, Flash и Light. API для диалога в реальном времени (Realtime) и демо-версия также доступны через сообщество ModelScope.

Связанная статья

Компания Apple удалила приложение Cal AI из-за несанкционированных покупок внутри приложения и манипулятивных способов осуществления платежей. Недавнее удаление Apple приложения Cal AI, популярного приложения для отслеживания потребления пищи на основе искусственного интеллекта в рамках сервиса MyFitnessPal, подчеркивает строгое соблюдение Apple политик App Store в отношении внешних платеже

Тарификация Github Copilot на основе токенов вызывает возмущение среди разработчиков Золотой век сервиса GitHub Copilot от Microsoft, по-видимому, подходит к концу, особенно для частных пользователей. Компания переходит от фиксированной абонентской платы к модели оплаты на основе токенов, что может значительно увеличить затраты. Боль

Основные моменты документа SpaceX о публичном размещении акций: амбиции по расширению услуг спутникового Интернета и использованию искусственного интеллекта В своем заявлении о регистрации типа S-1, представленном перед планируемым IPO, компания SpaceX представила ряд впечатляющих финансовых показателей, подчеркивающих ее прочные позиции в области аэрокосмической связи и искусственного интеллекта:Число

Рекомендации по связанным специальным темам

Редактирование изображений

Бесплатные генераторы моделей одежды на основе искусственного интеллекта: создание реалистичных макетов одежды и фотографий вместе с моделью

Откройте для себя 20 лучших бесплатных генераторов моделей одежды на основе искусственного интеллекта в 2026 году на сайте XIX.AI. Наш отобранный список включает наиболее популярные и эффективные инструменты, которые помогут создавать реалистичные макеты одежды и фотографии моделей в ней. Сравните бесплатные и платные варианты с еженедельно обновляемыми рейтингами и результатами реальных тестов. Раскройте для себя новые возможности дизайна уже сегодня!

10 инструментов

xix.ai

письмо

Лучшие редакторы для обеспечения сюжетной целостности в художественной литературе: автоматическое выявление сюжетных пробелов и несоответствий во временной последовательности

Откройте для себя лучшие редакторы по обеспечению логической целостности текста на базе ИИ для авторов художественной литературы в 2026 году. В нашем тщательно составленном списке представлены высококачественные инструменты, которые автоматически выявляют сюжетные пробелы и несоответствия во временной шкале. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника в написании текстов, чтобы обеспечить безупречность повествования. Ознакомьтесь с лучшими предложениями прямо сейчас на сайте XIX.AI.

10 инструментов

xix.ai

Создание анимации

Лучшие генераторы сценариев на основе ИИ: автоматическое преобразование кинопроектов в анимационные сценарии

Откройте для себя лучшие генераторы сценариев на основе ИИ 2026 года на сайте XIX.AI. Наши тщательно отобранные и высоко оцененные инструменты автоматически преобразуют сценарии в кинематографические анимации, экономя ваше время и ускоряя подготовительный этап работы. Исследуйте бесплатные и платные варианты с примерами реального использования и еженедельно обновляемыми рейтингами. Найдите идеального помощника для творчества уже сегодня!

10 инструментов

xix.ai

SEO

Лучшие инструменты для поиска перенаправлений и нерабочих ссылок: автоматическое исправление ошибок при сканировании сайта для экономии ресурсов.

Откройте для себя лучшие инструменты по поиску перенаправлений и нерабочих ссылок на основе технологий ИИ в 2026 году на сайте XIX.AI. Наш список, составленный специально для вас, включает мощные программы, которые автоматически исправляют ошибки при сканировании сайтов, помогая сэкономить ресурсы. Сравните бесплатные и платные варианты с использованием реальных тестов и еженедельно обновляемых рейтингов. Найдите идеальное решение для вашего SEO-проекта прямо сейчас!

10 инструментов

xix.ai

Создание видео

Лучшие программы для создания видео с ИИ для подкастеров: превращайте аудиозаписи в увлекательные видео с говорящей головой

Откройте для себя лучшие инструменты для создания видео с ИИ для подкастеров 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке лидеров представлены мощные инструменты, которые без труда превратят ваши аудиозаписи в увлекательные видеоролики с говорящей головой. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Откройте для себя преимущества визуального повествования уже сейчас.

10 инструментов

xix.ai

чат-бот

Создайте свою собственную любовную историю с ИИ с помощью этих инструментов для ролевых игр

Откройте для себя 2026 лучших инструментов для ролевых игр на базе ИИ, которые помогут вам создавать захватывающие истории. В тщательно подобранном списке XIX.AI представлены мощные, революционные помощники, которые раскроют ваш творческий потенциал в повествовании и придадут ему эмоциональную глубину. Сравните бесплатные и платные варианты на основе реальных тестов. Начните свое уникальное путешествие уже сегодня.

10 инструментов

xix.ai