Дом
Alibaba представляет Wan2.7-Image, чтобы положить конец эпохе типовых лиц в искусственном интеллекте
Сегодня официальная команда Ali по разработке крупных моделей представила универсальную модель для генерации и редактирования изображений Wan2.7-Image. Эта модель представляет собой качественный скачок по сравнению с предшественницей в области персонализации портретов, управления цветом и визуализации длинных текстов, и призвана преодолеть типичную «однообразие», часто встречающееся в изображениях, созданных с помощью ИИ.
Модель теперь доступна через API на платформе Alibaba Cloud BaiLian, а также открыта для публичного тестирования на сайте WanXiang.

Основные усовершенствования: виртуальная «скульптура лица» и точное управление цветом
Wan2.7-Image представляет несколько передовых и уникальных функций, которые значительно расширяют творческие возможности:
Уникальные лица для каждого объекта: модель обладает расширенными возможностями виртуальной «скульптуры лица». Пользователи могут точно контролировать структуру костей, форму глаз (например, миндалевидные или «глаза феникса») и другие детали лица с помощью текстовых подсказок, что позволяет эффективно избавиться от стандартизированных лиц, сгенерированных ИИ.
Точная цветовая палитра: в программу добавлен усовершенствованный контроль цвета. Пользователи могут извлекать соотношения цветов из эталонных изображений, чтобы точно воспроизводить определенные оттенки — такие как яркий желтый Ван Гога или холодный синий Пикассо — в новых творениях.
Рендеринг сверхдлинного текста с токенами 3K: решает типичные проблемы генерации текста ИИ, поддерживая до 12 языков. Модель может рендерить сложный текст, таблицы или формулы, занимающие целую страницу формата A4, с качеством, готовым к печати.
В сфере редактирования изображений Wan2.7-Image представляет функцию «интерактивного редактирования». Пользователи могут просто выбрать конкретную область, чтобы добавить, выровнять, переместить или даже выполнить логическую замену на уровне пикселей — например, заменить кубики льда на фрукты, при этом идеально сохранив исходное освещение сцены.

Кроме того, модель поддерживает генерацию связных наборов из 12 изображений, сохраняя высокую согласованность стиля и характеристик объектов в разных сценах — идеально подходит для групповых портретов или скоординированных комбинаций продуктов.
Али объясняет, что Wan2.7-Image использует единую архитектуру как для генерации, так и для понимания. Осуществляя семантическое отображение в рамках общего латентного пространства, модель выходит за рамки угадывания пиксельных паттернов и развивает подлинное глубинное понимание семантики.
С выпуском, запланированным на 2026 год, Wan2.7-Image сигнализирует о сдвиге в генерации изображений с помощью ИИ: от «случайного выбора карт» к «промышленному» уровню точности управления. Эта возможность высококачественного редактирования должна значительно снизить барьер для профессионального создания контента, будь то для раскадровки фильмов, рекламы в электронной коммерции или преобразования контента для социальных сетей.
Связанная статья
Основные моменты документа SpaceX о публичном размещении акций: амбиции по расширению услуг спутникового Интернета и использованию искусственного интеллекта
В своем заявлении о регистрации типа S-1, представленном перед планируемым IPO, компания SpaceX представила ряд впечатляющих финансовых показателей, подчеркивающих ее прочные позиции в области аэрокосмической связи и искусственного интеллекта:Число
Alibaba Tuhao M890 дебютирует с тройной производительностью, открывая эпоху агентов полного спектра для моделей инференции на основе чипов, облачных технологий и моделирования.
20 мая 2026 года на саммите Alibaba Cloud компания объявила о завершении обновления полноценной технологической системы, разработанной для эры агентов. Это обновление кардинально изменило весь процесс работы системы — от базовых чипов и облачных плат
Возрождение Pentium 4: 20-летний процессор запускает большую модель Meta Llama 3
Недавно технический канал YouTube Fully Buffered провел впечатляющий и сложный эксперимент: им удалось успешно запустить последнюю большую модель Meta Llama 3.2 3B на процессоре Pentium 4 641, выпущенном в 2006 году.Этот тест заставил современные ис
Рекомендации по связанным специальным темам
Комментарии (0)
Сегодня официальная команда Ali по разработке крупных моделей представила универсальную модель для генерации и редактирования изображений Wan2.7-Image. Эта модель представляет собой качественный скачок по сравнению с предшественницей в области персонализации портретов, управления цветом и визуализации длинных текстов, и призвана преодолеть типичную «однообразие», часто встречающееся в изображениях, созданных с помощью ИИ.
Модель теперь доступна через API на платформе Alibaba Cloud BaiLian, а также открыта для публичного тестирования на сайте WanXiang.

Основные усовершенствования: виртуальная «скульптура лица» и точное управление цветом
Wan2.7-Image представляет несколько передовых и уникальных функций, которые значительно расширяют творческие возможности:
Уникальные лица для каждого объекта: модель обладает расширенными возможностями виртуальной «скульптуры лица». Пользователи могут точно контролировать структуру костей, форму глаз (например, миндалевидные или «глаза феникса») и другие детали лица с помощью текстовых подсказок, что позволяет эффективно избавиться от стандартизированных лиц, сгенерированных ИИ.
Точная цветовая палитра: в программу добавлен усовершенствованный контроль цвета. Пользователи могут извлекать соотношения цветов из эталонных изображений, чтобы точно воспроизводить определенные оттенки — такие как яркий желтый Ван Гога или холодный синий Пикассо — в новых творениях.
Рендеринг сверхдлинного текста с токенами 3K: решает типичные проблемы генерации текста ИИ, поддерживая до 12 языков. Модель может рендерить сложный текст, таблицы или формулы, занимающие целую страницу формата A4, с качеством, готовым к печати.
В сфере редактирования изображений Wan2.7-Image представляет функцию «интерактивного редактирования». Пользователи могут просто выбрать конкретную область, чтобы добавить, выровнять, переместить или даже выполнить логическую замену на уровне пикселей — например, заменить кубики льда на фрукты, при этом идеально сохранив исходное освещение сцены.

Кроме того, модель поддерживает генерацию связных наборов из 12 изображений, сохраняя высокую согласованность стиля и характеристик объектов в разных сценах — идеально подходит для групповых портретов или скоординированных комбинаций продуктов.
Али объясняет, что Wan2.7-Image использует единую архитектуру как для генерации, так и для понимания. Осуществляя семантическое отображение в рамках общего латентного пространства, модель выходит за рамки угадывания пиксельных паттернов и развивает подлинное глубинное понимание семантики.
С выпуском, запланированным на 2026 год, Wan2.7-Image сигнализирует о сдвиге в генерации изображений с помощью ИИ: от «случайного выбора карт» к «промышленному» уровню точности управления. Эта возможность высококачественного редактирования должна значительно снизить барьер для профессионального создания контента, будь то для раскадровки фильмов, рекламы в электронной коммерции или преобразования контента для социальных сетей.
Основные моменты документа SpaceX о публичном размещении акций: амбиции по расширению услуг спутникового Интернета и использованию искусственного интеллекта
В своем заявлении о регистрации типа S-1, представленном перед планируемым IPO, компания SpaceX представила ряд впечатляющих финансовых показателей, подчеркивающих ее прочные позиции в области аэрокосмической связи и искусственного интеллекта:Число
Alibaba Tuhao M890 дебютирует с тройной производительностью, открывая эпоху агентов полного спектра для моделей инференции на основе чипов, облачных технологий и моделирования.
20 мая 2026 года на саммите Alibaba Cloud компания объявила о завершении обновления полноценной технологической системы, разработанной для эры агентов. Это обновление кардинально изменило весь процесс работы системы — от базовых чипов и облачных плат
Возрождение Pentium 4: 20-летний процессор запускает большую модель Meta Llama 3
Недавно технический канал YouTube Fully Buffered провел впечатляющий и сложный эксперимент: им удалось успешно запустить последнюю большую модель Meta Llama 3.2 3B на процессоре Pentium 4 641, выпущенном в 2006 году.Этот тест заставил современные ис











