Дом
ИИ-система Wan2.7 от Alibaba, использующая изображения, создает индивидуальные лица и пишет сочинения
Сегодня компания Alibaba официально представила свою унифицированную крупномасштабную модель для генерации и редактирования изображений — Wan2.7-Image. Эта модель не только обеспечивает качественный скачок в визуальном качестве, но и преодолевает традиционные ограничения генерации изображений с помощью ИИ, такие как «типовые лица» и «несоответствие запросам», благодаря комплексному расширению функциональных возможностей.
Прощай, лица, сгенерированные ИИ: вступаем в эру «один человек — одно лицо»
Wan2.7-Image значительно улучшает функцию настройки виртуальных персонажей. Пользователи могут настраивать все, от структуры костей и глаз до тонких черт лица, точно контролируя такие особенности, как овальное лицо, глаза в форме «феникса» или глубоко посаженные глазницы. Это усовершенствование выходит за рамки механической однородности прошлых портретов, созданных ИИ, позволяя выразить истинную индивидуальность.

Функция «Палитра цветов» и рендеринг текста «печатного качества»
В области художественного самовыражения модель теперь поддерживает функцию «Цветовая палитра». Это позволяет пользователям одним щелчком мыши извлекать цветовую композицию из эталонного изображения — например, из «красной серии» Матисса или «желтой серии» Ван Гога — и точно применять ее к новым творениям. Кроме того, Wan2.7-Image отлично справляется с рендерингом длинных текстов, поддерживая ввод до 3K токенов. Она может стабильно выводить целую страницу A4 с содержанием, включающим сложные формулы и таблицы, отвечая стандартам качества печати на 12 поддерживаемых языках.

Интерактивное редактирование и согласованность между темами
Модель обладает мощными возможностями интерактивного редактирования, поддерживая выравнивание, перемещение или замену элементов посредством точного выделения. Например, пользователи могут выделить символы на изображении, чтобы поменять их местами, или заменить кубики льда фруктами, добиваясь контроля на уровне пикселей. Одновременно модель поддерживает согласованность между несколькими объектами на 9 изображениях, сохраняя единый стиль и характеристики при генерации групп девушек с помощью ИИ или наборов мебели.

Основные технологические прорывы и отраслевые применения
Wan2.7-Image использует передовую унифицированную архитектуру как для генерации, так и для понимания, обеспечивая семантическое отображение в общем латентном пространстве. Это означает, что модель больше не просто угадывает текст для сопоставления с пикселями, а обладает фундаментальным семантическим пониманием. Модель была запущена вместе с версией Wan2.7-Image-pro, которая обеспечивает более стабильную композицию и точное понимание.

В настоящее время эта модель широко применяется в производстве короткометражных видео (один актер играет несколько ролей), рекламе электронной коммерции (одно изображение модели для многоцелевого использования), образовании, научных исследованиях и социальных развлечениях. Пользователи могут получить доступ к API через платформу Alibaba Cloud BaiLian или опробовать ее непосредственно на официальном сайте Wanxiang .
Связанная статья
Управление киберпространства Китая вводит обязательную маркировку коротких видеороликов, созданных с помощью искусственного интеллекта, а также вымышленных видеороликов
Управление киберпространства Китая представило комплексный план по стандартизации маркировки контента коротких видеороликов, обязывающий платформы использовать шесть обязательных меток, в том числе «К
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Заметки Талата по искусственному интеллекту хранятся прямо на вашем устройстве, а не в облаке
Granola — приложение для ведения заметок на базе искусственного интеллекта, оцениваемое в 250 миллионов долларов, — завоевало популярность среди основателей технологических компаний и венчурных инвест
Рекомендации по связанным специальным темам
Комментарии (0)
Сегодня компания Alibaba официально представила свою унифицированную крупномасштабную модель для генерации и редактирования изображений — Wan2.7-Image. Эта модель не только обеспечивает качественный скачок в визуальном качестве, но и преодолевает традиционные ограничения генерации изображений с помощью ИИ, такие как «типовые лица» и «несоответствие запросам», благодаря комплексному расширению функциональных возможностей.
Прощай, лица, сгенерированные ИИ: вступаем в эру «один человек — одно лицо»
Wan2.7-Image значительно улучшает функцию настройки виртуальных персонажей. Пользователи могут настраивать все, от структуры костей и глаз до тонких черт лица, точно контролируя такие особенности, как овальное лицо, глаза в форме «феникса» или глубоко посаженные глазницы. Это усовершенствование выходит за рамки механической однородности прошлых портретов, созданных ИИ, позволяя выразить истинную индивидуальность.

Функция «Палитра цветов» и рендеринг текста «печатного качества»
В области художественного самовыражения модель теперь поддерживает функцию «Цветовая палитра». Это позволяет пользователям одним щелчком мыши извлекать цветовую композицию из эталонного изображения — например, из «красной серии» Матисса или «желтой серии» Ван Гога — и точно применять ее к новым творениям. Кроме того, Wan2.7-Image отлично справляется с рендерингом длинных текстов, поддерживая ввод до 3K токенов. Она может стабильно выводить целую страницу A4 с содержанием, включающим сложные формулы и таблицы, отвечая стандартам качества печати на 12 поддерживаемых языках.

Интерактивное редактирование и согласованность между темами
Модель обладает мощными возможностями интерактивного редактирования, поддерживая выравнивание, перемещение или замену элементов посредством точного выделения. Например, пользователи могут выделить символы на изображении, чтобы поменять их местами, или заменить кубики льда фруктами, добиваясь контроля на уровне пикселей. Одновременно модель поддерживает согласованность между несколькими объектами на 9 изображениях, сохраняя единый стиль и характеристики при генерации групп девушек с помощью ИИ или наборов мебели.

Основные технологические прорывы и отраслевые применения
Wan2.7-Image использует передовую унифицированную архитектуру как для генерации, так и для понимания, обеспечивая семантическое отображение в общем латентном пространстве. Это означает, что модель больше не просто угадывает текст для сопоставления с пикселями, а обладает фундаментальным семантическим пониманием. Модель была запущена вместе с версией Wan2.7-Image-pro, которая обеспечивает более стабильную композицию и точное понимание.

В настоящее время эта модель широко применяется в производстве короткометражных видео (один актер играет несколько ролей), рекламе электронной коммерции (одно изображение модели для многоцелевого использования), образовании, научных исследованиях и социальных развлечениях. Пользователи могут получить доступ к API через
Управление киберпространства Китая вводит обязательную маркировку коротких видеороликов, созданных с помощью искусственного интеллекта, а также вымышленных видеороликов
Управление киберпространства Китая представило комплексный план по стандартизации маркировки контента коротких видеороликов, обязывающий платформы использовать шесть обязательных меток, в том числе «К
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Заметки Талата по искусственному интеллекту хранятся прямо на вашем устройстве, а не в облаке
Granola — приложение для ведения заметок на базе искусственного интеллекта, оцениваемое в 250 миллионов долларов, — завоевало популярность среди основателей технологических компаний и венчурных инвест











