アリババの「Wan2.7-Image」AIは、オリジナルの顔画像を生成し、エッセイを執筆する
本日、アリババは画像生成・編集用の統合型大規模モデル「Wan2.7-Image」を正式にリリースしました。このモデルは、画質の飛躍的な向上を実現しただけでなく、包括的な機能強化により、「画一的な顔」や「プロンプトとの不整合」といった従来のAI画像生成の課題を克服しています。
AI生成の顔に別れを告げ、「一人一顔」の時代へ
Wan2.7-Imageは、バーチャルキャラクターのカスタマイズ機能を大幅に強化しました。ユーザーは骨格や目から微細な顔の特徴に至るまであらゆる要素をカスタマイズでき、卵型の顔、鳳眼、深い眼窩といった特定の特徴を精密に制御できます。この進歩により、従来のAIポートレートに見られた機械的な画一性を脱却し、真の個性を表現することが可能になりました。

「カラーパレット」機能と「印刷品質」レベルのテキストレンダリング
芸術的表現において、本モデルは「カラーパレット」機能をサポートするようになりました。これにより、ユーザーはマティスの「赤のシリーズ」やゴッホの「黄のシリーズ」といった参照画像から、ワンクリックで色彩構成を抽出し、新しい作品に正確に適用することが可能です。 さらに、Wan2.7-Imageは長文のレンダリングに優れており、最大3,000トークンの入力に対応しています。複雑な数式や表を含むA4用紙1ページ分のコンテンツを安定して出力でき、対応する12言語すべてにおいて印刷品質の基準を満たしています。

インタラクティブな編集と多分野にわたる一貫性
本モデルは強力なインタラクティブ編集機能を備えており、精密な選択操作を通じて要素の位置合わせ、移動、置換が可能です。例えば、画像内の文字を選択して位置を入れ替えたり、氷のキューブを果物に置き換えたりするなど、ピクセル単位での制御を実現します。同時に、最大9枚の画像にわたるマルチサブジェクトの一貫性をサポートしており、AIガールズグループや家具セットを生成する際にも、統一されたスタイルと特徴を維持します。

中核となる技術的ブレークスルーと産業応用
Wan2.7-Imageは、生成と理解の両方に対応する最先端の統合アーキテクチャを採用し、共有された潜在空間内での意味的マッピングを実現しています。これは、モデルが単にピクセルに合わせるためにテキストを推測するだけでなく、基礎的な意味理解を備えていることを意味します。本モデルは、より安定した構成と正確な理解を提供するWan2.7-Image-proバージョンと共にリリースされました。

本モデルは現在、ショート動画制作(1人の俳優が複数の役を演じる)、EC広告(1枚のモデル画像を多目的に活用)、教育、研究、ソーシャルエンターテインメントなど、幅広い分野で活用されています。ユーザーはAlibaba Cloud BaiLianプラットフォーム経由で APIにアクセスするか、Wanxiang公式サイト で直接体験することができます。
関連記事
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
タラットのAI会議メモは、クラウドではなく、お使いのデバイスに保存されます
評価額2億5000万ドルに達するAI搭載ノートアプリ「Granola」は、テック系スタートアップの創業者やベンチャーキャピタリストの間で人気を集めている。しかし、ある開発者は、サブスクリプション制ではなく、一度きりの料金で利用でき、よりプライバシーが守られ、完全にローカルで動作する代替アプリへの需要を見出していた。そのビジョンから生まれたのが、新しいMacアプリ「Talat」だ。イングランドのヨー
新型「Roewe i6」が65万9000元で発売、Snapdragon 8155とDoubaoの大規模モデルを搭載
SAIC Roeweは本日、Roewe D7のデザイン言語を全面的に採用したコンパクトセダン「Roewe i6」を発売した。特徴的な大型の直立型グリルと水平に伸びるハローライトバーがフロント全体を覆い、先進的な技術感と視覚的な広がりを醸し出している。 リアには、上向きのダックテールスポイラーが全幅にわたるテールランプと調和し、車全体により若々しい印象を与えています。新型「Roewe i6」の全長
関連特集おすすめ
コメント (0)
0/500
本日、アリババは画像生成・編集用の統合型大規模モデル「Wan2.7-Image」を正式にリリースしました。このモデルは、画質の飛躍的な向上を実現しただけでなく、包括的な機能強化により、「画一的な顔」や「プロンプトとの不整合」といった従来のAI画像生成の課題を克服しています。
AI生成の顔に別れを告げ、「一人一顔」の時代へ
Wan2.7-Imageは、バーチャルキャラクターのカスタマイズ機能を大幅に強化しました。ユーザーは骨格や目から微細な顔の特徴に至るまであらゆる要素をカスタマイズでき、卵型の顔、鳳眼、深い眼窩といった特定の特徴を精密に制御できます。この進歩により、従来のAIポートレートに見られた機械的な画一性を脱却し、真の個性を表現することが可能になりました。

「カラーパレット」機能と「印刷品質」レベルのテキストレンダリング
芸術的表現において、本モデルは「カラーパレット」機能をサポートするようになりました。これにより、ユーザーはマティスの「赤のシリーズ」やゴッホの「黄のシリーズ」といった参照画像から、ワンクリックで色彩構成を抽出し、新しい作品に正確に適用することが可能です。 さらに、Wan2.7-Imageは長文のレンダリングに優れており、最大3,000トークンの入力に対応しています。複雑な数式や表を含むA4用紙1ページ分のコンテンツを安定して出力でき、対応する12言語すべてにおいて印刷品質の基準を満たしています。

インタラクティブな編集と多分野にわたる一貫性
本モデルは強力なインタラクティブ編集機能を備えており、精密な選択操作を通じて要素の位置合わせ、移動、置換が可能です。例えば、画像内の文字を選択して位置を入れ替えたり、氷のキューブを果物に置き換えたりするなど、ピクセル単位での制御を実現します。同時に、最大9枚の画像にわたるマルチサブジェクトの一貫性をサポートしており、AIガールズグループや家具セットを生成する際にも、統一されたスタイルと特徴を維持します。

中核となる技術的ブレークスルーと産業応用
Wan2.7-Imageは、生成と理解の両方に対応する最先端の統合アーキテクチャを採用し、共有された潜在空間内での意味的マッピングを実現しています。これは、モデルが単にピクセルに合わせるためにテキストを推測するだけでなく、基礎的な意味理解を備えていることを意味します。本モデルは、より安定した構成と正確な理解を提供するWan2.7-Image-proバージョンと共にリリースされました。

本モデルは現在、ショート動画制作(1人の俳優が複数の役を演じる)、EC広告(1枚のモデル画像を多目的に活用)、教育、研究、ソーシャルエンターテインメントなど、幅広い分野で活用されています。ユーザー
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
タラットのAI会議メモは、クラウドではなく、お使いのデバイスに保存されます
評価額2億5000万ドルに達するAI搭載ノートアプリ「Granola」は、テック系スタートアップの創業者やベンチャーキャピタリストの間で人気を集めている。しかし、ある開発者は、サブスクリプション制ではなく、一度きりの料金で利用でき、よりプライバシーが守られ、完全にローカルで動作する代替アプリへの需要を見出していた。そのビジョンから生まれたのが、新しいMacアプリ「Talat」だ。イングランドのヨー
新型「Roewe i6」が65万9000元で発売、Snapdragon 8155とDoubaoの大規模モデルを搭載
SAIC Roeweは本日、Roewe D7のデザイン言語を全面的に採用したコンパクトセダン「Roewe i6」を発売した。特徴的な大型の直立型グリルと水平に伸びるハローライトバーがフロント全体を覆い、先進的な技術感と視覚的な広がりを醸し出している。 リアには、上向きのダックテールスポイラーが全幅にわたるテールランプと調和し、車全体により若々しい印象を与えています。新型「Roewe i6」の全長





家






