アリババ、汎用AI顔の時代を終わらせる「Wan2.7-Image」を発表
アリババの公式大規模モデルチームは本日、画像生成・編集を統合したモデル「Wan2.7-Image」をリリースしました。このモデルは、ポートレートのカスタマイズ、色調制御、長文のレンダリングにおいて、前世代モデルから質的な飛躍を遂げており、AI生成画像によく見られる「画一的な均一性」を克服することを目指しています。
本モデルは現在、Alibaba Cloud BaiLianプラットフォームのAPI経由で利用可能となっており、WanXiangウェブサイトでも一般公開トライアルが開始されています。

主な機能強化:仮想「顔の彫刻」と精密な色制御
Wan2.7-Imageは、クリエイティブな可能性を大幅に広げる、業界をリードする独自の機能をいくつか導入しています:
被写体ごとにユニークな顔:強化された仮想「顔の彫刻」機能を備えています。ユーザーはテキストプロンプトを通じて骨格、目の形(アーモンドアイや鳳眼など)、その他の顔のディテールを精密に制御でき、画一的なAI生成顔を効果的に排除します。
精密なカラーパレット:高度な色制御機能を新たに搭載しました。ユーザーは参照画像から色の比率を抽出し、ゴッホの鮮やかな黄色やピカソのクールな青といった特定の色調を、新しい作品に正確に再現することができます。
3Kトークン対応の超長文生成:AIテキスト生成における一般的な課題を解決し、最大12言語に対応しています。このモデルは、A4用紙1枚分に及ぶ複雑なテキスト、表、数式を、印刷可能な品質で生成できます。
画像編集の分野では、Wan2.7-Imageが「インタラクティブ編集」機能を初搭載しました。ユーザーは特定の領域を選択するだけで、要素の追加、配置、移動、さらにはピクセル単位での論理置換(シーンの元の照明を完璧に保ちながら、氷の立方体を果物に置き換えるなど)を行うことができます。

さらに、このモデルは最大12枚の画像からなる一貫性のあるセットの生成をサポートしており、異なるシーン間でもスタイルや被写体の特徴において高い整合性を維持します。これは、集合写真や統一感のある製品組み合わせの生成に最適です。
Ali氏は、Wan2.7-Imageが生成と理解の両方に統一されたアーキテクチャを採用していると説明しています。共有された潜在空間内で意味論的マッピングを実現することで、このモデルは単なるピクセルパターンの推測を超え、意味論に対する真の根本的な理解を確立しています。
2026年のビジュアル制作シーンへのリリースを控えたWan2.7-Imageは、AI画像生成における転換点を示しています。それは「ランダムなカード引き」から「産業グレード」の精密制御への移行です。この高忠実度の編集機能は、映画のストーリーボード、EC広告、ソーシャルメディアのコンテンツ変換など、プロフェッショナルなコンテンツ制作の参入障壁を劇的に引き下げるものと期待されています。
関連記事
スペースXのIPO申請書のハイライト:衛星インターネット事業とAI分野での事業拡大への意欲
SpaceXが計画しているIPOに先立って提出したS-1登録書類の中で、同社は航空宇宙通信および人工知能分野における強力な実力を示す数々の優れた業績指標を公開しました:Starlinkの加入者数が1,000万人を超える:2026年第1四半期までに、世界中で有料Starlinkサービスを利用している加入者数は1,030万人に達し、過去1年間で倍増しました。この成長は、世界最大の低地球軌道衛星群を擁するSpaceXがブロードバンドおよびモバイル通信分野でリーダーシップを発揮していることを示していま
アリババのTuhao M890が三重の性能を発揮し、チップ・クラウド・モデル・インフェルンスにおけるフルスタックエージェントの時代を切り開く
2026年5月20日、アリババクラウドサミットにおいて、アリババクラウドは「エージェント時代」向けに設計されたフルスタック技術システムのアップグレードが完了したことを発表しました。この変革により、基盤チップやクラウドプラットフォームからモデル、推論ソリューションに至るまで、全てのパイプラインが再構築されました。これにより、アリババクラウドは24時間365日連続運用が可能な大規模エージェントを支える「AIファクトリー」としての地位を確立し、人間ユーザーへの直接的なサービス提供を超えた存在となりまし
ペンティウム4の復活:20年前に登場したCPUでMeta Llama 3の大規模モデルを実行する
最近、YouTubeのテクノロジーチャンネルFully Bufferedは、印象的で徹底的な実験を行いました。2006年に発売されたPentium 4 641プロセッサ上で、Meta社の最新大型モデルLlama 3.2 3Bを正常に動作させることに成功したのです。このテストは、現代の人工知能技術を20年前のハードウェアと対決させるものであり、LLMの基本的な互換性の限界を明らかにするとともに、多くの視聴者に「AI時代のムーアの法則がどのようにして異なる世代間で機能しているのか」と考えさせるもの
関連特集おすすめ
コメント (0)
0/500
アリババの公式大規模モデルチームは本日、画像生成・編集を統合したモデル「Wan2.7-Image」をリリースしました。このモデルは、ポートレートのカスタマイズ、色調制御、長文のレンダリングにおいて、前世代モデルから質的な飛躍を遂げており、AI生成画像によく見られる「画一的な均一性」を克服することを目指しています。
本モデルは現在、Alibaba Cloud BaiLianプラットフォームのAPI経由で利用可能となっており、WanXiangウェブサイトでも一般公開トライアルが開始されています。

主な機能強化:仮想「顔の彫刻」と精密な色制御
Wan2.7-Imageは、クリエイティブな可能性を大幅に広げる、業界をリードする独自の機能をいくつか導入しています:
被写体ごとにユニークな顔:強化された仮想「顔の彫刻」機能を備えています。ユーザーはテキストプロンプトを通じて骨格、目の形(アーモンドアイや鳳眼など)、その他の顔のディテールを精密に制御でき、画一的なAI生成顔を効果的に排除します。
精密なカラーパレット:高度な色制御機能を新たに搭載しました。ユーザーは参照画像から色の比率を抽出し、ゴッホの鮮やかな黄色やピカソのクールな青といった特定の色調を、新しい作品に正確に再現することができます。
3Kトークン対応の超長文生成:AIテキスト生成における一般的な課題を解決し、最大12言語に対応しています。このモデルは、A4用紙1枚分に及ぶ複雑なテキスト、表、数式を、印刷可能な品質で生成できます。
画像編集の分野では、Wan2.7-Imageが「インタラクティブ編集」機能を初搭載しました。ユーザーは特定の領域を選択するだけで、要素の追加、配置、移動、さらにはピクセル単位での論理置換(シーンの元の照明を完璧に保ちながら、氷の立方体を果物に置き換えるなど)を行うことができます。

さらに、このモデルは最大12枚の画像からなる一貫性のあるセットの生成をサポートしており、異なるシーン間でもスタイルや被写体の特徴において高い整合性を維持します。これは、集合写真や統一感のある製品組み合わせの生成に最適です。
Ali氏は、Wan2.7-Imageが生成と理解の両方に統一されたアーキテクチャを採用していると説明しています。共有された潜在空間内で意味論的マッピングを実現することで、このモデルは単なるピクセルパターンの推測を超え、意味論に対する真の根本的な理解を確立しています。
2026年のビジュアル制作シーンへのリリースを控えたWan2.7-Imageは、AI画像生成における転換点を示しています。それは「ランダムなカード引き」から「産業グレード」の精密制御への移行です。この高忠実度の編集機能は、映画のストーリーボード、EC広告、ソーシャルメディアのコンテンツ変換など、プロフェッショナルなコンテンツ制作の参入障壁を劇的に引き下げるものと期待されています。
スペースXのIPO申請書のハイライト:衛星インターネット事業とAI分野での事業拡大への意欲
SpaceXが計画しているIPOに先立って提出したS-1登録書類の中で、同社は航空宇宙通信および人工知能分野における強力な実力を示す数々の優れた業績指標を公開しました:Starlinkの加入者数が1,000万人を超える:2026年第1四半期までに、世界中で有料Starlinkサービスを利用している加入者数は1,030万人に達し、過去1年間で倍増しました。この成長は、世界最大の低地球軌道衛星群を擁するSpaceXがブロードバンドおよびモバイル通信分野でリーダーシップを発揮していることを示していま
アリババのTuhao M890が三重の性能を発揮し、チップ・クラウド・モデル・インフェルンスにおけるフルスタックエージェントの時代を切り開く
2026年5月20日、アリババクラウドサミットにおいて、アリババクラウドは「エージェント時代」向けに設計されたフルスタック技術システムのアップグレードが完了したことを発表しました。この変革により、基盤チップやクラウドプラットフォームからモデル、推論ソリューションに至るまで、全てのパイプラインが再構築されました。これにより、アリババクラウドは24時間365日連続運用が可能な大規模エージェントを支える「AIファクトリー」としての地位を確立し、人間ユーザーへの直接的なサービス提供を超えた存在となりまし
ペンティウム4の復活:20年前に登場したCPUでMeta Llama 3の大規模モデルを実行する
最近、YouTubeのテクノロジーチャンネルFully Bufferedは、印象的で徹底的な実験を行いました。2006年に発売されたPentium 4 641プロセッサ上で、Meta社の最新大型モデルLlama 3.2 3Bを正常に動作させることに成功したのです。このテストは、現代の人工知能技術を20年前のハードウェアと対決させるものであり、LLMの基本的な互換性の限界を明らかにするとともに、多くの視聴者に「AI時代のムーアの法則がどのようにして異なる世代間で機能しているのか」と考えさせるもの





家






