Heim
Alibaba stellt „Wan2.7-Image“ vor, um der Ära der generischen KI-Gesichter ein Ende zu setzen
Das offizielle Team für große Modelle von Ali hat heute das einheitliche Modell zur Bildgenerierung und -bearbeitung „Wan2.7-Image“ vorgestellt. Dieses Modell stellt einen qualitativen Sprung gegenüber seinem Vorgänger in den Bereichen Porträtanpassung, Farbsteuerung und Darstellung langer Texte dar und zielt darauf ab, die generische „Einheitlichkeit“ zu überwinden, die bei KI-generierten Bildern häufig zu beobachten ist.
Das Modell ist ab sofort über die API auf der Alibaba Cloud BaiLian-Plattform verfügbar und steht zudem auf der WanXiang-Website zur öffentlichen Testnutzung bereit.

Kernverbesserungen: Virtuelles „Facial Sculpting“ und präzise Farbsteuerung
Wan2.7-Image führt mehrere branchenführende, differenzierte Funktionen ein, die die kreativen Möglichkeiten erheblich erweitern:
Einzigartige Gesichter für jedes Motiv: Es bietet verbesserte Funktionen zur virtuellen „Gesichtsformung“. Nutzer können Knochenstruktur, Augenform (wie Mandel- oder Phönixaugen) und andere Gesichtsdetails über Textbefehle präzise steuern und so standardisierte, KI-generierte Gesichter effektiv vermeiden.
Präzise Farbpalette: Es verfügt nun über eine erweiterte Farbsteuerung. Nutzer können Farbverhältnisse aus Referenzbildern extrahieren, um bestimmte Farbtöne – wie Van Goghs leuchtendes Gelb oder Picassos kühles Blau – in neuen Kreationen exakt nachzubilden.
3K-Token-Rendering extrem langer Texte: Es behebt häufige Probleme bei der KI-Textgenerierung und unterstützt bis zu 12 Sprachen. Das Modell kann komplexe Texte, Tabellen oder Formeln, die eine ganze A4-Seite umfassen, in druckfertiger Qualität rendern.
Im Bereich der Bildbearbeitung führt Wan2.7-Image eine „interaktive Bearbeitungsfunktion“ ein. Benutzer können einfach einen bestimmten Bereich auswählen, um Elemente hinzuzufügen, auszurichten, zu verschieben oder sogar logische Ersetzungen auf Pixelebene vorzunehmen – wie zum Beispiel das Austauschen von Eiswürfeln gegen Früchte, während die ursprüngliche Beleuchtung der Szene perfekt erhalten bleibt.

Darüber hinaus unterstützt das Modell die Erzeugung zusammenhängender Bilderserien mit bis zu 12 Bildern, wobei eine hohe Konsistenz in Stil und Motivmerkmalen über verschiedene Szenen hinweg gewahrt bleibt – ideal für Gruppenporträts oder aufeinander abgestimmte Produktkombinationen.
Ali erklärt, dass Wan2.7-Image eine einheitliche Architektur sowohl für die Generierung als auch für das Verständnis verwendet. Durch die Erzielung einer semantischen Zuordnung innerhalb eines gemeinsamen latenten Raums geht das Modell über das Erraten von Pixelmustern hinaus und entwickelt ein echtes zugrunde liegendes Verständnis der Semantik.
Mit seiner für die visuelle Kreativlandschaft des Jahres 2026 geplanten Veröffentlichung signalisiert Wan2.7-Image einen Wandel in der KI-Bildgenerierung: vom „zufälligen Kartenziehen“ hin zu einer Präzisionssteuerung auf „industriellem Niveau“. Diese hochpräzise Bearbeitungsfähigkeit wird die Hürden für die professionelle Erstellung von Inhalten drastisch senken, sei es für Film-Storyboards, E-Commerce-Werbung oder die Umgestaltung von Social-Media-Inhalten.
Verwandter Artikel
Alibaba Tuhao M890 debütiert mit dreifacher Leistungsfähigkeit und markiert den Beginn der Ära der vollständig integrierten Agenten für das Chip-Cloud-Modell-Inferenz-Verfahren.
Am 20. Mai 2026 kündigte Alibaba Cloud auf dem Alibaba Cloud Summit die Fertigstellung eines umfassenden Upgrades des Technologiesystems an, das speziell für die Ära der Agenten entwickelt wurde. Diese Umstrukturierung prägte den gesamten Prozess – v
Pentium 4 Revival: Ein 20 Jahre alter Prozessor läuft das Meta Llama 3 Large Model
Kürzlich führte der YouTube-Technikkanal Fully Buffered ein beeindruckendes und anspruchsvolles Experiment durch: Es gelang, Metas neuestes großes Modell Llama 3.2 3B erfolgreich auf dem Pentium 4 641-Prozessor zu betreiben – einem Chip, der im Jahr
Der Bezirk Shangcheng in Hangzhou führt die ersten „goldenen zehn Maßnahmen“ der audiovisuellen Industrie in Zhejiang unter der Schirmherrschaft von AIGC durch und stellt dabei einen Industriefonds in Höhe von 5 Milliarden Yuan bereit.
Am 16. fand die AIGC Audio-Visual Industry Innovation Ecosystem Conference im Bezirk Shangcheng in Hangzhou statt. Während der Veranstaltung kündigte die Provinz ihre erste spezielle Politik für die AIGC-Audio-Visual-Branche an – „Die Goldenen Zehn“.
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Das offizielle Team für große Modelle von Ali hat heute das einheitliche Modell zur Bildgenerierung und -bearbeitung „Wan2.7-Image“ vorgestellt. Dieses Modell stellt einen qualitativen Sprung gegenüber seinem Vorgänger in den Bereichen Porträtanpassung, Farbsteuerung und Darstellung langer Texte dar und zielt darauf ab, die generische „Einheitlichkeit“ zu überwinden, die bei KI-generierten Bildern häufig zu beobachten ist.
Das Modell ist ab sofort über die API auf der Alibaba Cloud BaiLian-Plattform verfügbar und steht zudem auf der WanXiang-Website zur öffentlichen Testnutzung bereit.

Kernverbesserungen: Virtuelles „Facial Sculpting“ und präzise Farbsteuerung
Wan2.7-Image führt mehrere branchenführende, differenzierte Funktionen ein, die die kreativen Möglichkeiten erheblich erweitern:
Einzigartige Gesichter für jedes Motiv: Es bietet verbesserte Funktionen zur virtuellen „Gesichtsformung“. Nutzer können Knochenstruktur, Augenform (wie Mandel- oder Phönixaugen) und andere Gesichtsdetails über Textbefehle präzise steuern und so standardisierte, KI-generierte Gesichter effektiv vermeiden.
Präzise Farbpalette: Es verfügt nun über eine erweiterte Farbsteuerung. Nutzer können Farbverhältnisse aus Referenzbildern extrahieren, um bestimmte Farbtöne – wie Van Goghs leuchtendes Gelb oder Picassos kühles Blau – in neuen Kreationen exakt nachzubilden.
3K-Token-Rendering extrem langer Texte: Es behebt häufige Probleme bei der KI-Textgenerierung und unterstützt bis zu 12 Sprachen. Das Modell kann komplexe Texte, Tabellen oder Formeln, die eine ganze A4-Seite umfassen, in druckfertiger Qualität rendern.
Im Bereich der Bildbearbeitung führt Wan2.7-Image eine „interaktive Bearbeitungsfunktion“ ein. Benutzer können einfach einen bestimmten Bereich auswählen, um Elemente hinzuzufügen, auszurichten, zu verschieben oder sogar logische Ersetzungen auf Pixelebene vorzunehmen – wie zum Beispiel das Austauschen von Eiswürfeln gegen Früchte, während die ursprüngliche Beleuchtung der Szene perfekt erhalten bleibt.

Darüber hinaus unterstützt das Modell die Erzeugung zusammenhängender Bilderserien mit bis zu 12 Bildern, wobei eine hohe Konsistenz in Stil und Motivmerkmalen über verschiedene Szenen hinweg gewahrt bleibt – ideal für Gruppenporträts oder aufeinander abgestimmte Produktkombinationen.
Ali erklärt, dass Wan2.7-Image eine einheitliche Architektur sowohl für die Generierung als auch für das Verständnis verwendet. Durch die Erzielung einer semantischen Zuordnung innerhalb eines gemeinsamen latenten Raums geht das Modell über das Erraten von Pixelmustern hinaus und entwickelt ein echtes zugrunde liegendes Verständnis der Semantik.
Mit seiner für die visuelle Kreativlandschaft des Jahres 2026 geplanten Veröffentlichung signalisiert Wan2.7-Image einen Wandel in der KI-Bildgenerierung: vom „zufälligen Kartenziehen“ hin zu einer Präzisionssteuerung auf „industriellem Niveau“. Diese hochpräzise Bearbeitungsfähigkeit wird die Hürden für die professionelle Erstellung von Inhalten drastisch senken, sei es für Film-Storyboards, E-Commerce-Werbung oder die Umgestaltung von Social-Media-Inhalten.
Alibaba Tuhao M890 debütiert mit dreifacher Leistungsfähigkeit und markiert den Beginn der Ära der vollständig integrierten Agenten für das Chip-Cloud-Modell-Inferenz-Verfahren.
Am 20. Mai 2026 kündigte Alibaba Cloud auf dem Alibaba Cloud Summit die Fertigstellung eines umfassenden Upgrades des Technologiesystems an, das speziell für die Ära der Agenten entwickelt wurde. Diese Umstrukturierung prägte den gesamten Prozess – v
Pentium 4 Revival: Ein 20 Jahre alter Prozessor läuft das Meta Llama 3 Large Model
Kürzlich führte der YouTube-Technikkanal Fully Buffered ein beeindruckendes und anspruchsvolles Experiment durch: Es gelang, Metas neuestes großes Modell Llama 3.2 3B erfolgreich auf dem Pentium 4 641-Prozessor zu betreiben – einem Chip, der im Jahr
Der Bezirk Shangcheng in Hangzhou führt die ersten „goldenen zehn Maßnahmen“ der audiovisuellen Industrie in Zhejiang unter der Schirmherrschaft von AIGC durch und stellt dabei einen Industriefonds in Höhe von 5 Milliarden Yuan bereit.
Am 16. fand die AIGC Audio-Visual Industry Innovation Ecosystem Conference im Bezirk Shangcheng in Hangzhou statt. Während der Veranstaltung kündigte die Provinz ihre erste spezielle Politik für die AIGC-Audio-Visual-Branche an – „Die Goldenen Zehn“.











