Alibabas KI „Wan2.7-Image“ generiert individuelle Gesichter und verfasst Aufsätze
Heute hat Alibaba offiziell sein einheitliches Großmodell für die Bildgenerierung und -bearbeitung, Wan2.7-Image, vorgestellt. Dieses Modell erzielt nicht nur einen qualitativen Sprung in der Bildqualität, sondern überwindet durch umfassende Funktionserweiterungen auch die traditionellen Grenzen der KI-Bildgenerierung, wie etwa „generische Gesichter“ und „Prompt-Fehlanpassungen“.
Abschied von KI-generierten Gesichtern: Der Eintritt in die Ära von „Eine Person, ein Gesicht“
Wan2.7-Image verbessert seine Funktion zur Anpassung virtueller Charaktere erheblich. Nutzer können alles von der Knochenstruktur und den Augen bis hin zu subtilen Gesichtsmerkmalen anpassen und bestimmte Merkmale wie ein ovales Gesicht, Phönixaugen oder tiefliegende Augenhöhlen präzise steuern. Dieser Fortschritt geht über die mechanische Gleichförmigkeit früherer KI-Porträts hinaus und ermöglicht echte persönliche Ausdruckskraft.

„Farbpalette“-Funktion und Textdarstellung in „Druckqualität“
Im Bereich des künstlerischen Ausdrucks unterstützt das Modell nun eine „Farbpalette“-Funktion. Damit können Nutzer die Farbkomposition aus einem Referenzbild – wie beispielsweise Matisses rote Serie oder Van Goghs gelbe Serie – mit einem einzigen Klick extrahieren und präzise auf neue Kreationen anwenden. Darüber hinaus zeichnet sich Wan2.7-Image durch die Darstellung langer Texte aus und unterstützt Eingaben von bis zu 3.000 Tokens. Es kann eine ganze A4-Seite mit Inhalten, die komplexe Formeln und Tabellen enthalten, stabil ausgeben und erfüllt dabei die Standards für Druckqualität in 12 unterstützten Sprachen.

Interaktive Bearbeitung und themenübergreifende Konsistenz
Das Modell verfügt über leistungsstarke interaktive Bearbeitungsfunktionen und unterstützt die Ausrichtung, Verschiebung oder den Austausch von Elementen durch präzise Auswahl. So können Nutzer beispielsweise Zeichen in einem Bild auswählen, um ihre Positionen zu tauschen, oder Eiswürfel durch Früchte ersetzen, wobei eine pixelgenaue Kontrolle möglich ist. Gleichzeitig unterstützt das Modell die Konsistenz über mehrere Motive hinweg bei bis zu 9 Bildern und sorgt so für einen einheitlichen Stil und einheitliche Merkmale bei der Generierung von KI-Girlgroups oder Möbelsets.

Technologische Kerninnovationen und industrielle Anwendungen
Wan2.7-Image nutzt eine führende einheitliche Architektur sowohl für die Generierung als auch für das Verständnis und erreicht so eine semantische Zuordnung innerhalb eines gemeinsamen latenten Raums. Das bedeutet, dass das Modell nicht mehr nur Text erraten muss, um Pixel abzugleichen, sondern über ein grundlegendes semantisches Verständnis verfügt. Das Modell wurde zusammen mit der Version Wan2.7-Image-pro eingeführt, die eine stabilere Komposition und präzises Verständnis bietet.

Dieses Modell findet mittlerweile breite Anwendung in der Produktion von Kurzvideos (ein Darsteller in mehreren Rollen), in der E-Commerce-Werbung (ein Modellbild für vielfältige Verwendungszwecke), in Bildung, Forschung und im Bereich Social Entertainment. Nutzer können über die Alibaba Cloud BaiLian-Plattform auf die API zugreifen oder sie direkt auf der offiziellen Website von Wanxiang erleben.
Verwandter Artikel
Der KI-Browser Comet startet mit vollständiger Multitasking-Unterstützung auf dem iPad
Der KI-Browser „Comet“ von Perplexity hat offiziell seine iPad-Version veröffentlicht, die nun vollständig mit iPadOS kompatibel ist. Das Update bietet nun das Surfen in mehreren Fenstern, Multitaskin
Trace sammelt 3 Millionen Dollar, um die Hürden bei der Einführung von künstlichen Intelligenz-Agenten in Unternehmen zu überwinden.
Trotz ihres Potenzials haben künstliche Intelligenz-Agenten Schwierigkeiten, in Unternehmen Fuß zu fassen. Ein aufstrebendes Start-up ist der Ansicht, dass das Kernproblem ein Mangel an Kontext ist.Trace, ein als Teil der Sommerausbildung von Y Comb
Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt
Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Heute hat Alibaba offiziell sein einheitliches Großmodell für die Bildgenerierung und -bearbeitung, Wan2.7-Image, vorgestellt. Dieses Modell erzielt nicht nur einen qualitativen Sprung in der Bildqualität, sondern überwindet durch umfassende Funktionserweiterungen auch die traditionellen Grenzen der KI-Bildgenerierung, wie etwa „generische Gesichter“ und „Prompt-Fehlanpassungen“.
Abschied von KI-generierten Gesichtern: Der Eintritt in die Ära von „Eine Person, ein Gesicht“
Wan2.7-Image verbessert seine Funktion zur Anpassung virtueller Charaktere erheblich. Nutzer können alles von der Knochenstruktur und den Augen bis hin zu subtilen Gesichtsmerkmalen anpassen und bestimmte Merkmale wie ein ovales Gesicht, Phönixaugen oder tiefliegende Augenhöhlen präzise steuern. Dieser Fortschritt geht über die mechanische Gleichförmigkeit früherer KI-Porträts hinaus und ermöglicht echte persönliche Ausdruckskraft.

„Farbpalette“-Funktion und Textdarstellung in „Druckqualität“
Im Bereich des künstlerischen Ausdrucks unterstützt das Modell nun eine „Farbpalette“-Funktion. Damit können Nutzer die Farbkomposition aus einem Referenzbild – wie beispielsweise Matisses rote Serie oder Van Goghs gelbe Serie – mit einem einzigen Klick extrahieren und präzise auf neue Kreationen anwenden. Darüber hinaus zeichnet sich Wan2.7-Image durch die Darstellung langer Texte aus und unterstützt Eingaben von bis zu 3.000 Tokens. Es kann eine ganze A4-Seite mit Inhalten, die komplexe Formeln und Tabellen enthalten, stabil ausgeben und erfüllt dabei die Standards für Druckqualität in 12 unterstützten Sprachen.

Interaktive Bearbeitung und themenübergreifende Konsistenz
Das Modell verfügt über leistungsstarke interaktive Bearbeitungsfunktionen und unterstützt die Ausrichtung, Verschiebung oder den Austausch von Elementen durch präzise Auswahl. So können Nutzer beispielsweise Zeichen in einem Bild auswählen, um ihre Positionen zu tauschen, oder Eiswürfel durch Früchte ersetzen, wobei eine pixelgenaue Kontrolle möglich ist. Gleichzeitig unterstützt das Modell die Konsistenz über mehrere Motive hinweg bei bis zu 9 Bildern und sorgt so für einen einheitlichen Stil und einheitliche Merkmale bei der Generierung von KI-Girlgroups oder Möbelsets.

Technologische Kerninnovationen und industrielle Anwendungen
Wan2.7-Image nutzt eine führende einheitliche Architektur sowohl für die Generierung als auch für das Verständnis und erreicht so eine semantische Zuordnung innerhalb eines gemeinsamen latenten Raums. Das bedeutet, dass das Modell nicht mehr nur Text erraten muss, um Pixel abzugleichen, sondern über ein grundlegendes semantisches Verständnis verfügt. Das Modell wurde zusammen mit der Version Wan2.7-Image-pro eingeführt, die eine stabilere Komposition und präzises Verständnis bietet.

Dieses Modell findet mittlerweile breite Anwendung in der Produktion von Kurzvideos (ein Darsteller in mehreren Rollen), in der E-Commerce-Werbung (ein Modellbild für vielfältige Verwendungszwecke), in Bildung, Forschung und im Bereich Social Entertainment. Nutzer können über die
Der KI-Browser Comet startet mit vollständiger Multitasking-Unterstützung auf dem iPad
Der KI-Browser „Comet“ von Perplexity hat offiziell seine iPad-Version veröffentlicht, die nun vollständig mit iPadOS kompatibel ist. Das Update bietet nun das Surfen in mehreren Fenstern, Multitaskin
Trace sammelt 3 Millionen Dollar, um die Hürden bei der Einführung von künstlichen Intelligenz-Agenten in Unternehmen zu überwinden.
Trotz ihres Potenzials haben künstliche Intelligenz-Agenten Schwierigkeiten, in Unternehmen Fuß zu fassen. Ein aufstrebendes Start-up ist der Ansicht, dass das Kernproblem ein Mangel an Kontext ist.Trace, ein als Teil der Sommerausbildung von Y Comb
Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt
Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze





Heim






