Maison
Alibaba dévoile Wan2.7-Image pour mettre fin à l'ère des visages génériques générés par l'IA
L'équipe officielle chargée des grands modèles d'Ali a lancé aujourd'hui Wan2.7-Image, un modèle unifié de génération et d'édition d'images. Ce modèle représente un bond en avant qualitatif par rapport à son prédécesseur en matière de personnalisation des portraits, de contrôle des couleurs et de rendu de textes longs, dans le but de surmonter la « monotonie » générique souvent observée dans les visuels générés par l'IA.
Le modèle est désormais accessible via une API sur la plateforme Alibaba Cloud BaiLian et est également disponible en essai public sur le site web WanXiang.

Principales améliorations : « sculpture faciale » virtuelle et contrôle précis des couleurs
Wan2.7-Image introduit plusieurs fonctionnalités de pointe et différenciées qui élargissent considérablement les possibilités créatives :
Des visages uniques pour chaque sujet : il offre des capacités améliorées de « sculpture faciale » virtuelle. Les utilisateurs peuvent contrôler avec précision la structure osseuse, la forme des yeux (comme les yeux en amande ou de phénix) et d’autres détails du visage à l’aide de commandes textuelles, éliminant ainsi efficacement les visages standardisés générés par l’IA.
Palette de couleurs de précision : il intègre désormais un contrôle avancé des couleurs. Les utilisateurs peuvent extraire les proportions de couleurs d'images de référence pour reproduire avec précision des teintes spécifiques — telles que le jaune vif de Van Gogh ou le bleu froid de Picasso — dans de nouvelles créations.
Rendu de texte ultra-long de 3 000 caractères : il résout les problèmes courants liés à la génération de texte par IA, en prenant en charge jusqu’à 12 langues. Le modèle peut rendre des textes complexes, des tableaux ou des formules couvrant une page A4 entière avec une qualité prête à l’impression.
Dans le domaine de la retouche d'images, Wan2.7-Image lance une fonction d'« édition interactive ». Les utilisateurs peuvent simplement sélectionner une zone précise pour ajouter, aligner, déplacer ou même effectuer des remplacements logiques au niveau du pixel — comme remplacer des glaçons par des fruits tout en préservant parfaitement l'éclairage d'origine de la scène.

De plus, le modèle prend en charge la génération d’ensembles cohérents comprenant jusqu’à 12 images, en conservant une grande cohérence dans le style et les caractéristiques du sujet d’une scène à l’autre — idéal pour les portraits de groupe ou les combinaisons de produits coordonnées.
Ali explique que Wan2.7-Image utilise une architecture unifiée à la fois pour la génération et la compréhension. En réalisant un mappage sémantique au sein d’un espace latent partagé, le modèle va au-delà de la simple devinette des motifs de pixels et développe une véritable compréhension sous-jacente de la sémantique.
Avec sa sortie prévue pour le paysage de la création visuelle de 2026, Wan2.7-Image marque un tournant dans la génération d'images par IA : du « tirage au sort » au contrôle de précision « de niveau industriel ». Cette capacité d'édition haute fidélité devrait considérablement réduire les obstacles à la création de contenu professionnel, qu'il s'agisse de storyboards de films, de publicités pour le commerce électronique ou de transformations sur les réseaux sociaux.
Article connexe
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large
Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Le district de Shangcheng à Hangzhou lance les premières “Dix Mesures d’Or” audiovisuelles de Zhejiang dans le cadre du programme AIGC, avec la création d’un fonds industriel de 5 milliards de yuans.
Le 16ème, la Conférence sur l’écosystème d’innovation de l’industrie audiovisuelle AIGC s’est tenue dans le district de Shangcheng à Hangzhou. Lors de cet événement, la province a dévoilé sa première politique spécifique pour l’industrie audiovisuell
Recommandations de sujets spéciaux liés
commentaires (0)
L'équipe officielle chargée des grands modèles d'Ali a lancé aujourd'hui Wan2.7-Image, un modèle unifié de génération et d'édition d'images. Ce modèle représente un bond en avant qualitatif par rapport à son prédécesseur en matière de personnalisation des portraits, de contrôle des couleurs et de rendu de textes longs, dans le but de surmonter la « monotonie » générique souvent observée dans les visuels générés par l'IA.
Le modèle est désormais accessible via une API sur la plateforme Alibaba Cloud BaiLian et est également disponible en essai public sur le site web WanXiang.

Principales améliorations : « sculpture faciale » virtuelle et contrôle précis des couleurs
Wan2.7-Image introduit plusieurs fonctionnalités de pointe et différenciées qui élargissent considérablement les possibilités créatives :
Des visages uniques pour chaque sujet : il offre des capacités améliorées de « sculpture faciale » virtuelle. Les utilisateurs peuvent contrôler avec précision la structure osseuse, la forme des yeux (comme les yeux en amande ou de phénix) et d’autres détails du visage à l’aide de commandes textuelles, éliminant ainsi efficacement les visages standardisés générés par l’IA.
Palette de couleurs de précision : il intègre désormais un contrôle avancé des couleurs. Les utilisateurs peuvent extraire les proportions de couleurs d'images de référence pour reproduire avec précision des teintes spécifiques — telles que le jaune vif de Van Gogh ou le bleu froid de Picasso — dans de nouvelles créations.
Rendu de texte ultra-long de 3 000 caractères : il résout les problèmes courants liés à la génération de texte par IA, en prenant en charge jusqu’à 12 langues. Le modèle peut rendre des textes complexes, des tableaux ou des formules couvrant une page A4 entière avec une qualité prête à l’impression.
Dans le domaine de la retouche d'images, Wan2.7-Image lance une fonction d'« édition interactive ». Les utilisateurs peuvent simplement sélectionner une zone précise pour ajouter, aligner, déplacer ou même effectuer des remplacements logiques au niveau du pixel — comme remplacer des glaçons par des fruits tout en préservant parfaitement l'éclairage d'origine de la scène.

De plus, le modèle prend en charge la génération d’ensembles cohérents comprenant jusqu’à 12 images, en conservant une grande cohérence dans le style et les caractéristiques du sujet d’une scène à l’autre — idéal pour les portraits de groupe ou les combinaisons de produits coordonnées.
Ali explique que Wan2.7-Image utilise une architecture unifiée à la fois pour la génération et la compréhension. En réalisant un mappage sémantique au sein d’un espace latent partagé, le modèle va au-delà de la simple devinette des motifs de pixels et développe une véritable compréhension sous-jacente de la sémantique.
Avec sa sortie prévue pour le paysage de la création visuelle de 2026, Wan2.7-Image marque un tournant dans la génération d'images par IA : du « tirage au sort » au contrôle de précision « de niveau industriel ». Cette capacité d'édition haute fidélité devrait considérablement réduire les obstacles à la création de contenu professionnel, qu'il s'agisse de storyboards de films, de publicités pour le commerce électronique ou de transformations sur les réseaux sociaux.
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large
Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Le district de Shangcheng à Hangzhou lance les premières “Dix Mesures d’Or” audiovisuelles de Zhejiang dans le cadre du programme AIGC, avec la création d’un fonds industriel de 5 milliards de yuans.
Le 16ème, la Conférence sur l’écosystème d’innovation de l’industrie audiovisuelle AIGC s’est tenue dans le district de Shangcheng à Hangzhou. Lors de cet événement, la province a dévoilé sa première politique spécifique pour l’industrie audiovisuell











