Maison
Le modèle d'IA MAI-Image-2 de Microsoft figure parmi les trois meilleurs au classement mondial de la conversion texte-image
Mustafa Suleiman, directeur de l'IA chez Microsoft, a annoncé le lancement de MAI-Image-2, son modèle de génération d'images de deuxième génération. Ce nouveau modèle a fait une entrée remarquée dans le benchmark de référence LMArena, se hissant d'emblée à la troisième place du classement mondial.

Dans le classement LMArena — souvent qualifié de « terrain d'essai ultime » pour la génération d'images par IA —, MAI-Image-2 a rapidement attiré l'attention. Il se place désormais juste derrière Gemini-3.1-flash-image-preview de Google et GPT-image-1.5-high-fidelity d'OpenAI. Par rapport au modèle de première génération lancé en octobre 2025, qui occupait initialement la neuvième place, cette deuxième version représente un bond en avant fondamental en termes de qualité globale des résultats.

Percée technique : résoudre le problème du « texte déformé »
MAI-Image-2 apporte des améliorations visuelles significatives tout en s'attaquant à un défi persistant du secteur : le rendu précis du texte dans les images générées par l'IA.
Rendu précis du texte: le modèle affiche une amélioration majeure dans sa capacité à traiter les graphiques d'information, les diapositives de présentation et les diagrammes logiques complexes contenant du texte, en produisant des caractères clairs et lisibles sans altération.
Détails ultra-réalistes: il recrée avec précision un éclairage naturel, des textures de peau réalistes et construit des environnements réalistes qui respectent les lois de la physique.
Composition cinématographique: il permet de générer des images en ultra-haute résolution avec des concepts surréalistes, des compositions complexes et une narration visuelle riche.

Microsoft met rapidement cette fonctionnalité de pointe à la disposition des utilisateurs :
Essayez-le dès maintenant: les utilisateurs peuvent actuellement se connecter à la plateforme MAI Playground pour un essai gratuit.
Intégration à grande échelle: MAI-Image-2 est progressivement intégré à Copilot et Bing Image Creator, ce qui permettra bientôt à des millions d'utilisateurs quotidiens d'y accéder directement pour leurs projets professionnels et créatifs.
Ce lancement consolide la position de Microsoft parmi les leaders de l'IA multimodale. En résolvant le problème central du rendu de texte, il élargit considérablement les applications de la génération d'images par IA pour les cas d'utilisation professionnels et bureautiques.
Article connexe
StrictlyVC San Francisco réunira des dirigeants de TDK Ventures, Replit et d'autres entreprises
Le premier événement StrictlyVC de l'année arrive à San Francisco plus tôt que vous ne le pensez. Il reste encore des billets pour notre rencontre du 30 avril au Sentro Filipino Cultural Center,
Notion transforme son espace de travail en une plateforme centralisée pour les agents IA
Notion, l'éditeur de logiciels de productivité, entre dans l'ère des agents.Lors d'une annonce de produit diffusée en direct mercredi, Notion — surtout connu pour son application de pri
Pourriez-vous m'indiquer le titre de l'article à réécrire ?
Autrefois, pour obtenir un portrait professionnel, il fallait engager un photographe, louer un studio et réserver au moins une heure de sa journée. Aujourd’hui, un nombre croissant de plateformes basé
Recommandations de sujets spéciaux liés
commentaires (1)
Just read about Microsoft's MAI-Image-2 hitting top 3 on LMArena. As a hobbyist who dabbles with DALL-E and Midjourney, this direct benchmark climb is wild! 😲 Makes me wonder how this shakes up the 'Big Model' race... are we heading for a costly quality war, or will this push open-source models further behind? The compute costs alone must be staggering.
Mustafa Suleiman, directeur de l'IA chez Microsoft, a annoncé le lancement de MAI-Image-2, son modèle de génération d'images de deuxième génération. Ce nouveau modèle a fait une entrée remarquée dans le benchmark de référence LMArena, se hissant d'emblée à la troisième place du classement mondial.

Dans le classement LMArena — souvent qualifié de « terrain d'essai ultime » pour la génération d'images par IA —, MAI-Image-2 a rapidement attiré l'attention. Il se place désormais juste derrière Gemini-3.1-flash-image-preview de Google et GPT-image-1.5-high-fidelity d'OpenAI. Par rapport au modèle de première génération lancé en octobre 2025, qui occupait initialement la neuvième place, cette deuxième version représente un bond en avant fondamental en termes de qualité globale des résultats.

Percée technique : résoudre le problème du « texte déformé »
MAI-Image-2 apporte des améliorations visuelles significatives tout en s'attaquant à un défi persistant du secteur : le rendu précis du texte dans les images générées par l'IA.
Rendu précis du texte: le modèle affiche une amélioration majeure dans sa capacité à traiter les graphiques d'information, les diapositives de présentation et les diagrammes logiques complexes contenant du texte, en produisant des caractères clairs et lisibles sans altération.
Détails ultra-réalistes: il recrée avec précision un éclairage naturel, des textures de peau réalistes et construit des environnements réalistes qui respectent les lois de la physique.
Composition cinématographique: il permet de générer des images en ultra-haute résolution avec des concepts surréalistes, des compositions complexes et une narration visuelle riche.

Microsoft met rapidement cette fonctionnalité de pointe à la disposition des utilisateurs :
Essayez-le dès maintenant: les utilisateurs peuvent actuellement se connecter à la plateforme MAI Playground pour un essai gratuit.
Intégration à grande échelle: MAI-Image-2 est progressivement intégré à Copilot et Bing Image Creator, ce qui permettra bientôt à des millions d'utilisateurs quotidiens d'y accéder directement pour leurs projets professionnels et créatifs.
Ce lancement consolide la position de Microsoft parmi les leaders de l'IA multimodale. En résolvant le problème central du rendu de texte, il élargit considérablement les applications de la génération d'images par IA pour les cas d'utilisation professionnels et bureautiques.
StrictlyVC San Francisco réunira des dirigeants de TDK Ventures, Replit et d'autres entreprises
Le premier événement StrictlyVC de l'année arrive à San Francisco plus tôt que vous ne le pensez. Il reste encore des billets pour notre rencontre du 30 avril au Sentro Filipino Cultural Center,
Notion transforme son espace de travail en une plateforme centralisée pour les agents IA
Notion, l'éditeur de logiciels de productivité, entre dans l'ère des agents.Lors d'une annonce de produit diffusée en direct mercredi, Notion — surtout connu pour son application de pri
Pourriez-vous m'indiquer le titre de l'article à réécrire ?
Autrefois, pour obtenir un portrait professionnel, il fallait engager un photographe, louer un studio et réserver au moins une heure de sa journée. Aujourd’hui, un nombre croissant de plateformes basé
Just read about Microsoft's MAI-Image-2 hitting top 3 on LMArena. As a hobbyist who dabbles with DALL-E and Midjourney, this direct benchmark climb is wild! 😲 Makes me wonder how this shakes up the 'Big Model' race... are we heading for a costly quality war, or will this push open-source models further behind? The compute costs alone must be staggering.











