option
Maison
Nouvelles
Le modèle Images 2.0 de ChatGPT excelle dans la génération de texte

Le modèle Images 2.0 de ChatGPT excelle dans la génération de texte

17 mai 2026
51

Il y a encore quelques années, il était relativement facile de distinguer les images créées par l'homme de celles générées par l'IA. À l'époque, demander à un modèle d'image de créer un menu pour un restaurant mexicain donnait souvent lieu à des plats bizarres et inventés de toutes pièces, tels que « enchuita », « churiros », « burrto » ou « margartas ».

Aujourd’hui, lorsque je demande un menu de cuisine mexicaine au tout nouveau modèle ChatGPT Images 2.0, celui-ci produit quelque chose qui pourrait être utilisé immédiatement dans un vrai restaurant, sans que les clients ne remarquent quoi que ce soit d’anormal. (Même si un ceviche à 13,50 $ pourrait encore soulever quelques questions quant à la qualité du poisson).

Le nouveau modèle Images 2.0 de ChatGPT est étonnamment performant pour générer du texte

Crédits image : ChatGPT Images 2.0

À titre de comparaison, voici le résultat que j’ai obtenu avec DALL-E 3 il y a deux ans. (À l’époque, ChatGPT ne disposait pas de capacités de génération d’images) :

Le nouveau modèle Images 2.0 de ChatGPT est étonnamment performant pour générer du texte

Crédits image : Microsoft Designer (DALL-E 3)

Historiquement, les générateurs d'images basés sur l'IA ont toujours rencontré d'importantes difficultés avec l'orthographe. Cela s'explique en grande partie par le fait qu'ils s'appuyaient généralement sur des modèles de diffusion, qui reconstruisent des images à partir de bruit aléatoire.

« Les modèles de diffusion [...] reconstruisent une entrée donnée », a expliqué Asmelash Teka Hadgu, fondateur et PDG de Lesan AI, à TechCrunch en 2024. « On peut considérer que le texte sur une image est un élément très mineur, donc le générateur d’images donne la priorité à l’apprentissage des motifs visuels qui occupent le plus de pixels. »

Depuis lors, les chercheurs ont exploré d’autres approches de la génération d’images, telles que les modèles autorégressifs. Ces modèles prédisent étape par étape à quoi une image devrait ressembler, fonctionnant de manière plus similaire aux grands modèles linguistiques (LLM).

Malheureusement, OpenAI a refusé de répondre à une question posée lors d’une conférence de presse cette semaine concernant l’architecture spécifique du modèle qui alimente ChatGPT Images 2.0.

La société a toutefois précisé que le nouveau modèle possédait des « capacités de réflexion ». Cela lui permet d’effectuer des recherches sur le Web, de créer plusieurs images à partir d’une seule invite et d’examiner ses propres résultats. Ces fonctionnalités permettent à Images 2.0 de produire des supports marketing dans différentes dimensions, ainsi que des bandes dessinées à plusieurs cases.

OpenAI indique également qu'Images 2.0 maîtrise mieux le rendu des scripts non latins, notamment le japonais, le coréen, l'hindi et le bengali. Les connaissances du modèle sont à jour jusqu'en décembre 2025, ce qui peut affecter sa précision lors de la génération d'images liées à des événements très récents.

« Images 2.0 offre un niveau de détail et de précision sans précédent dans la création d’images. Il est non seulement capable de conceptualiser des scènes plus complexes, mais aussi de concrétiser efficacement cette vision. Il suit les instructions avec précision, conserve les détails demandés et rend des éléments très fins qui posent souvent des difficultés à d’autres modèles d’image — tels que les petits textes, les icônes, les composants d’interface utilisateur, les compositions complexes et les nuances stylistiques subtiles — le tout à des résolutions allant jusqu’à 2K », a noté OpenAI dans un communiqué de presse.

Ces capacités avancées signifient que la génération d’images n’est pas aussi instantanée que de poser une question textuelle à ChatGPT. Cependant, la création de quelque chose de complexe, comme une bande dessinée en plusieurs cases, ne prend toujours que quelques minutes.

Tous les utilisateurs de ChatGPT et Codex auront accès à Images 2.0 à partir de mardi, les abonnés payants pouvant générer des résultats plus avancés. La société lancera également l’API gpt-image-2, dont les tarifs seront basés sur la qualité et la résolution souhaitées.

Article connexe
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI Greg Brockman révèle comment Elon Musk a quitté OpenAI Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Recommandations de sujets spéciaux liés
Synthèse vocale Les meilleures applications de synthèse vocale basées sur l'IA pour la dyslexie : un soutien à l'apprentissage et à l'efficacité en lecture pour les élèves
Les meilleures applications de synthèse vocale basées sur l'IA pour la dyslexie : un soutien à l'apprentissage et à l'efficacité en lecture pour les élèves

Découvrez les meilleures applications de synthèse vocale par IA de 2026, spécialement sélectionnées pour aider les personnes dyslexiques. Notre classement d'experts compare les outils gratuits et payants, en mettant en avant des fonctionnalités performantes qui améliorent l'efficacité de la lecture et l'apprentissage. Découvrez des solutions révolutionnaires à ne pas manquer pour libérer le potentiel des élèves. Commencez votre parcours sur XIX.AI.

10 outils
xix.ai
Création de bande dessinée Les meilleurs générateurs IA pour les mangas shonen : créez des séquences d'action survoltées et des effets d'énergie
Les meilleurs générateurs IA pour les mangas shonen : créez des séquences d'action survoltées et des effets d'énergie

Découvrez les meilleurs générateurs IA de mangas shonen de 2026 sur XIX.AI. Notre sélection triée sur le volet comprend des outils performants pour créer des séquences d'action à couper le souffle et des effets d'énergie dynamiques. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez votre potentiel créatif et commencez dès aujourd'hui à créer des mangas épiques !

15 outils
xix.ai
Entreprise Les meilleurs outils de suivi des dépenses basés sur l'IA : numérisez vos reçus et classez automatiquement les dépenses de l'entreprise
Les meilleurs outils de suivi des dépenses basés sur l'IA : numérisez vos reçus et classez automatiquement les dépenses de l'entreprise

Les meilleurs outils de gestion des dépenses basés sur l'IA en 2026 : les outils les mieux notés pour numériser vos reçus et classer automatiquement les dépenses de votre entreprise. Découvrez des solutions puissantes et révolutionnaires pour une gestion des dépenses sans effort, un suivi financier précis et une conformité simplifiée. Notre comparatif, mis à jour chaque semaine, qui oppose les options gratuites aux options payantes, vous aide à trouver la solution qui vous convient le mieux. Tirez pleinement parti de l'IA grâce aux recommandations d'experts de XIX.AI.

10 outils
xix.ai
Entreprise Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats
Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats

Découvrez les meilleurs outils de recrutement basés sur l'IA de 2026 sur XIX.AI. Notre sélection propose des solutions performantes et révolutionnaires pour l'analyse des CV et l'automatisation de la planification des entretiens avec les candidats. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez l'assistant de recrutement idéal et optimisez votre processus de recrutement dès aujourd'hui !

10 outils
xix.ai
Productivité Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale
Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale

Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.

10 outils
xix.ai
chatbot Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes
Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes

Découvrez les meilleurs chatbots romantiques basés sur l'IA de 2026, sélectionnés pour vous aider à nouer des relations authentiques et durables. Notre sélection comprend des personnalités fortes et cohérentes, des comparaisons entre versions gratuites et payantes, ainsi que des tests en conditions réelles. Trouvez le compagnon idéal et commencez dès aujourd'hui sur XIX.AI.

10 outils
xix.ai
commentaires (0)
0/500
OR