Option
Heim
Nachricht
Das „Images 2.0“-Modell von ChatGPT zeichnet sich durch seine Fähigkeiten zur Textgenerierung aus

Das „Images 2.0“-Modell von ChatGPT zeichnet sich durch seine Fähigkeiten zur Textgenerierung aus

17. Mai 2026
51

Noch vor wenigen Jahren war es relativ einfach, von Menschen geschaffene Bilder von KI-generierten zu unterscheiden. Damals führte die Aufforderung an ein Bildmodell, eine Speisekarte für ein mexikanisches Restaurant zu erstellen, oft zu bizarren, erfundenen Gerichten wie „Enchuita“, „Churiros“, „Burrto“ oder „Margartas“.

Wenn ich heute beim brandneuen ChatGPT Images 2.0-Modell eine Speisekarte für mexikanisches Essen anfordere, erzeugt es etwas, das sofort in einem echten Restaurant verwendet werden könnte, ohne dass Kunden wahrscheinlich etwas Ungewöhnliches bemerken würden. (Obwohl ein Ceviche für 13,50 $ vielleicht immer noch Fragen zur Fischqualität aufwerfen könnte).

Das neue „Images 2.0“-Modell von ChatGPT ist überraschend gut darin, Texte zu generieren

Bildnachweis: ChatGPT Images 2.0

Zum Vergleich: Hier ist das Ergebnis, das ich vor zwei Jahren von DALL-E 3 erhalten habe. (Zu diesem Zeitpunkt verfügte ChatGPT noch nicht über Funktionen zur Bilderzeugung):

Das neue „Images 2.0“-Modell von ChatGPT ist überraschend gut darin, Texte zu generieren

Bildnachweis: Microsoft Designer (DALL-E 3)

In der Vergangenheit hatten KI-Bildgeneratoren erhebliche Schwierigkeiten mit der Rechtschreibung. Dies liegt vor allem daran, dass sie sich in der Regel auf Diffusionsmodelle stützten, die Bilder aus zufälligem Rauschen rekonstruieren.

„Die Diffusionsmodelle […] rekonstruieren eine bestimmte Eingabe“, erklärte Asmelash Teka Hadgu, Gründer und CEO von Lesan AI, gegenüber TechCrunch im Jahr 2024. „Wir können Text auf einem Bild als sehr nebensächlichen Bestandteil betrachten, daher priorisiert der Bildgenerator das Erlernen der visuellen Muster, die mehr Pixel einnehmen.“

Seitdem haben Forscher andere Ansätze zur Bildgenerierung untersucht, wie beispielsweise autoregressive Modelle. Diese Modelle sagen Schritt für Schritt voraus, wie ein Bild aussehen sollte, und funktionieren dabei ähnlich wie große Sprachmodelle (LLMs).

Leider lehnte es OpenAI ab, während einer Pressekonferenz in dieser Woche eine Frage zur spezifischen Modellarchitektur zu beantworten, die ChatGPT Images 2.0 antreibt.

Das Unternehmen stellte jedoch klar, dass das neue Modell über „Denkfähigkeiten“ verfügt. Dies ermöglicht es ihm, das Internet zu durchsuchen, mehrere Bilder aus einer einzigen Eingabe zu erstellen und seine eigenen Ergebnisse zu überprüfen. Dank dieser Funktionen kann Images 2.0 Marketingmaterialien in verschiedenen Formaten sowie mehrteilige Comics erstellen.

OpenAI gibt außerdem an, dass Images 2.0 nicht-lateinische Schriften, darunter Japanisch, Koreanisch, Hindi und Bengali, besser darstellen kann. Das Wissen des Modells ist auf den Stand von Dezember 2025 aktualisiert, was sich auf die Genauigkeit bei der Erzeugung von Bildern zu sehr aktuellen Ereignissen auswirken kann.

„Images 2.0 bietet ein beispielloses Maß an Detailtreue und Genauigkeit bei der Bilderstellung. Es kann nicht nur komplexere Szenen konzipieren, sondern diese Vision auch effektiv umsetzen. Es befolgt Anweisungen präzise, behält gewünschte Details bei und rendert feinkörnige Elemente, die andere Bildmodelle oft vor Herausforderungen stellen – wie kleiner Text, Symbole, UI-Komponenten, komplizierte Kompositionen und subtile stilistische Nuancen –, und das alles bei Auflösungen von bis zu 2K“, so OpenAI in einer Pressemitteilung.

Diese erweiterten Funktionen bedeuten, dass die Bilderzeugung nicht so unmittelbar erfolgt wie das Stellen einer Textfrage an ChatGPT. Die Erstellung komplexer Inhalte, wie beispielsweise eines mehrteiligen Comics, dauert jedoch immer noch nur wenige Minuten.

Alle ChatGPT- und Codex-Nutzer erhalten ab Dienstag Zugriff auf Images 2.0, wobei zahlende Abonnenten erweiterte Ergebnisse generieren können. Das Unternehmen wird außerdem die gpt-image-2-API veröffentlichen, deren Preise sich nach der gewünschten Ausgabequalität und Auflösung richten.

Verwandter Artikel
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Empfehlungen zu verwandten Spezialthemen
Comic-Erstellung Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte
Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte

Entdecken Sie bei XIX.AI die besten KI-Generatoren für Shonen-Manga des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools zur Erstellung actiongeladener Sequenzen und dynamischer Energieeffekte. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie Ihr kreatives Potenzial und beginnen Sie noch heute mit der Gestaltung epischer Manga!

15 Tools
xix.ai
Geschäft Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren
Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools
xix.ai
Geschäft Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren
Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools
xix.ai
Produktivität KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern
KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern

Entdecken Sie auf XIX.AI die besten KI-basierten Coaches für persönliches Wohlbefinden und Konzentration des Jahres 2026. Unsere sorgfältig zusammengestellte Rangliste umfasst erstklassige, bahnbrechende Tools zur Bewältigung von Burnout und zur Steigerung der mentalen Energie. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schlagen Sie noch heute den Weg zu höchster Produktivität und Wohlbefinden ein.

10 Tools
xix.ai
Chatbot Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf
Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf

Entdecken Sie die besten KI-Romantik-Chatbots des Jahres 2026, mit denen Sie echte, langfristige Beziehungen aufbauen können. Unsere sorgfältig zusammengestellte Liste bietet Ihnen überzeugende, konsistente Persönlichkeiten, Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten sowie Tests aus der Praxis. Finden Sie Ihren perfekten Begleiter und legen Sie noch heute bei XIX.AI los.

10 Tools
xix.ai
Bildung und Lernen Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.
Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.

Entdecken Sie die besten AI-Data-Science-Mentoren von 2026, um SQL, Pandas und ML-Arbeitsabläufe zu meistern. Erfahren Sie mehr über unsere hochbewerteten, sorgfältig ausgewählten Angebote bei XIX.AI – für effektive und bahnbrechende Anleitung. Vergleichen Sie kostenlose und bezahlte Optionen mit praktischen Einblicken aus der Praxis. Entfalten Sie Ihr Potenzial in der Data Science noch heute.

10 Tools
xix.ai
Kommentare (0)
0/500
OR