GPT-5-Start: OpenAI meistert Herausforderungen des Rollouts

Aktualisiert am Freitag, 8. August 2025, 17:21 Uhr ET: Kurz nach der Veröffentlichung dieses Artikels bestätigte der OpenAI-Mitbegründer und CEO Sam Altman, dass das Unternehmen den Zugang zu GPT-4o und anderen älteren Modellen für ausgewählte Nutzer wiederherstellen werde, und räumte ein, dass das Rollout von GPT-5 "holpriger verlief, als wir gehofft hatten".
Gelinde gesagt hat der heiß erwartete Start von OpenAIs neuem Modell GPT‑5 einen holprigen Anfang genommen.
Selbst wenn man Diagrammfehler und Sprachdemo-Probleme von der gestrigen Live-Stream-Präsentation außer Acht lässt (die vier verschiedene Modelle sowie einen "Thinking"-Modus für drei davon vorstellte), zeigen zahlreiche Nutzerberichte seit der Veröffentlichung, dass GPT‑5 bereits an relativ einfachen Problemen scheitert, die ältere OpenAI-Modelle – und Konkurrenzsysteme anderer KI-Labore – korrekt lösen.
So teilte der Datenwissenschaftler Colin Fraser beispielsweise Screenshots, die zeigten, wie GPT‑5 einen mathematischen Beweis falsch behandelte – nämlich ob 8,888 periodisch gleich 9 ist (was nicht der Fall ist).
Wow, I was just playing around before but it actually is stupid pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025
Es scheiterte auch an einer einfachen arithmetischen Gleichung, 5,9 = x + 5,11, einem Problem, das viele Grundschüler lösen könnten.
This is concerning. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
Die Verwendung von GPT‑5 zur Bewertung von OpenAIs eigenen fehlerhaften Präsentationsdiagrammen brachte ebenfalls keine nützlichen oder genauen Antworten hervor.
Q. Prove using an LLM-as-a-judge still doesn't work
A. pic.twitter.com/KnCK5Xs9ja
— Kangwook Lee (@Kangwook_Lee) August 7, 2025
Zusätzlich scheiterte es an dieser kniffligeren Textaufgabe (die zugegebenermaßen sogar ich zunächst schwierig fand – obwohl Elon Musks Grok 4 KI sie korrekt beantwortete. Als Hinweis: Denken Sie daran, dass Gehwegplatten nicht geteilt werden können; alle 80 müssen intakt bleiben).
Careful not to cut yourself on the jagged frontier pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025
In meinen Tests bewältigte das ältere Modell GPT‑4o mindestens eines dieser Mathematikprobleme zuverlässiger. Leenderweise werden diese älteren Modelle – einschließlich des vorherigen Standardmodells GPT‑4o und des Advanced Reasoning Model o3 – für ChatGPT-Nutzer schrittweise ausgemustert, obwohl sie vorerst über die API für Entwickler zugänglich bleiben.
Coding-Leistung entspricht nicht den Benchmarks
Obwohl OpenAIs interne Benchmarks und bestimmte Drittanbietertests GPT‑5 als das leistungsstärkste Modell für Coding ausweisen, deutet die Praxis darauf hin, dass Anthropics kürzlich verbessertes Claude Opus 4.1 "One-Shot"-Aufgaben oft effektiver bewältigt – und die vom Nutzer gewünschte Anwendung oder Softwarelösung wie angefordert liefert. Siehe dieses Beispiel des Entwicklers Justin Sun, gepostet auf X:
Opus 4.1's one-shot attempt at "create a 3d capybara petting zoo" – 8 minutes total
This was honestly pretty insane, not only are the capybaras way cuter and moving, there are individual pet affinity levels, a day/night switcher, feeding, and even a screenshot feature pic.twitter.com/FiKTO3FKK4
— justin (@justinsunyt) August 7, 2025
Darüber hinaus enthüllte ein Bericht des Sicherheitsunternehmens SPLX, dass OpenAIs interne Sicherheitsmaßnahmen erhebliche Lücken in Bereichen wie Business Alignment sowie anfällig für Prompt Injection und verschleierte Logik-Angriffe aufwiesen.
Obwohl anekdotisch, deutet das frühe Feedback von KI-Power-Usern auf eine insgesamt verhaltene Aufnahme hin.
Der KI-Influencer und ehemalige Googler Bilawal Sidhu startete eine Umfrage auf X, in der er seine Follower nach einer "Vibe-Check" fragte. Bei bisher 172 Stimmen lautete die vorherrschende Antwort "Kinda mid".
Alright, GPT-5 vibe check
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025
Wie das pseudonyme Konto AI Leaks and News feststellte: "Der überwältigende Konsens zu GPT-5 sowohl auf X als auch im Reddit AMA ist überwältigend negativ."
The overwhelming consensus on GPT-5 from both X and the Reddit AMA are overwhelmingly negative
Most users are disgruntled about the broken model picker and non-pro users not having access to legacy models
What are your initial thoughts on GPT-5?
— AI Leaks and News (@AILeaksAndNews) August 8, 2025
Tibor Blaho, leitender Engineer bei AIPRM und ein bekannter KI-Kommentator auf X, erstellte eine umfassende Zusammenfassung der Probleme beim ChatGPT‑5-Rollout. Er wies darauf hin, dass eine der Flaggschiff-Funktionen – ein automatischer "Router", der basierend auf der Abfragekomplexität entweder den Denk- oder Nicht-Denk-Modus auswählt – zu einer Hauptbeschwerde geworden ist, da das Modell bei vielen Nutzern oft standardmäßig in den Nicht-Denk-Modus wechselt.
A bit sad how the GPT-5 launch is going so far, especially after the long wait and high expectations
– The automatic switching between models (the router) seems partly broken/unreliable
– It's unclear exactly which model you're actually interacting with (standard or mini,…
— Tibor Blaho (@btibor91) August 8, 2025
Wettbewerber lauern in den Startlöchern
Infolgedessen ist die Stimmung rund um ChatGPT‑5 alles andere als einheitlich positiv – was eine ernsthafte Herausforderung für OpenAI darstellt, da der Wettbewerb durch US-Giganten wie Google und Anthropic zunimmt und durch eine wachsende Anzahl kostenloser, quelloffener und leistungsfähiger chinesischer Large Language Models, die Fähigkeiten bieten, die vielen US-Modellen fehlen.
Man betrachte das Alibaba Qwen-Forschungsteam, das heute sein leistungsstarkes Qwen 3-Modell aufgerüstet hat, um 1 Million Tokens Kontext zu unterstützen. Dies ermöglicht es Nutzern, pro Interaktion fast viermal mehr Informationen auszutauschen, als GPT-5 derzeit bietet.
Da OpenAIs andere große Veröffentlichung dieser Woche – eine neue Open-Source-gpt-oss-Modellreihe – ebenfalls gemischte erste Resonanz erhält, ist die Aussicht für das nutzerführende, spezialisierte KI-Unternehmen (ChatGPT zählt jetzt 700 Millionen wöchentliche aktive Nutzer) ungewiss.
Diese Stimmung spiegelt sich auf dem Prognosemarkt Polymarket wider, wo Nutzer überwältigend darauf wetten, dass Google bis Ende August 2025 wahrscheinlich das führende KI-Modell haben wird.
Andere Power-User, wie Otherside AI-Mitbegründer und CEO Matt Shumer – der frühen Zugang zu GPT‑5 hatte und eine positive Bewertung veröffentlichte – deuteten an, dass sich die Meinungen ändern könnten, sobald mehr Menschen ihre Workflows für das neue Modell optimieren:
A lot of folks who are having a bad experience are using GPT-5 in agent harnesses that aren't yet optimized for it.
For every new model release, there's a time lag between release + when companies that integrate the model have it truly working well.
Agent companies rush to…
— Matt Shumer (@mattshumer_) August 8, 2025
Obwohl es für GPT‑5 noch früh ist – und sich die Meinungen deutlich verschieben könnten, wenn mehr Menschen es in verschiedenen Aufgaben testen – deuten die ersten Anzeichen darauf hin, dass dies nicht der "Volltreffer" ist, den vorherige Veröffentlichungen wie GPT‑4, GPT‑4o oder o3 darstellten. Das ist ein beunruhigendes Signal für ein Unternehmen, das kürzlich eine weitere Finanzierungsrunde sicherte, aber aufgrund hoher F&E-Kosten weiterhin unprofitabel bleibt.
Verwandter Artikel
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Empfehlungen zu verwandten Spezialthemen
Kommentare (1)

Aktualisiert am Freitag, 8. August 2025, 17:21 Uhr ET: Kurz nach der Veröffentlichung dieses Artikels bestätigte der OpenAI-Mitbegründer und CEO Sam Altman, dass das Unternehmen den Zugang zu GPT-4o und anderen älteren Modellen für ausgewählte Nutzer wiederherstellen werde, und räumte ein, dass das Rollout von GPT-5 "holpriger verlief, als wir gehofft hatten".
Gelinde gesagt hat der heiß erwartete Start von OpenAIs neuem Modell GPT‑5 einen holprigen Anfang genommen.
Selbst wenn man Diagrammfehler und Sprachdemo-Probleme von der gestrigen Live-Stream-Präsentation außer Acht lässt (die vier verschiedene Modelle sowie einen "Thinking"-Modus für drei davon vorstellte), zeigen zahlreiche Nutzerberichte seit der Veröffentlichung, dass GPT‑5 bereits an relativ einfachen Problemen scheitert, die ältere OpenAI-Modelle – und Konkurrenzsysteme anderer KI-Labore – korrekt lösen.
So teilte der Datenwissenschaftler Colin Fraser beispielsweise Screenshots, die zeigten, wie GPT‑5 einen mathematischen Beweis falsch behandelte – nämlich ob 8,888 periodisch gleich 9 ist (was nicht der Fall ist).
Wow, I was just playing around before but it actually is stupid pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025
Es scheiterte auch an einer einfachen arithmetischen Gleichung, 5,9 = x + 5,11, einem Problem, das viele Grundschüler lösen könnten.
This is concerning. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
Die Verwendung von GPT‑5 zur Bewertung von OpenAIs eigenen fehlerhaften Präsentationsdiagrammen brachte ebenfalls keine nützlichen oder genauen Antworten hervor.
Q. Prove using an LLM-as-a-judge still doesn't work
— Kangwook Lee (@Kangwook_Lee) August 7, 2025
A. pic.twitter.com/KnCK5Xs9ja
Zusätzlich scheiterte es an dieser kniffligeren Textaufgabe (die zugegebenermaßen sogar ich zunächst schwierig fand – obwohl Elon Musks Grok 4 KI sie korrekt beantwortete. Als Hinweis: Denken Sie daran, dass Gehwegplatten nicht geteilt werden können; alle 80 müssen intakt bleiben).
Careful not to cut yourself on the jagged frontier pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025
In meinen Tests bewältigte das ältere Modell GPT‑4o mindestens eines dieser Mathematikprobleme zuverlässiger. Leenderweise werden diese älteren Modelle – einschließlich des vorherigen Standardmodells GPT‑4o und des Advanced Reasoning Model o3 – für ChatGPT-Nutzer schrittweise ausgemustert, obwohl sie vorerst über die API für Entwickler zugänglich bleiben.
Coding-Leistung entspricht nicht den Benchmarks
Obwohl OpenAIs interne Benchmarks und bestimmte Drittanbietertests GPT‑5 als das leistungsstärkste Modell für Coding ausweisen, deutet die Praxis darauf hin, dass Anthropics kürzlich verbessertes Claude Opus 4.1 "One-Shot"-Aufgaben oft effektiver bewältigt – und die vom Nutzer gewünschte Anwendung oder Softwarelösung wie angefordert liefert. Siehe dieses Beispiel des Entwicklers Justin Sun, gepostet auf X:
Opus 4.1's one-shot attempt at "create a 3d capybara petting zoo" – 8 minutes total
— justin (@justinsunyt) August 7, 2025
This was honestly pretty insane, not only are the capybaras way cuter and moving, there are individual pet affinity levels, a day/night switcher, feeding, and even a screenshot feature pic.twitter.com/FiKTO3FKK4
Darüber hinaus enthüllte ein Bericht des Sicherheitsunternehmens SPLX, dass OpenAIs interne Sicherheitsmaßnahmen erhebliche Lücken in Bereichen wie Business Alignment sowie anfällig für Prompt Injection und verschleierte Logik-Angriffe aufwiesen.
Obwohl anekdotisch, deutet das frühe Feedback von KI-Power-Usern auf eine insgesamt verhaltene Aufnahme hin.
Der KI-Influencer und ehemalige Googler Bilawal Sidhu startete eine Umfrage auf X, in der er seine Follower nach einer "Vibe-Check" fragte. Bei bisher 172 Stimmen lautete die vorherrschende Antwort "Kinda mid".
Alright, GPT-5 vibe check
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025
Wie das pseudonyme Konto AI Leaks and News feststellte: "Der überwältigende Konsens zu GPT-5 sowohl auf X als auch im Reddit AMA ist überwältigend negativ."
The overwhelming consensus on GPT-5 from both X and the Reddit AMA are overwhelmingly negative
— AI Leaks and News (@AILeaksAndNews) August 8, 2025
Most users are disgruntled about the broken model picker and non-pro users not having access to legacy models
What are your initial thoughts on GPT-5?
Tibor Blaho, leitender Engineer bei AIPRM und ein bekannter KI-Kommentator auf X, erstellte eine umfassende Zusammenfassung der Probleme beim ChatGPT‑5-Rollout. Er wies darauf hin, dass eine der Flaggschiff-Funktionen – ein automatischer "Router", der basierend auf der Abfragekomplexität entweder den Denk- oder Nicht-Denk-Modus auswählt – zu einer Hauptbeschwerde geworden ist, da das Modell bei vielen Nutzern oft standardmäßig in den Nicht-Denk-Modus wechselt.
A bit sad how the GPT-5 launch is going so far, especially after the long wait and high expectations
— Tibor Blaho (@btibor91) August 8, 2025
– The automatic switching between models (the router) seems partly broken/unreliable
– It's unclear exactly which model you're actually interacting with (standard or mini,…
Wettbewerber lauern in den Startlöchern
Infolgedessen ist die Stimmung rund um ChatGPT‑5 alles andere als einheitlich positiv – was eine ernsthafte Herausforderung für OpenAI darstellt, da der Wettbewerb durch US-Giganten wie Google und Anthropic zunimmt und durch eine wachsende Anzahl kostenloser, quelloffener und leistungsfähiger chinesischer Large Language Models, die Fähigkeiten bieten, die vielen US-Modellen fehlen.
Man betrachte das Alibaba Qwen-Forschungsteam, das heute sein leistungsstarkes Qwen 3-Modell aufgerüstet hat, um 1 Million Tokens Kontext zu unterstützen. Dies ermöglicht es Nutzern, pro Interaktion fast viermal mehr Informationen auszutauschen, als GPT-5 derzeit bietet.
Da OpenAIs andere große Veröffentlichung dieser Woche – eine neue Open-Source-gpt-oss-Modellreihe – ebenfalls gemischte erste Resonanz erhält, ist die Aussicht für das nutzerführende, spezialisierte KI-Unternehmen (ChatGPT zählt jetzt 700 Millionen wöchentliche aktive Nutzer) ungewiss.
Diese Stimmung spiegelt sich auf dem Prognosemarkt Polymarket wider, wo Nutzer überwältigend darauf wetten, dass Google bis Ende August 2025 wahrscheinlich das führende KI-Modell haben wird.
Andere Power-User, wie Otherside AI-Mitbegründer und CEO Matt Shumer – der frühen Zugang zu GPT‑5 hatte und eine positive Bewertung veröffentlichte – deuteten an, dass sich die Meinungen ändern könnten, sobald mehr Menschen ihre Workflows für das neue Modell optimieren:
A lot of folks who are having a bad experience are using GPT-5 in agent harnesses that aren't yet optimized for it.
— Matt Shumer (@mattshumer_) August 8, 2025
For every new model release, there's a time lag between release + when companies that integrate the model have it truly working well.
Agent companies rush to…
Obwohl es für GPT‑5 noch früh ist – und sich die Meinungen deutlich verschieben könnten, wenn mehr Menschen es in verschiedenen Aufgaben testen – deuten die ersten Anzeichen darauf hin, dass dies nicht der "Volltreffer" ist, den vorherige Veröffentlichungen wie GPT‑4, GPT‑4o oder o3 darstellten. Das ist ein beunruhigendes Signal für ein Unternehmen, das kürzlich eine weitere Finanzierungsrunde sicherte, aber aufgrund hoher F&E-Kosten weiterhin unprofitabel bleibt.
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um





Heim






