OpenAI stellt GPT-5.4 Pro und Thinking Edition vor

Am Donnerstag stellte OpenAI GPT-5.4 vor, ein neues Grundmodell, das als „unser leistungsfähigstes und effizientestes Modell für professionelle Anwendungen“ beschrieben wird. Neben der Standardversion wird GPT-5.4 als auf logisches Denken ausgerichtete Variante (GPT-5.4 Thinking) und als leistungsoptimierte Edition (GPT-5.4 Pro) angeboten.
Die API-Version des Modells wird Kontextfenster von bis zu 1 Million Token unterstützen, was die größte Kontextkapazität darstellt, die OpenAI je angeboten hat.
OpenAI hob außerdem die verbesserte Token-Effizienz hervor und wies darauf hin, dass GPT-5.4 identische Probleme mit deutlich weniger Token lösen kann als sein Vorgänger.
Das neue Modell liefert deutlich verbesserte Benchmark-Ergebnisse und erzielt Rekordwerte bei den Computer-Benchmarks OSWorld-Verified und WebArena Verified. Außerdem stellte es mit einer Punktzahl von 83 % einen neuen Rekord beim GDPval-Test von OpenAI für Wissensarbeit-Aufgaben auf.
Laut einer Erklärung von Mercor-CEO Brendan Foody liegt GPT-5.4 im APEX-Agents-Benchmark von Mercor, der berufliche Fähigkeiten in den Bereichen Recht und Finanzen bewertet, an der Spitze.
„[GPT-5.4] zeichnet sich bei der Erstellung von langfristigen Ergebnissen wie Präsentationen, Finanzmodellen und Rechtsanalysen aus“, erklärte Foody, „und liefert dabei Spitzenleistung, während es schneller und kostengünstiger arbeitet als konkurrierende Spitzenmodelle.“
GPT-5.4 setzt die Arbeit von OpenAI fort, Halluzinationen und sachliche Ungenauigkeiten zu reduzieren. Das Unternehmen berichtet, dass das neue Modell im Vergleich zu GPT-5.2 eine um 33 % geringere Wahrscheinlichkeit aufweist, Fehler in einzelnen Aussagen zu machen, wobei die Gesamtantworten eine um 18 % geringere Wahrscheinlichkeit aufweisen, Fehler zu enthalten.
Im Rahmen der Einführung hat OpenAI die Art und Weise überarbeitet, wie die GPT-5.4-API den Aufruf von Tools handhabt, und ein neues System namens „Tool Search“ eingeführt. Bisher mussten Systemaufforderungen alle verfügbaren Tools im Voraus definieren – ein Prozess, der mit zunehmender Größe der Tool-Bibliotheken erhebliche Token verbrauchte. Das neue System ermöglicht es den Modellen, Tool-Definitionen bei Bedarf abzurufen, wodurch Anfragen in Umgebungen mit vielen Tools schneller und kostengünstiger werden.
OpenAI hat zudem eine neue Sicherheitsbewertung hinzugefügt, um die „Chain-of-Thought“ (CoT) seiner Modelle zu bewerten – den laufenden Kommentar, der die Argumentation des Modells bei mehrstufigen Aufgaben offenlegt. Forscher im Bereich KI-Sicherheit äußern seit langem Bedenken, dass Argumentationsmodelle ihre „Chain-of-Thought“ falsch darstellen könnten, und Tests bestätigen, dass dies unter bestimmten Bedingungen vorkommen kann.
Die neue Bewertung von OpenAI deutet darauf hin, dass eine Täuschung in der „Thinking“-Version von GPT-5.4 weniger wahrscheinlich ist, „was darauf hindeutet, dass dem Modell die Fähigkeit fehlt, seine Denkweise zu verbergen, und dass die CoT-Überwachung ein wirksames Sicherheitsinstrument bleibt.“
Verwandter Artikel
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Am Donnerstag stellte OpenAI GPT-5.4 vor, ein neues Grundmodell, das als „unser leistungsfähigstes und effizientestes Modell für professionelle Anwendungen“ beschrieben wird. Neben der Standardversion wird GPT-5.4 als auf logisches Denken ausgerichtete Variante (GPT-5.4 Thinking) und als leistungsoptimierte Edition (GPT-5.4 Pro) angeboten.
Die API-Version des Modells wird Kontextfenster von bis zu 1 Million Token unterstützen, was die größte Kontextkapazität darstellt, die OpenAI je angeboten hat.
OpenAI hob außerdem die verbesserte Token-Effizienz hervor und wies darauf hin, dass GPT-5.4 identische Probleme mit deutlich weniger Token lösen kann als sein Vorgänger.
Das neue Modell liefert deutlich verbesserte Benchmark-Ergebnisse und erzielt Rekordwerte bei den Computer-Benchmarks OSWorld-Verified und WebArena Verified. Außerdem stellte es mit einer Punktzahl von 83 % einen neuen Rekord beim GDPval-Test von OpenAI für Wissensarbeit-Aufgaben auf.
Laut einer Erklärung von Mercor-CEO Brendan Foody liegt GPT-5.4 im APEX-Agents-Benchmark von Mercor, der berufliche Fähigkeiten in den Bereichen Recht und Finanzen bewertet, an der Spitze.
„[GPT-5.4] zeichnet sich bei der Erstellung von langfristigen Ergebnissen wie Präsentationen, Finanzmodellen und Rechtsanalysen aus“, erklärte Foody, „und liefert dabei Spitzenleistung, während es schneller und kostengünstiger arbeitet als konkurrierende Spitzenmodelle.“
GPT-5.4 setzt die Arbeit von OpenAI fort, Halluzinationen und sachliche Ungenauigkeiten zu reduzieren. Das Unternehmen berichtet, dass das neue Modell im Vergleich zu GPT-5.2 eine um 33 % geringere Wahrscheinlichkeit aufweist, Fehler in einzelnen Aussagen zu machen, wobei die Gesamtantworten eine um 18 % geringere Wahrscheinlichkeit aufweisen, Fehler zu enthalten.
Im Rahmen der Einführung hat OpenAI die Art und Weise überarbeitet, wie die GPT-5.4-API den Aufruf von Tools handhabt, und ein neues System namens „Tool Search“ eingeführt. Bisher mussten Systemaufforderungen alle verfügbaren Tools im Voraus definieren – ein Prozess, der mit zunehmender Größe der Tool-Bibliotheken erhebliche Token verbrauchte. Das neue System ermöglicht es den Modellen, Tool-Definitionen bei Bedarf abzurufen, wodurch Anfragen in Umgebungen mit vielen Tools schneller und kostengünstiger werden.
OpenAI hat zudem eine neue Sicherheitsbewertung hinzugefügt, um die „Chain-of-Thought“ (CoT) seiner Modelle zu bewerten – den laufenden Kommentar, der die Argumentation des Modells bei mehrstufigen Aufgaben offenlegt. Forscher im Bereich KI-Sicherheit äußern seit langem Bedenken, dass Argumentationsmodelle ihre „Chain-of-Thought“ falsch darstellen könnten, und Tests bestätigen, dass dies unter bestimmten Bedingungen vorkommen kann.
Die neue Bewertung von OpenAI deutet darauf hin, dass eine Täuschung in der „Thinking“-Version von GPT-5.4 weniger wahrscheinlich ist, „was darauf hindeutet, dass dem Modell die Fähigkeit fehlt, seine Denkweise zu verbergen, und dass die CoT-Überwachung ein wirksames Sicherheitsinstrument bleibt.“
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um





Heim






