Heim
GPT-5.4 präsentiert native Hacking-Fähigkeiten, während OSWorld bei einem KI-Durchbruch die Menschen übertrifft

Der Konkurrenz einen Schritt voraus: GPT-5.4 läutet das Zeitalter der nativen Computersteuerung ein
Im März 2026 veröffentlichte OpenAI überraschend GPT-5.4 und veränderte damit die Wettbewerbslandschaft für KI-Agenten grundlegend. Als erstes allgemeines Modell von OpenAI mit nativer Computerbedienungsfähigkeit ist GPT-5.4 nicht mehr auf externe Adapter angewiesen. Stattdessen interpretiert es Bildschirmaufnahmen direkt, simuliert Mausklicks und Tastatureingaben und navigiert in Desktop-Software genau wie ein menschlicher Benutzer.
Im OSWorld-Verified-Benchmark, der die tatsächliche Kompetenz bei der Desktop-Navigation misst, stieg die Erfolgsquote von GPT-5.4 auf 75,0 %. Zum Vergleich: Der durchschnittliche Referenzwert für Menschen liegt bei 72,4 %, während die Vorgängergeneration GPT-5.2 nur 47,3 % erreichte. Dies zeigt, dass zum ersten Mal in der Geschichte die Kompetenz einer KI bei der Computersteuerung die eines durchschnittlichen menschlichen Nutzers übertroffen hat.
Praxistests: Das „digitale Double“ für Profis wird Realität
Derzeit über die Webversion und die Codex-Plattform zugänglich, zeigen Tests in der Praxis, dass GPT-5.4 nahezu jeden Computervorgang bewältigen kann:
Umfassende Beherrschung von Anwendungen: Es kann die Kalender-App starten und selbstständig Berechtigungen zum Einrichten von Erinnerungen anfordern; es kann Apps von Drittanbietern wie „Xiaoyuzhou“ präzise finden und öffnen, um bestimmte Inhalte abzuspielen.
Zugriff auf Systemebene: Benutzer können es anweisen, das Hintergrundbild des Computers direkt zu ändern oder verschiedene Entwicklungstools innerhalb des Terminals fachkundig zu nutzen.
Native Rechenlogik: Es geht über die bloße Bereitstellung von Antworten hinaus und führt simulierte Operationen direkt in der nativen Rechneranwendung des Systems durch.
Dieses „native Gefühl“ symbolisiert die Entwicklung der KI von einem „Konversationsassistenten“ zu einer „ausführenden Instanz“.
Die perfekte Kombination: GPT-5.4 löst die zentralen Herausforderungen von OpenClaw
Das Open-Source-Projekt OpenClaw, dessen Popularität Anfang 2026 sprunghaft anstieg (mit über 250.000 Stars), hat sein „ideales Modell“ gefunden. Die Kernphilosophie von OpenClaw lautet „KI, die tatsächlich funktioniert“, und GPT-5.4 passt in vier entscheidenden Dimensionen perfekt dazu:
Native Steuerungsanpassung: Durch die Integration mit GPT-5.4 erreicht OpenClaw Desktop-Automatisierung ohne komplexe Workarounds und liefert damit deutliche Leistungssteigerungen.
1 Million Token Kontext: Das extrem lange Kontextfenster löst das Problem der „Vergesslichkeit“, mit dem Agenten bei langwierigen Aufgaben konfrontiert sind, und bietet OpenClaw einen riesigen „Arbeitsbereich“ für die komplexe Dateiverwaltung.
Revolution bei den Tool-Suchkosten: Der On-Demand-Nutzungsmechanismus von GPT-5.4 senkt den Token-Verbrauch um 47 % und reduziert damit die API-Kosten für den 24/7-Betrieb von Agenten drastisch.
Sprung in der Denkfähigkeit: Bei professionellen Arbeitsaufgaben übertrifft GPT-5.4 83 % der menschlichen Experten und ermöglicht es OpenClaw, sich von einem einfachen „Skript-Ausführer“ zu einem hochqualifizierten Spezialisten zu entwickeln, der Finanzanalysen und Investitionsmemos bearbeiten kann.
Brancheneinblick: Die Automatisierungssingularität für hochqualifizierte Berufe ist da
Matt Shumer, CEO von HyperWriteAI, beschrieb die Programmierfähigkeiten von GPT-5.4 als „nahezu makellos“; Brenda, CEO von Mercor AI, ist der Ansicht, dass das Modell kurz davor steht, das Fachwissen führender Beratungsunternehmen, Investmentbanken und Anwaltskanzleien zu übertreffen. Dies signalisiert, dass Rollen, die einst als einzigartig menschlich und unersetzbar galten, nun einer umfassenden Herausforderung durch KI-Agenten ausgesetzt sind.
Verwandter Artikel
Britische Ministerien streiten über den Energiebedarf von KI-Rechenzentren
Die britische Regierung steht vor einer großen Herausforderung: Sie will die Nutzung sauberer Energien vorantreiben und gleichzeitig eine weltweit führende Rolle im Bereich der künstlichen Intelligenz
Die chinesische Cyberspace-Behörde schreibt die Kennzeichnung von KI-generierten und fiktionalen Kurzvideos vor
Die chinesische Cyberspace-Behörde hat einen umfassenden Plan zur Vereinheitlichung der Kennzeichnung von Kurzvideoinhalten vorgestellt, der Plattformen zur Verwendung von sechs vorgeschriebenen Kennz
DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung
DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte A
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Der Konkurrenz einen Schritt voraus: GPT-5.4 läutet das Zeitalter der nativen Computersteuerung ein
Im März 2026 veröffentlichte OpenAI überraschend GPT-5.4 und veränderte damit die Wettbewerbslandschaft für KI-Agenten grundlegend. Als erstes allgemeines Modell von OpenAI mit nativer Computerbedienungsfähigkeit ist GPT-5.4 nicht mehr auf externe Adapter angewiesen. Stattdessen interpretiert es Bildschirmaufnahmen direkt, simuliert Mausklicks und Tastatureingaben und navigiert in Desktop-Software genau wie ein menschlicher Benutzer.
Im OSWorld-Verified-Benchmark, der die tatsächliche Kompetenz bei der Desktop-Navigation misst, stieg die Erfolgsquote von GPT-5.4 auf 75,0 %. Zum Vergleich: Der durchschnittliche Referenzwert für Menschen liegt bei 72,4 %, während die Vorgängergeneration GPT-5.2 nur 47,3 % erreichte. Dies zeigt, dass zum ersten Mal in der Geschichte die Kompetenz einer KI bei der Computersteuerung die eines durchschnittlichen menschlichen Nutzers übertroffen hat.
Praxistests: Das „digitale Double“ für Profis wird Realität
Derzeit über die Webversion und die Codex-Plattform zugänglich, zeigen Tests in der Praxis, dass GPT-5.4 nahezu jeden Computervorgang bewältigen kann:
Umfassende Beherrschung von Anwendungen: Es kann die Kalender-App starten und selbstständig Berechtigungen zum Einrichten von Erinnerungen anfordern; es kann Apps von Drittanbietern wie „Xiaoyuzhou“ präzise finden und öffnen, um bestimmte Inhalte abzuspielen.
Zugriff auf Systemebene: Benutzer können es anweisen, das Hintergrundbild des Computers direkt zu ändern oder verschiedene Entwicklungstools innerhalb des Terminals fachkundig zu nutzen.
Native Rechenlogik: Es geht über die bloße Bereitstellung von Antworten hinaus und führt simulierte Operationen direkt in der nativen Rechneranwendung des Systems durch.
Dieses „native Gefühl“ symbolisiert die Entwicklung der KI von einem „Konversationsassistenten“ zu einer „ausführenden Instanz“.
Die perfekte Kombination: GPT-5.4 löst die zentralen Herausforderungen von OpenClaw
Das Open-Source-Projekt OpenClaw, dessen Popularität Anfang 2026 sprunghaft anstieg (mit über 250.000 Stars), hat sein „ideales Modell“ gefunden. Die Kernphilosophie von OpenClaw lautet „KI, die tatsächlich funktioniert“, und GPT-5.4 passt in vier entscheidenden Dimensionen perfekt dazu:
Native Steuerungsanpassung: Durch die Integration mit GPT-5.4 erreicht OpenClaw Desktop-Automatisierung ohne komplexe Workarounds und liefert damit deutliche Leistungssteigerungen.
1 Million Token Kontext: Das extrem lange Kontextfenster löst das Problem der „Vergesslichkeit“, mit dem Agenten bei langwierigen Aufgaben konfrontiert sind, und bietet OpenClaw einen riesigen „Arbeitsbereich“ für die komplexe Dateiverwaltung.
Revolution bei den Tool-Suchkosten: Der On-Demand-Nutzungsmechanismus von GPT-5.4 senkt den Token-Verbrauch um 47 % und reduziert damit die API-Kosten für den 24/7-Betrieb von Agenten drastisch.
Sprung in der Denkfähigkeit: Bei professionellen Arbeitsaufgaben übertrifft GPT-5.4 83 % der menschlichen Experten und ermöglicht es OpenClaw, sich von einem einfachen „Skript-Ausführer“ zu einem hochqualifizierten Spezialisten zu entwickeln, der Finanzanalysen und Investitionsmemos bearbeiten kann.
Brancheneinblick: Die Automatisierungssingularität für hochqualifizierte Berufe ist da
Matt Shumer, CEO von HyperWriteAI, beschrieb die Programmierfähigkeiten von GPT-5.4 als „nahezu makellos“; Brenda, CEO von Mercor AI, ist der Ansicht, dass das Modell kurz davor steht, das Fachwissen führender Beratungsunternehmen, Investmentbanken und Anwaltskanzleien zu übertreffen. Dies signalisiert, dass Rollen, die einst als einzigartig menschlich und unersetzbar galten, nun einer umfassenden Herausforderung durch KI-Agenten ausgesetzt sind.
Britische Ministerien streiten über den Energiebedarf von KI-Rechenzentren
Die britische Regierung steht vor einer großen Herausforderung: Sie will die Nutzung sauberer Energien vorantreiben und gleichzeitig eine weltweit führende Rolle im Bereich der künstlichen Intelligenz
Die chinesische Cyberspace-Behörde schreibt die Kennzeichnung von KI-generierten und fiktionalen Kurzvideos vor
Die chinesische Cyberspace-Behörde hat einen umfassenden Plan zur Vereinheitlichung der Kennzeichnung von Kurzvideoinhalten vorgestellt, der Plattformen zur Verwendung von sechs vorgeschriebenen Kennz
DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung
DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte A











