OpenAI GPT-5 erreicht Mensch-Niveau-Niveau in verschiedenen Berufsfeldern
Am Donnerstag stellte OpenAI GDPval vor, einen bahnbrechenden Benchmark, der bewertet, wie seine KI-Modelle im Vergleich zu menschlichen Fachkräften in verschiedenen Branchen abschneiden. Diese Bewertung markiert einen ersten Schritt hin zur Einschätzung, ob OpenAIs Systeme Menschen in wirtschaftlich bedeutsamer Arbeit übertreffen können – ein Kernziel des Unternehmens bei der Verfolgung von künstlicher allgemeiner Intelligenz (AGI).
Laut OpenAI demonstrieren sowohl GPT-5 als auch Anthropics Claude Opus 4.1 eine Ausgabequalität, die der von Branchenspezialisten nahekommt.
Auch wenn diese Erkenntnisse nicht auf einen unmittelbaren Ersatz menschlicher Arbeitskräfte hindeuten, stellen sie doch eine entscheidende Fortschrittsmessung dar. OpenAI räumt ein, dass GDPval derzeit nur einen Bruchteil realer beruflicher Aufgaben bewertet, was einige CEO-Prognosen widerlegt, die eine weitverbreitete KI-Störung innerhalb weniger Jahre vorhersagen.
GDPval bewertet die Leistung über neun Schlüsselsektoren des US-BIP hinweg – darunter Gesundheitswesen, Finanzen, Fertigung und Regierung – und testet 44 Berufe von Softwareentwicklung bis Journalismus.
Für GDPval-v0 verglichen Fachleute KI-generierte Berichte mit der Arbeit menschlicher Kollegen. Eine Beispielaufgabe beinhaltete Investmentbanker, die die Wettbewerbslandschaften für Letzte-Meile-Lieferdienste analysierten und mit KI-Versionen verglichen. OpenAI berechnete die "Gewinnrate" jedes Modells im Vergleich zu menschlichen Ergebnissen über alle Berufe hinweg.
Das verbesserte GPT-5-high-Modell erreichte oder übertraf die Expertenleistung in 40,6 % der Fälle, während Claude Opus 4.1 eine Gleichwertigkeitsrate von 49 % erzielte – OpenAI deutet an, dass diese höhere Punktzahl eher Claudes überlegene visuelle Präsentation widerspiegeln könnte als einen inhaltlichen Vorteil.
Connect with 10,000+ tech and VC innovators at Disrupt 2025
Featuring Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital, and Elad Gil among 250+ industry leaders hosting 200+ growth-focused sessions. Celebrate TechCrunch's 20th anniversary while gaining competitive insights from technology's foremost thinkers. Early registration before September 26 saves up to $668.
Connect with 10,000+ tech and VC innovators at Disrupt 2025
Featuring Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital, and Elad Gil among 250+ industry leaders hosting 200+ growth-focused sessions. Celebrate TechCrunch's 20th anniversary while gaining competitive insights from technology's foremost thinkers. Early registration before September 26 saves up to $668.

Image Credits: OpenAI OpenAI erkennt die eingeschränkte Fokussierung von GDPval-v0 an – derzeit wird nur die Erstellung von Forschungsberichten getestet – und plant zukünftige Iterationen, die breitere Arbeitsplatzinteraktionen bewerten.
Der Chefökonom Dr. Aaron Chatterji gegenüber TechCrunch, dass diese Ergebnisse darauf hindeuten, dass Fachleute zunehmend Routineaufgaben an KI delegieren können, was sie für wertschöpfendere Arbeit freispielt.
Tejal Patwardhan, der die Bewertungen leitet, verweist auf rasante Fortschritte: Vor fünfzehn Monaten erzielte GPT-4o gerade einmal 13,7 %, während GPT-5 diese Leistung nahezu verdreifacht – eine Entwicklung, die voraussichtlich anhält.
Während Benchmarks wie AIME 2025 und GPQA Diamond die KI-Bewertung dominieren, nähern sich viele Modelle bei diesen akademischen Tests der Sättigung. GDPval repräsentiert die wachsende Betonung praktischer, branchenrelevanter Bewertungsstandards – obwohl OpenAI umfassendere Tests benötigt, um abschließend menschenähnliche Leistung über professionelle Domänen hinweg zu demonstrieren.
Verwandter Artikel
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Am Donnerstag stellte OpenAI GDPval vor, einen bahnbrechenden Benchmark, der bewertet, wie seine KI-Modelle im Vergleich zu menschlichen Fachkräften in verschiedenen Branchen abschneiden. Diese Bewertung markiert einen ersten Schritt hin zur Einschätzung, ob OpenAIs Systeme Menschen in wirtschaftlich bedeutsamer Arbeit übertreffen können – ein Kernziel des Unternehmens bei der Verfolgung von künstlicher allgemeiner Intelligenz (AGI).
Laut OpenAI demonstrieren sowohl GPT-5 als auch Anthropics Claude Opus 4.1 eine Ausgabequalität, die der von Branchenspezialisten nahekommt.
Auch wenn diese Erkenntnisse nicht auf einen unmittelbaren Ersatz menschlicher Arbeitskräfte hindeuten, stellen sie doch eine entscheidende Fortschrittsmessung dar. OpenAI räumt ein, dass GDPval derzeit nur einen Bruchteil realer beruflicher Aufgaben bewertet, was einige CEO-Prognosen widerlegt, die eine weitverbreitete KI-Störung innerhalb weniger Jahre vorhersagen.
GDPval bewertet die Leistung über neun Schlüsselsektoren des US-BIP hinweg – darunter Gesundheitswesen, Finanzen, Fertigung und Regierung – und testet 44 Berufe von Softwareentwicklung bis Journalismus.
Für GDPval-v0 verglichen Fachleute KI-generierte Berichte mit der Arbeit menschlicher Kollegen. Eine Beispielaufgabe beinhaltete Investmentbanker, die die Wettbewerbslandschaften für Letzte-Meile-Lieferdienste analysierten und mit KI-Versionen verglichen. OpenAI berechnete die "Gewinnrate" jedes Modells im Vergleich zu menschlichen Ergebnissen über alle Berufe hinweg.
Das verbesserte GPT-5-high-Modell erreichte oder übertraf die Expertenleistung in 40,6 % der Fälle, während Claude Opus 4.1 eine Gleichwertigkeitsrate von 49 % erzielte – OpenAI deutet an, dass diese höhere Punktzahl eher Claudes überlegene visuelle Präsentation widerspiegeln könnte als einen inhaltlichen Vorteil.
Connect with 10,000+ tech and VC innovators at Disrupt 2025
Featuring Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital, and Elad Gil among 250+ industry leaders hosting 200+ growth-focused sessions. Celebrate TechCrunch's 20th anniversary while gaining competitive insights from technology's foremost thinkers. Early registration before September 26 saves up to $668.
Connect with 10,000+ tech and VC innovators at Disrupt 2025
Featuring Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital, and Elad Gil among 250+ industry leaders hosting 200+ growth-focused sessions. Celebrate TechCrunch's 20th anniversary while gaining competitive insights from technology's foremost thinkers. Early registration before September 26 saves up to $668.

OpenAI erkennt die eingeschränkte Fokussierung von GDPval-v0 an – derzeit wird nur die Erstellung von Forschungsberichten getestet – und plant zukünftige Iterationen, die breitere Arbeitsplatzinteraktionen bewerten.
Der Chefökonom Dr. Aaron Chatterji gegenüber TechCrunch, dass diese Ergebnisse darauf hindeuten, dass Fachleute zunehmend Routineaufgaben an KI delegieren können, was sie für wertschöpfendere Arbeit freispielt.
Tejal Patwardhan, der die Bewertungen leitet, verweist auf rasante Fortschritte: Vor fünfzehn Monaten erzielte GPT-4o gerade einmal 13,7 %, während GPT-5 diese Leistung nahezu verdreifacht – eine Entwicklung, die voraussichtlich anhält.
Während Benchmarks wie AIME 2025 und GPQA Diamond die KI-Bewertung dominieren, nähern sich viele Modelle bei diesen akademischen Tests der Sättigung. GDPval repräsentiert die wachsende Betonung praktischer, branchenrelevanter Bewertungsstandards – obwohl OpenAI umfassendere Tests benötigt, um abschließend menschenähnliche Leistung über professionelle Domänen hinweg zu demonstrieren.
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um





Heim






