OpenAI versucht, eine universelle KI zu entwickeln, die jede Aufgabe bewältigen kann
Kurz nachdem Hunter Lightman 2022 Forscher bei OpenAI wurde, erlebte er den explosiven Start von ChatGPT - eines der am schnellsten wachsenden Produkte der Tech-Geschichte. In der Zwischenzeit konzentrierte sich Lightmans ruhige Arbeit auf das Training der OpenAI-Modelle für die Teilnahme an Mathematikwettbewerben der Highschool-Elite.
Heute spielt sein Team - MathGen - eine zentrale Rolle bei OpenAIs Bestreben, branchenführende KI-Schlussfolgermodelle zu entwickeln. Diese Systeme bilden das Rückgrat der "KI-Agenten", die in der Lage sind, menschenähnliche Computeraufgaben zu lösen.
"Schon früh wollten wir das mathematische Denken verbessern - ein Bereich, in dem sich die Modelle schwer taten", so Lightman gegenüber TechCrunch über die Ursprünge von MathGen.
Trotz der Fortschritte bleiben die Modelle von OpenAI unvollkommen. Selbst die neuesten Systeme halluzinieren Fakten und scheitern an komplexen Aufgaben.
Dennoch hat sich das mathematische Denken dramatisch verbessert. Ein Modell hat kürzlich Gold bei der Internationalen Mathematik-Olympiade gewonnen - einem Wettbewerb für die besten Mathematikstudenten der Welt. OpenAI ist davon überzeugt, dass diese Denkfähigkeiten auch auf andere Bereiche ausgedehnt werden können, um die seit langem geplanten universell einsetzbaren KI-Agenten zu unterstützen.
Während der Erfolg von ChatGPT ein glücklicher Zufall war, ist die Entwicklung von OpenAIs Agenten das Ergebnis jahrelanger, gezielter Bemühungen. "Bald wird man Computer einfach bitten, Aufgaben zu erledigen", prophezeite CEO Sam Altman auf der OpenAI-Entwicklerkonferenz 2023. "Wir nennen sie 'Agenten' - ihr Potenzial ist atemberaubend."
Tech-Titanen für die Disrupt 2025 bestätigt
Netflix, ElevenLabs, Wayve und Sequoia Capital führen ein hochkarätiges Teilnehmerfeld für das 20-jährige Jubiläum der TechCrunch Disrupt an. Gewinnen Sie verwertbare Erkenntnisse von den führenden Köpfen der Technologiebranche - sichern Sie sich noch heute Tickets und sparen Sie bis zu 675 US-Dollar, bevor die Preise steigen.
Tech-Titanen für Disrupt 2025 bestätigt
Netflix, ElevenLabs, Wayve und Sequoia Capital führen ein Staraufgebot für das 20-jährige Jubiläum von TechCrunch Disrupt an. Sichern Sie sich noch heute Tickets und sparen Sie bis zu 675 US-Dollar, bevor die Preise steigen.
San Francisco | 27. bis 29. Oktober 2025 | JETZT ANMELDEN

OpenAI-CEO Sam Altman spricht auf dem DevDay 2023 (Foto: Justin Sullivan/Getty Images) Obwohl Altmans Vision noch nicht bewiesen ist, verblüffte OpenAI die Tech-Welt im Jahr 2024 mit seinem "o1"-Gedankenmodell. Innerhalb weniger Monate wurden die 21 Forscher des Unternehmens zu den begehrtesten Talenten im Silicon Valley - Meta warb fünf von ihnen ab und bot ihnen neunstellige Gehaltspakete.
Die Wiederbelebung des Reinforcement Learning
Die Durchbrüche von OpenAI im Bereich der Agenten hängen mit dem Reinforcement Learning (RL) zusammen, bei dem KI-Modelle durch simulierte Versuche und Fehler lernen. Obwohl RL auf den AlphaGo-Meilenstein von 2016 zurückgeht, verbrachte OpenAI Jahre damit, es für Agenten zur Computernutzung anzupassen.
Frühe GPT-Modelle zeichneten sich durch ihre Textkompetenz aus, scheiterten aber bei grundlegenden mathematischen Aufgaben. Das "Strawberry"-Projekt von 2023 kombinierte RL mit Testzeitberechnungen - die Modelle überprüften Schritte, bevor sie antworteten - und leistete Pionierarbeit beim "chain-of-thought"-Schlussfolgern.
"Plötzlich konnten die Modelle zurückgehen und sich selbst korrigieren - es fühlte sich menschlich an", erinnert sich der Forscher El Kishky.
Erweiterung der Argumentationsfähigkeiten
OpenAI hat zwei Skalierungsvektoren identifiziert: Berechnungen nach dem Training und die Zuweisung von Antwortzeiten. "Wir bauen nicht nur für heute, sondern auch für die Skalierbarkeit", so Lightman.
Im Jahr 2023 wurde ein spezielles "Agents"-Team gegründet, das den Grundstein für o1 legte. Im Gegensatz zu Konkurrenten, die durch Produktanforderungen eingeschränkt sind, hat OpenAI der KI-Forschung Priorität eingeräumt - ein strategischer Vorteil.
Definition von AI Reasoning
Forscher debattieren darüber, ob KI wirklich "Gründe" hat. Einige betonen die Recheneffizienz, andere konzentrieren sich auf menschenähnliche Ergebnisse. Es gibt Kritiker, aber Fähigkeiten sind am wichtigsten - so wie Flugzeuge anders fliegen als Vögel.
Die Herausforderung der subjektiven Aufgaben
Derzeitige Agenten können zwar gut kodieren, haben aber Schwierigkeiten mit Feinheiten wie dem Online-Einkauf. "Es ist im Grunde eine Datenherausforderung", erklärt Lightman. Neue Techniken ermöglichen das Training an weniger überprüfbaren Aufgaben.
Die IMO-Lösung von OpenAI nutzte die Multi-Agenten-Exploration, die jetzt von Google und xAI nachgeahmt wird. Der Forscher Noam Brown sieht weiterhin rasche Fortschritte: "Eine Verlangsamung ist nicht in Sicht."
Mit dem bevorstehenden GPT-5 will OpenAI seinen Vorsprung gegenüber Google, Anthropic und Meta halten. Das ultimative Ziel? Ein Agent, der intuitiv jede digitale Aufgabe ausführt und damit das heutige ChatGPT vollständig übertrifft.
Verwandter Artikel
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Vercel-CEO Guillermo Rauch deutet einen Börsengang an, da KI-Agenten den Umsatz ankurbeln
Im Gegensatz zu vielen Start-ups, die vor ChatGPT gegründet wurden und nun Schwierigkeiten haben, im Zeitalter der KI Fuß zu fassen, floriert Vercel – eine seit zehn Jahren bestehende Plattform für En
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Kurz nachdem Hunter Lightman 2022 Forscher bei OpenAI wurde, erlebte er den explosiven Start von ChatGPT - eines der am schnellsten wachsenden Produkte der Tech-Geschichte. In der Zwischenzeit konzentrierte sich Lightmans ruhige Arbeit auf das Training der OpenAI-Modelle für die Teilnahme an Mathematikwettbewerben der Highschool-Elite.
Heute spielt sein Team - MathGen - eine zentrale Rolle bei OpenAIs Bestreben, branchenführende KI-Schlussfolgermodelle zu entwickeln. Diese Systeme bilden das Rückgrat der "KI-Agenten", die in der Lage sind, menschenähnliche Computeraufgaben zu lösen.
"Schon früh wollten wir das mathematische Denken verbessern - ein Bereich, in dem sich die Modelle schwer taten", so Lightman gegenüber TechCrunch über die Ursprünge von MathGen.
Trotz der Fortschritte bleiben die Modelle von OpenAI unvollkommen. Selbst die neuesten Systeme halluzinieren Fakten und scheitern an komplexen Aufgaben.
Dennoch hat sich das mathematische Denken dramatisch verbessert. Ein Modell hat kürzlich Gold bei der Internationalen Mathematik-Olympiade gewonnen - einem Wettbewerb für die besten Mathematikstudenten der Welt. OpenAI ist davon überzeugt, dass diese Denkfähigkeiten auch auf andere Bereiche ausgedehnt werden können, um die seit langem geplanten universell einsetzbaren KI-Agenten zu unterstützen.
Während der Erfolg von ChatGPT ein glücklicher Zufall war, ist die Entwicklung von OpenAIs Agenten das Ergebnis jahrelanger, gezielter Bemühungen. "Bald wird man Computer einfach bitten, Aufgaben zu erledigen", prophezeite CEO Sam Altman auf der OpenAI-Entwicklerkonferenz 2023. "Wir nennen sie 'Agenten' - ihr Potenzial ist atemberaubend."
Tech-Titanen für die Disrupt 2025 bestätigt
Netflix, ElevenLabs, Wayve und Sequoia Capital führen ein hochkarätiges Teilnehmerfeld für das 20-jährige Jubiläum der TechCrunch Disrupt an. Gewinnen Sie verwertbare Erkenntnisse von den führenden Köpfen der Technologiebranche - sichern Sie sich noch heute Tickets und sparen Sie bis zu 675 US-Dollar, bevor die Preise steigen.
Tech-Titanen für Disrupt 2025 bestätigt
Netflix, ElevenLabs, Wayve und Sequoia Capital führen ein Staraufgebot für das 20-jährige Jubiläum von TechCrunch Disrupt an. Sichern Sie sich noch heute Tickets und sparen Sie bis zu 675 US-Dollar, bevor die Preise steigen.
San Francisco | 27. bis 29. Oktober 2025 | JETZT ANMELDEN

Obwohl Altmans Vision noch nicht bewiesen ist, verblüffte OpenAI die Tech-Welt im Jahr 2024 mit seinem "o1"-Gedankenmodell. Innerhalb weniger Monate wurden die 21 Forscher des Unternehmens zu den begehrtesten Talenten im Silicon Valley - Meta warb fünf von ihnen ab und bot ihnen neunstellige Gehaltspakete.
Die Wiederbelebung des Reinforcement Learning
Die Durchbrüche von OpenAI im Bereich der Agenten hängen mit dem Reinforcement Learning (RL) zusammen, bei dem KI-Modelle durch simulierte Versuche und Fehler lernen. Obwohl RL auf den AlphaGo-Meilenstein von 2016 zurückgeht, verbrachte OpenAI Jahre damit, es für Agenten zur Computernutzung anzupassen.
Frühe GPT-Modelle zeichneten sich durch ihre Textkompetenz aus, scheiterten aber bei grundlegenden mathematischen Aufgaben. Das "Strawberry"-Projekt von 2023 kombinierte RL mit Testzeitberechnungen - die Modelle überprüften Schritte, bevor sie antworteten - und leistete Pionierarbeit beim "chain-of-thought"-Schlussfolgern.
"Plötzlich konnten die Modelle zurückgehen und sich selbst korrigieren - es fühlte sich menschlich an", erinnert sich der Forscher El Kishky.
Erweiterung der Argumentationsfähigkeiten
OpenAI hat zwei Skalierungsvektoren identifiziert: Berechnungen nach dem Training und die Zuweisung von Antwortzeiten. "Wir bauen nicht nur für heute, sondern auch für die Skalierbarkeit", so Lightman.
Im Jahr 2023 wurde ein spezielles "Agents"-Team gegründet, das den Grundstein für o1 legte. Im Gegensatz zu Konkurrenten, die durch Produktanforderungen eingeschränkt sind, hat OpenAI der KI-Forschung Priorität eingeräumt - ein strategischer Vorteil.
Definition von AI Reasoning
Forscher debattieren darüber, ob KI wirklich "Gründe" hat. Einige betonen die Recheneffizienz, andere konzentrieren sich auf menschenähnliche Ergebnisse. Es gibt Kritiker, aber Fähigkeiten sind am wichtigsten - so wie Flugzeuge anders fliegen als Vögel.
Die Herausforderung der subjektiven Aufgaben
Derzeitige Agenten können zwar gut kodieren, haben aber Schwierigkeiten mit Feinheiten wie dem Online-Einkauf. "Es ist im Grunde eine Datenherausforderung", erklärt Lightman. Neue Techniken ermöglichen das Training an weniger überprüfbaren Aufgaben.
Die IMO-Lösung von OpenAI nutzte die Multi-Agenten-Exploration, die jetzt von Google und xAI nachgeahmt wird. Der Forscher Noam Brown sieht weiterhin rasche Fortschritte: "Eine Verlangsamung ist nicht in Sicht."
Mit dem bevorstehenden GPT-5 will OpenAI seinen Vorsprung gegenüber Google, Anthropic und Meta halten. Das ultimative Ziel? Ein Agent, der intuitiv jede digitale Aufgabe ausführt und damit das heutige ChatGPT vollständig übertrifft.
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Vercel-CEO Guillermo Rauch deutet einen Börsengang an, da KI-Agenten den Umsatz ankurbeln
Im Gegensatz zu vielen Start-ups, die vor ChatGPT gegründet wurden und nun Schwierigkeiten haben, im Zeitalter der KI Fuß zu fassen, floriert Vercel – eine seit zehn Jahren bestehende Plattform für En
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um





Heim






