Heim
Der neue ChatGPT-Agent von OpenAI kann selbstständig auf Ihre Apps, E-Mails und Dateien zugreifen
Unbeeindruckt von den Verzögerungen bei seinem Open-Source-KI-Modell liefert OpenAI weiterhin neue Funktionen in gleichmäßigem Tempo.
Heute stellte das Unternehmen den ChatGPT-Agenten vor, ein leistungsfähiges Upgrade, das es dem KI-Chatbot ermöglicht, selbstständig im Internet zu surfen, eingehende Recherchen durchzuführen und über seine eigene virtuelle Computerumgebung neue Dateien für Nutzer herunterzuladen oder zu erstellen.
Moment - haben Sie gerade gesagt, dass ChatGPT jetzt einen eigenen Computer hat? Und es kann sich über dieses System bei Ihren persönlichen Konten anmelden und in Ihrem Namen Informationen herunterladen oder versenden?
Ja, das stimmt - zumindest in virtueller Form, wie OpenAI erklärt. Das Unternehmen stellt klar:
"Das Modell kann eine Webseite entweder über den Text- oder den visuellen Browser öffnen, Dateien aus dem Internet herunterladen, Befehle über das Terminal ausführen und die Ergebnisse in der visuellen Schnittstelle überprüfen. Es passt seine Strategie zur Erledigung von Aufgaben mit hoher Geschwindigkeit, Präzision und Effizienz an".
Wie man den ChatGPT-Agenten benutzt
Um den Agenten zu aktivieren, klicken die Benutzer einfach auf die Schaltfläche "Tools" im ChatGPT-Eingabefeld, wählen die entsprechende Option aus dem Dropdown-Menü und wählen den "Agentenmodus".

Nach der Aktivierung beschreiben Sie Ihr Ziel in natürlicher Sprache, und der Agent führt es in Web- und lokalen Anwendungen aus - und verbindet Logik mit Aktionen, die früher auf manuelle, menschliche Bedienung beschränkt waren.
Der ChatGPT-Agent kann sich sogar mit Diensten wie Ihrem Gmail- oder GitHub-Konto verbinden und auf relevante Daten wie E-Mails oder Code zugreifen, um die von Ihnen zugewiesenen Aufgaben zu unterstützen. Er kann auch Informationen über APIs von Drittanbietern abrufen und mit zugehörigen Anwendungen interagieren.
Wenn eine Website eine Anmeldung erfordert, können Sie sich über eine spezielle Browseransicht sicher authentifizieren, so dass der Agent personalisierte Aufgaben wie die Überprüfung Ihres Posteingangs oder das Einreichen von Formularen in Ihrem Namen übernehmen kann.
Über die Reichweite des Operators hinaus - in den Offline-Bereich
Der neue ChatGPT-Agent entwickelt sich aus dem "Operator"-Agenten, den OpenAI im Januar 2025 veröffentlicht hat. Operator ermöglichte es ChatGPT, innerhalb eines privaten, cloudbasierten "Headless Browsers", der von OpenAI gehostet wurde, im Internet zu surfen, Formulare auszufüllen und Bestellungen aufzugeben.
Operator war jedoch auf Online-Interaktionen beschränkt - er konnte keine lokalen Anwendungen wie Tabellenkalkulationen oder Präsentationssoftware bedienen.
Der ChatGPT-Agent hingegen kann das Web durchsuchen, mit Online-Formularen interagieren, Code ausführen, Datensätze analysieren und Endprodukte wie bearbeitbare Präsentationen und Tabellenkalkulationen produzieren - und zwar strikt auf der Grundlage von Benutzerbefehlen.
Diese Ankündigung kommt kurz nach einem Bericht der Tech-Publikation The Information, der besagt, dass OpenAI plant, ChatGPT zu einem stärkeren Konkurrenten für Microsofts Office-Suite - Produkte wie Excel, Word und PowerPoint - auszubauen, obwohl Microsoft einer der Investoren ist.
Kombination von Operator und Deep Research in einem einheitlichen Agenten
OpenAI beschreibt den ChatGPT-Agenten als die Integration von zwei früheren Tools: Operator und Deep Research. Deep Research, das im Februar 2025 eingeführt wurde, durchforstet das Web mit einem reinen Textbrowser, um detaillierte, umfassende Berichte zu erstellen. Wie das Unternehmen in einem Blog-Beitrag schreibt:
"Operator konnte keine tiefgreifenden analytischen Aufgaben durchführen oder umfangreiche Berichte erstellen, während Deep Research nicht mit Websites interagieren konnte, um Ergebnisse zu verfeinern oder Inhalte hinter Logins zu erreichen. Wir haben festgestellt, dass viele Nutzeranfragen, die für Operator gedacht waren, eigentlich besser für Deep Research geeignet waren - also haben wir die Stärken beider Tools zusammengeführt."
Das ursprüngliche Operator-Tool wird eingestellt, Deep Research bleibt jedoch über das Dropdown-Menü der ChatGPT-Schnittstelle zugänglich.
Eine Plattform, mehrere Möglichkeiten
Ob es um die Interaktion mit einer Website über den visuellen Browser oder die Ausführung von Python-Skripten im Terminal geht, der Agent wechselt in einer einzigen Sitzung reibungslos zwischen den Tools.
Er unterstützt eine breite Palette von Aufgaben - von der Analyse von Wettbewerbern und der Erstellung von Berichten bis hin zur Reiseplanung, E-Mail-Zusammenfassung und Terminplanung.
Benutzer können Aufgaben jederzeit unterbrechen, umleiten oder anhalten, und der Agent setzt genau dort fort, wo er aufgehört hat.
Verfügbarkeit und Zugang
Ab heute erhalten ChatGPTs "Pro"-Abonnenten für $200 pro Monat vollen Zugriff auf den ChatGPT-Agenten mit einem monatlichen Kontingent von 400 Nachrichten.
Benutzer von ChatGPT Plus ($20/Monat) und Team ($30/Monat) werden in den nächsten Tagen Zugang erhalten, mit einem Limit von 40 Nachrichten pro Monat. Eine zusätzliche Nutzung ist über kreditbasierte Pläne möglich.
Laut einer Mitteilung, die VentureBeat unter Embargo zur Verfügung gestellt wurde, wird OpenAI die Funktion in den kommenden Wochen für ChatGPT Enterprise und Education Kunden einführen.
Im Moment ist die Funktion in Europa und der Schweiz nicht verfügbar - zum Leidwesen der Bewohner dieser Regionen.
Sicherheit und Benutzerkontrolle als oberste Priorität
Da der Agent nun Aktionen im Namen von Nutzern durchführen kann - auch auf authentifizierten Websites oder in verbundenen Apps - hat OpenAI eine Reihe von Sicherheitsmaßnahmen implementiert.
Dazu gehören die Aufforderung zur Bestätigung durch den Benutzer vor der Ausführung von Aktionen, die aktive Überwachung sensibler Vorgänge und technische Kontrollen zur Reduzierung unbeabsichtigten Verhaltens.
Zu den wichtigsten Sicherheitsfunktionen gehören:
- Aufforderung zur Genehmigung durch den Benutzer vor dem Absenden von Formularen oder E-Mails
- Überwachungsmodus, der die Ausführung stoppt, wenn der Benutzer inaktiv wird
- Verweigerung der Ausführung von risikoreichen Aktionen wie Finanztransaktionen oder in die Privatsphäre eingreifenden Aufgaben
- Keine Speichererhaltung während Agentensitzungen
Klassifizierung von Domänen mit hohem Risiko
In Übereinstimmung mit seinem Preparedness Framework stuft OpenAI den ChatGPT-Agenten als ein System mit hoher Kapazität im biologischen und chemischen Bereich ein.
Obwohl es derzeit keine Hinweise auf Missbrauch gibt, aktiviert das Unternehmen vorsorglich seine strengsten Sicherheitsprotokolle.
Dazu gehören eine strengere Ablehnungsschulung, Red Teaming durch Biosicherheitsspezialisten und verbesserte Detektionsmechanismen.
Es sei daran erinnert, dass die jüngsten Enthüllungen von Anthropic über sein neues Modell Claude Opus 4 - zusammen mit anderen Bewertungen fortgeschrittener KI-Systeme - gezeigt haben, dass diese Modelle, wenn sie Zugang zu Werkzeugen wie E-Mail erhalten, manchmal Handlungen vornehmen können, die sie für ethisch vertretbar halten, die aber den Nutzer gefährden. So könnten sie beispielsweise E-Mails an Regierungsstellen oder Journalisten schicken, wenn sie ein Fehlverhalten des Benutzers vermuten.
Die KI mag sich selbst als "Whistleblower" sehen, aber in Wirklichkeit riskiert sie die Verletzung der Privatsphäre, der Sicherheit und vertraulicher Daten des Benutzers - selbst wenn sie nicht existierende oder zweifelhafte Verstöße meldet.
Starke Leistung bei realen Aufgaben
Der ChatGPT-Agent ist nicht nur theoretisch fortschrittlich - er hat bei verschiedenen Benchmarks, die reale Wissensarbeit widerspiegeln sollen, beeindruckende Ergebnisse erzielt. Bei Humanity's Last Exam erzielte er mit parallelen Rollout-Methoden einen neuen Spitzenwert von 44,4 und erreichte 27,4 % beim anspruchsvollen FrontierMath-Benchmark.

Bei SpreadsheetBench erreichte der Agent 45,5 % - mehr als das Doppelte der Leistung von Copilot in Excel.
Aktuelle Einschränkungen und nächste Schritte
Einige Funktionen, wie z. B. die Erstellung von Diashows, befinden sich noch in der Beta-Phase und bieten möglicherweise nur eingeschränkte Formatierungsoptionen oder zeigen leichte Unterschiede zwischen der In-App-Vorschau und den exportierten Dateien.
OpenAI arbeitet bereits an der nächsten Version dieses Tools, um Design und Ausgabequalität zu verbessern.
Die Einführung des ChatGPT-Agenten markiert einen Übergang in der Interaktion zwischen Mensch und KI - von der einfachen Beantwortung von Fragen zur Ausführung kompletter Arbeitsabläufe.
OpenAI geht davon aus, dass die Benutzer von der KI zunehmend erwarten, dass sie nicht nur assistiert, sondern auch selbständig arbeitet, da sie in der Lage ist, Schlussfolgerungen zu ziehen, Maßnahmen zu ergreifen und Endprodukte zu liefern. Obwohl sich der Agent noch in der Entwicklung befindet, sieht das Unternehmen diese Version als Grundlage für eine interaktivere, aufgabenorientierte KI-Zukunft.
Verwandter Artikel
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Unbeeindruckt von den Verzögerungen bei seinem Open-Source-KI-Modell liefert OpenAI weiterhin neue Funktionen in gleichmäßigem Tempo.
Heute stellte das Unternehmen den ChatGPT-Agenten vor, ein leistungsfähiges Upgrade, das es dem KI-Chatbot ermöglicht, selbstständig im Internet zu surfen, eingehende Recherchen durchzuführen und über seine eigene virtuelle Computerumgebung neue Dateien für Nutzer herunterzuladen oder zu erstellen.
Moment - haben Sie gerade gesagt, dass ChatGPT jetzt einen eigenen Computer hat? Und es kann sich über dieses System bei Ihren persönlichen Konten anmelden und in Ihrem Namen Informationen herunterladen oder versenden?
Ja, das stimmt - zumindest in virtueller Form, wie OpenAI erklärt. Das Unternehmen stellt klar:
"Das Modell kann eine Webseite entweder über den Text- oder den visuellen Browser öffnen, Dateien aus dem Internet herunterladen, Befehle über das Terminal ausführen und die Ergebnisse in der visuellen Schnittstelle überprüfen. Es passt seine Strategie zur Erledigung von Aufgaben mit hoher Geschwindigkeit, Präzision und Effizienz an".
Wie man den ChatGPT-Agenten benutzt
Um den Agenten zu aktivieren, klicken die Benutzer einfach auf die Schaltfläche "Tools" im ChatGPT-Eingabefeld, wählen die entsprechende Option aus dem Dropdown-Menü und wählen den "Agentenmodus".

Nach der Aktivierung beschreiben Sie Ihr Ziel in natürlicher Sprache, und der Agent führt es in Web- und lokalen Anwendungen aus - und verbindet Logik mit Aktionen, die früher auf manuelle, menschliche Bedienung beschränkt waren.
Der ChatGPT-Agent kann sich sogar mit Diensten wie Ihrem Gmail- oder GitHub-Konto verbinden und auf relevante Daten wie E-Mails oder Code zugreifen, um die von Ihnen zugewiesenen Aufgaben zu unterstützen. Er kann auch Informationen über APIs von Drittanbietern abrufen und mit zugehörigen Anwendungen interagieren.
Wenn eine Website eine Anmeldung erfordert, können Sie sich über eine spezielle Browseransicht sicher authentifizieren, so dass der Agent personalisierte Aufgaben wie die Überprüfung Ihres Posteingangs oder das Einreichen von Formularen in Ihrem Namen übernehmen kann.
Über die Reichweite des Operators hinaus - in den Offline-Bereich
Der neue ChatGPT-Agent entwickelt sich aus dem "Operator"-Agenten, den OpenAI im Januar 2025 veröffentlicht hat. Operator ermöglichte es ChatGPT, innerhalb eines privaten, cloudbasierten "Headless Browsers", der von OpenAI gehostet wurde, im Internet zu surfen, Formulare auszufüllen und Bestellungen aufzugeben.
Operator war jedoch auf Online-Interaktionen beschränkt - er konnte keine lokalen Anwendungen wie Tabellenkalkulationen oder Präsentationssoftware bedienen.
Der ChatGPT-Agent hingegen kann das Web durchsuchen, mit Online-Formularen interagieren, Code ausführen, Datensätze analysieren und Endprodukte wie bearbeitbare Präsentationen und Tabellenkalkulationen produzieren - und zwar strikt auf der Grundlage von Benutzerbefehlen.
Diese Ankündigung kommt kurz nach einem Bericht der Tech-Publikation The Information, der besagt, dass OpenAI plant, ChatGPT zu einem stärkeren Konkurrenten für Microsofts Office-Suite - Produkte wie Excel, Word und PowerPoint - auszubauen, obwohl Microsoft einer der Investoren ist.
Kombination von Operator und Deep Research in einem einheitlichen Agenten
OpenAI beschreibt den ChatGPT-Agenten als die Integration von zwei früheren Tools: Operator und Deep Research. Deep Research, das im Februar 2025 eingeführt wurde, durchforstet das Web mit einem reinen Textbrowser, um detaillierte, umfassende Berichte zu erstellen. Wie das Unternehmen in einem Blog-Beitrag schreibt:
"Operator konnte keine tiefgreifenden analytischen Aufgaben durchführen oder umfangreiche Berichte erstellen, während Deep Research nicht mit Websites interagieren konnte, um Ergebnisse zu verfeinern oder Inhalte hinter Logins zu erreichen. Wir haben festgestellt, dass viele Nutzeranfragen, die für Operator gedacht waren, eigentlich besser für Deep Research geeignet waren - also haben wir die Stärken beider Tools zusammengeführt."
Das ursprüngliche Operator-Tool wird eingestellt, Deep Research bleibt jedoch über das Dropdown-Menü der ChatGPT-Schnittstelle zugänglich.
Eine Plattform, mehrere Möglichkeiten
Ob es um die Interaktion mit einer Website über den visuellen Browser oder die Ausführung von Python-Skripten im Terminal geht, der Agent wechselt in einer einzigen Sitzung reibungslos zwischen den Tools.
Er unterstützt eine breite Palette von Aufgaben - von der Analyse von Wettbewerbern und der Erstellung von Berichten bis hin zur Reiseplanung, E-Mail-Zusammenfassung und Terminplanung.
Benutzer können Aufgaben jederzeit unterbrechen, umleiten oder anhalten, und der Agent setzt genau dort fort, wo er aufgehört hat.
Verfügbarkeit und Zugang
Ab heute erhalten ChatGPTs "Pro"-Abonnenten für $200 pro Monat vollen Zugriff auf den ChatGPT-Agenten mit einem monatlichen Kontingent von 400 Nachrichten.
Benutzer von ChatGPT Plus ($20/Monat) und Team ($30/Monat) werden in den nächsten Tagen Zugang erhalten, mit einem Limit von 40 Nachrichten pro Monat. Eine zusätzliche Nutzung ist über kreditbasierte Pläne möglich.
Laut einer Mitteilung, die VentureBeat unter Embargo zur Verfügung gestellt wurde, wird OpenAI die Funktion in den kommenden Wochen für ChatGPT Enterprise und Education Kunden einführen.
Im Moment ist die Funktion in Europa und der Schweiz nicht verfügbar - zum Leidwesen der Bewohner dieser Regionen.
Sicherheit und Benutzerkontrolle als oberste Priorität
Da der Agent nun Aktionen im Namen von Nutzern durchführen kann - auch auf authentifizierten Websites oder in verbundenen Apps - hat OpenAI eine Reihe von Sicherheitsmaßnahmen implementiert.
Dazu gehören die Aufforderung zur Bestätigung durch den Benutzer vor der Ausführung von Aktionen, die aktive Überwachung sensibler Vorgänge und technische Kontrollen zur Reduzierung unbeabsichtigten Verhaltens.
Zu den wichtigsten Sicherheitsfunktionen gehören:
- Aufforderung zur Genehmigung durch den Benutzer vor dem Absenden von Formularen oder E-Mails
- Überwachungsmodus, der die Ausführung stoppt, wenn der Benutzer inaktiv wird
- Verweigerung der Ausführung von risikoreichen Aktionen wie Finanztransaktionen oder in die Privatsphäre eingreifenden Aufgaben
- Keine Speichererhaltung während Agentensitzungen
Klassifizierung von Domänen mit hohem Risiko
In Übereinstimmung mit seinem Preparedness Framework stuft OpenAI den ChatGPT-Agenten als ein System mit hoher Kapazität im biologischen und chemischen Bereich ein.
Obwohl es derzeit keine Hinweise auf Missbrauch gibt, aktiviert das Unternehmen vorsorglich seine strengsten Sicherheitsprotokolle.
Dazu gehören eine strengere Ablehnungsschulung, Red Teaming durch Biosicherheitsspezialisten und verbesserte Detektionsmechanismen.
Es sei daran erinnert, dass die jüngsten Enthüllungen von Anthropic über sein neues Modell Claude Opus 4 - zusammen mit anderen Bewertungen fortgeschrittener KI-Systeme - gezeigt haben, dass diese Modelle, wenn sie Zugang zu Werkzeugen wie E-Mail erhalten, manchmal Handlungen vornehmen können, die sie für ethisch vertretbar halten, die aber den Nutzer gefährden. So könnten sie beispielsweise E-Mails an Regierungsstellen oder Journalisten schicken, wenn sie ein Fehlverhalten des Benutzers vermuten.
Die KI mag sich selbst als "Whistleblower" sehen, aber in Wirklichkeit riskiert sie die Verletzung der Privatsphäre, der Sicherheit und vertraulicher Daten des Benutzers - selbst wenn sie nicht existierende oder zweifelhafte Verstöße meldet.
Starke Leistung bei realen Aufgaben
Der ChatGPT-Agent ist nicht nur theoretisch fortschrittlich - er hat bei verschiedenen Benchmarks, die reale Wissensarbeit widerspiegeln sollen, beeindruckende Ergebnisse erzielt. Bei Humanity's Last Exam erzielte er mit parallelen Rollout-Methoden einen neuen Spitzenwert von 44,4 und erreichte 27,4 % beim anspruchsvollen FrontierMath-Benchmark.

Bei SpreadsheetBench erreichte der Agent 45,5 % - mehr als das Doppelte der Leistung von Copilot in Excel.
Aktuelle Einschränkungen und nächste Schritte
Einige Funktionen, wie z. B. die Erstellung von Diashows, befinden sich noch in der Beta-Phase und bieten möglicherweise nur eingeschränkte Formatierungsoptionen oder zeigen leichte Unterschiede zwischen der In-App-Vorschau und den exportierten Dateien.
OpenAI arbeitet bereits an der nächsten Version dieses Tools, um Design und Ausgabequalität zu verbessern.
Die Einführung des ChatGPT-Agenten markiert einen Übergang in der Interaktion zwischen Mensch und KI - von der einfachen Beantwortung von Fragen zur Ausführung kompletter Arbeitsabläufe.
OpenAI geht davon aus, dass die Benutzer von der KI zunehmend erwarten, dass sie nicht nur assistiert, sondern auch selbständig arbeitet, da sie in der Lage ist, Schlussfolgerungen zu ziehen, Maßnahmen zu ergreifen und Endprodukte zu liefern. Obwohl sich der Agent noch in der Entwicklung befindet, sieht das Unternehmen diese Version als Grundlage für eine interaktivere, aufgabenorientierte KI-Zukunft.
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um











