OpenAIの新しいChatGPTエージェントは、アプリ、メール、ファイルに自律的にアクセスできる
OpenAIは、そのオープンソースAIモデルの遅延にもめげず、着実なペースで新機能を提供し続けている。
本日、同社はChatGPTエージェントを発表した。この強力なアップグレードにより、AIチャットボットは、独自の仮想コンピューティング環境を介して、独立してウェブを閲覧し、詳細な調査を実行し、ユーザーのために新しいファイルをダウンロードまたは作成することができるようになる。
待って、ChatGPTが自分のコンピュータを持つようになったって言った?そして、そのシステムを使ってあなたの個人アカウントにログインし、あなたの代わりに情報をダウンロードしたり送信したりできるのですか?
そうです、OpenAIの説明によれば、少なくとも仮想的な能力ではそうです。同社はこう説明している:
「このモデルは、テキストブラウザまたはビジュアルブラウザを使ってウェブページを開き、インターネットからファイルをダウンロードし、ターミナル経由でコマンドを実行し、ビジュアルインターフェースで結果を確認することができます。高速、高精度、高効率でタスクを完了するための戦略を適応させます。"
ChatGPTエージェントの使用方法
エージェントをアクティブにするには、ユーザーはChatGPTプロンプトフィールド内の'ツール'ボタンをクリックし、ドロップダウンメニューから適切なオプションを選択し、'エージェントモード'を選択するだけです。

一度有効にすると、自然言語であなたの目的を記述し、エージェントはウェブとローカルアプリケーションに渡ってそれを実行します。
ChatGPTエージェントは、GmailやGitHubアカウントなどのサービスに接続し、メールやコードなどの関連データにアクセスして、割り当てられたタスクをサポートすることもできます。また、サードパーティのAPI経由で情報を取得し、関連するアプリケーションと対話することもできます。
サイトにログインが必要な場合は、専用のブラウザビューで安全に認証することができ、受信トレイの確認やフォームの送信など、パーソナライズされた業務を代行することができます。
オペレータの手の届かないオフライン領域へ
新しいChatGPTエージェントは、OpenAIが2025年1月にリリースした「Operator」エージェントから進化しています。Operatorは、OpenAIがホストするプライベートなクラウドベースの "ヘッドレスブラウザ "内で、ChatGPTがウェブを閲覧し、フォームに入力し、注文を行うことを可能にしました。
しかし、Operatorはオンライン上でのやりとりに限定されており、表計算ソフトやプレゼンテーションソフトのようなローカルアプリケーションを操作することはできませんでした。
しかし、ChatGPTエージェントは、ウェブをブラウズし、オンラインフォームと対話し、コードを実行し、データセットを分析し、編集可能なプレゼンテーションやスプレッドシートなどの最終的なアウトプットを作成することができる。
この発表は、マイクロソフトが出資者の一社であるにもかかわらず、OpenAIがChatGPTをマイクロソフトのOffice製品群(Excel、Word、PowerPointなど)に対するより強力な競争相手へと強化する計画であることを技術専門誌『The Information』が報じた直後に行われた。
オペレータとディープリサーチを統合エージェントへ
実際、OpenAIはChatGPTエージェントを、以前の2つのツールの統合と説明している:OperatorとDeep Researchだ。2025年2月に導入されたDeep Researchは、詳細で包括的なレポートをコンパイルするために、テキストのみのブラウザを使用してウェブを検索します。同社はブログで次のように述べている:
「Operatorは、深い分析タスクを実行したり、広範なレポートを作成することができず、Deep Researchは、結果を洗練させたり、ログインの背後にあるコンテンツに到達するためにウェブサイトと対話することができませんでした。我々は、Operator 向けに意図された多くのユーザークエリが、実際には Deep Research 向けであることを確認しました。
オリジナルのOperatorツールは廃止されますが、Deep Researchは引き続きChatGPTインターフェイスのドロップダウンからアクセスできます。
1つのプラットフォーム、複数の機能
ビジュアルブラウザを介してウェブサイトと対話する場合でも、ターミナルでPythonスクリプトを実行する場合でも、エージェントは1つのセッションでツール間をスムーズに移行します。
競合分析やレポート作成から、旅行計画、Eメール要約、アポイントメントスケジュールまで、幅広いタスクをサポートします。
ユーザーはいつでもタスクを中断、リダイレクト、一時停止することができ、エージェントは中断したところから再開します。
可用性とアクセス
本日より、ChatGPTの月額200ドルの "Pro "サブスクライバは、毎月400メッセージの割り当てでChatGPTエージェントにフルアクセスできます。
ChatGPTプラス(月額$20)とチーム(月額$30)のユーザーは、月間40メッセージの制限付きで、数日中にアクセスできるようになります。追加利用はクレジットベースのプランで可能。
VentureBeatが非公開で公開したリリースによると、OpenAIは今後数週間以内にChatGPTのEnterpriseとEducationの顧客にこの機能を提供する予定です。
今のところ、この機能はヨーロッパとスイスでは利用できません。
安全性とユーザーコントロールを最優先に設計
認証されたウェブサイトや接続されたアプリを含め、エージェントがユーザーの代わりにアクションを実行できるようになったため、OpenAIはさまざまな安全対策を実施した。
これには、アクション実行前のユーザー確認プロンプト、センシティブな操作に対する積極的な監視、意図しない動作を減らすための技術的制御などが含まれます。
主な安全対策は以下の通り:
- フォームの送信や電子メールの送信前にユーザーの承認を求めるプロンプト
- ユーザーが非アクティブになると実行を停止するウォッチモード
- 金融取引やプライバシーを侵害するタスクのようなリスクの高いアクションの実行拒否
- エージェントセッション中のメモリ保持なし
高リスクドメインの分類
OpenAIは、その準備フレームワークに従って、ChatGPTエージェントを生物学的および化学的ドメインにおける高能力システムとして分類しています。
現在、悪用の証拠はありませんが、同社は予防措置として最も強力な安全プロトコルを発動しています。
これには、より厳格な拒否トレーニング、バイオセーフティの専門家によるレッドチーム、アップグレードされた検出メカニズムなどが含まれる。
Anthropic社の新しいクロード・オーパス4モデルに関する最近の情報開示は、高度なAIシステムの他の評価と並んで、電子メールのようなツールへのアクセスを許可された場合、これらのモデルが倫理的と考える行動をとることがあるが、ユーザーを危険にさらす可能性があることを示している。例えば、ユーザーの不正行為の疑いについて、政府機関やジャーナリストに電子メールを送るかもしれない。
AIは自らを「内部告発者」とみなすかもしれないが、実際にはユーザーのプライバシーやセキュリティ、機密データを侵害するリスクがある。
実世界のタスクに強いパフォーマンス
ChatGPTエージェントは、理論的に高度なだけではありません。実際の知識作業を反映するように設計された様々なベンチマークにおいて、素晴らしい結果を達成しています。並列ロールアウト方式を用いたHumanity's Last Examでは44.4という新たなトップスコアを樹立し、難易度の高いFrontierMathベンチマークでは27.4%に達しました。

また、SpreadsheetBenchでは45.5%という、ExcelにおけるCopilotの2倍以上のスコアを記録しました。
現在の限界と次のステップ
スライドショー生成など一部の機能はまだベータ版であり、フォーマットオプションが限られていたり、アプリ内プレビューとエクスポートされたファイルの間にわずかな違いが表示されたりする可能性があります。
OpenAIはすでにこのツールの次のバージョンを改良し、デザインと出力品質を強化しています。
ChatGPTエージェントのローンチは、人間とAIのインタラクションの転換を意味します。
推論し、行動し、最終的な成果物を提供する能力により、OpenAIは、ユーザーがAIに単に支援するだけでなく、自律的に仕事を実行することをますます期待するようになると予測しています。エージェントはまだ開発中だが、同社は今回のリリースを、よりインタラクティブでタスク駆動型のAIの未来に向けた下地作りと見ている。
関連記事
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ
関連特集おすすめ
コメント (0)
0/500
OpenAIは、そのオープンソースAIモデルの遅延にもめげず、着実なペースで新機能を提供し続けている。
本日、同社はChatGPTエージェントを発表した。この強力なアップグレードにより、AIチャットボットは、独自の仮想コンピューティング環境を介して、独立してウェブを閲覧し、詳細な調査を実行し、ユーザーのために新しいファイルをダウンロードまたは作成することができるようになる。
待って、ChatGPTが自分のコンピュータを持つようになったって言った?そして、そのシステムを使ってあなたの個人アカウントにログインし、あなたの代わりに情報をダウンロードしたり送信したりできるのですか?
そうです、OpenAIの説明によれば、少なくとも仮想的な能力ではそうです。同社はこう説明している:
「このモデルは、テキストブラウザまたはビジュアルブラウザを使ってウェブページを開き、インターネットからファイルをダウンロードし、ターミナル経由でコマンドを実行し、ビジュアルインターフェースで結果を確認することができます。高速、高精度、高効率でタスクを完了するための戦略を適応させます。"
ChatGPTエージェントの使用方法
エージェントをアクティブにするには、ユーザーはChatGPTプロンプトフィールド内の'ツール'ボタンをクリックし、ドロップダウンメニューから適切なオプションを選択し、'エージェントモード'を選択するだけです。

一度有効にすると、自然言語であなたの目的を記述し、エージェントはウェブとローカルアプリケーションに渡ってそれを実行します。
ChatGPTエージェントは、GmailやGitHubアカウントなどのサービスに接続し、メールやコードなどの関連データにアクセスして、割り当てられたタスクをサポートすることもできます。また、サードパーティのAPI経由で情報を取得し、関連するアプリケーションと対話することもできます。
サイトにログインが必要な場合は、専用のブラウザビューで安全に認証することができ、受信トレイの確認やフォームの送信など、パーソナライズされた業務を代行することができます。
オペレータの手の届かないオフライン領域へ
新しいChatGPTエージェントは、OpenAIが2025年1月にリリースした「Operator」エージェントから進化しています。Operatorは、OpenAIがホストするプライベートなクラウドベースの "ヘッドレスブラウザ "内で、ChatGPTがウェブを閲覧し、フォームに入力し、注文を行うことを可能にしました。
しかし、Operatorはオンライン上でのやりとりに限定されており、表計算ソフトやプレゼンテーションソフトのようなローカルアプリケーションを操作することはできませんでした。
しかし、ChatGPTエージェントは、ウェブをブラウズし、オンラインフォームと対話し、コードを実行し、データセットを分析し、編集可能なプレゼンテーションやスプレッドシートなどの最終的なアウトプットを作成することができる。
この発表は、マイクロソフトが出資者の一社であるにもかかわらず、OpenAIがChatGPTをマイクロソフトのOffice製品群(Excel、Word、PowerPointなど)に対するより強力な競争相手へと強化する計画であることを技術専門誌『The Information』が報じた直後に行われた。
オペレータとディープリサーチを統合エージェントへ
実際、OpenAIはChatGPTエージェントを、以前の2つのツールの統合と説明している:OperatorとDeep Researchだ。2025年2月に導入されたDeep Researchは、詳細で包括的なレポートをコンパイルするために、テキストのみのブラウザを使用してウェブを検索します。同社はブログで次のように述べている:
「Operatorは、深い分析タスクを実行したり、広範なレポートを作成することができず、Deep Researchは、結果を洗練させたり、ログインの背後にあるコンテンツに到達するためにウェブサイトと対話することができませんでした。我々は、Operator 向けに意図された多くのユーザークエリが、実際には Deep Research 向けであることを確認しました。
オリジナルのOperatorツールは廃止されますが、Deep Researchは引き続きChatGPTインターフェイスのドロップダウンからアクセスできます。
1つのプラットフォーム、複数の機能
ビジュアルブラウザを介してウェブサイトと対話する場合でも、ターミナルでPythonスクリプトを実行する場合でも、エージェントは1つのセッションでツール間をスムーズに移行します。
競合分析やレポート作成から、旅行計画、Eメール要約、アポイントメントスケジュールまで、幅広いタスクをサポートします。
ユーザーはいつでもタスクを中断、リダイレクト、一時停止することができ、エージェントは中断したところから再開します。
可用性とアクセス
本日より、ChatGPTの月額200ドルの "Pro "サブスクライバは、毎月400メッセージの割り当てでChatGPTエージェントにフルアクセスできます。
ChatGPTプラス(月額$20)とチーム(月額$30)のユーザーは、月間40メッセージの制限付きで、数日中にアクセスできるようになります。追加利用はクレジットベースのプランで可能。
VentureBeatが非公開で公開したリリースによると、OpenAIは今後数週間以内にChatGPTのEnterpriseとEducationの顧客にこの機能を提供する予定です。
今のところ、この機能はヨーロッパとスイスでは利用できません。
安全性とユーザーコントロールを最優先に設計
認証されたウェブサイトや接続されたアプリを含め、エージェントがユーザーの代わりにアクションを実行できるようになったため、OpenAIはさまざまな安全対策を実施した。
これには、アクション実行前のユーザー確認プロンプト、センシティブな操作に対する積極的な監視、意図しない動作を減らすための技術的制御などが含まれます。
主な安全対策は以下の通り:
- フォームの送信や電子メールの送信前にユーザーの承認を求めるプロンプト
- ユーザーが非アクティブになると実行を停止するウォッチモード
- 金融取引やプライバシーを侵害するタスクのようなリスクの高いアクションの実行拒否
- エージェントセッション中のメモリ保持なし
高リスクドメインの分類
OpenAIは、その準備フレームワークに従って、ChatGPTエージェントを生物学的および化学的ドメインにおける高能力システムとして分類しています。
現在、悪用の証拠はありませんが、同社は予防措置として最も強力な安全プロトコルを発動しています。
これには、より厳格な拒否トレーニング、バイオセーフティの専門家によるレッドチーム、アップグレードされた検出メカニズムなどが含まれる。
Anthropic社の新しいクロード・オーパス4モデルに関する最近の情報開示は、高度なAIシステムの他の評価と並んで、電子メールのようなツールへのアクセスを許可された場合、これらのモデルが倫理的と考える行動をとることがあるが、ユーザーを危険にさらす可能性があることを示している。例えば、ユーザーの不正行為の疑いについて、政府機関やジャーナリストに電子メールを送るかもしれない。
AIは自らを「内部告発者」とみなすかもしれないが、実際にはユーザーのプライバシーやセキュリティ、機密データを侵害するリスクがある。
実世界のタスクに強いパフォーマンス
ChatGPTエージェントは、理論的に高度なだけではありません。実際の知識作業を反映するように設計された様々なベンチマークにおいて、素晴らしい結果を達成しています。並列ロールアウト方式を用いたHumanity's Last Examでは44.4という新たなトップスコアを樹立し、難易度の高いFrontierMathベンチマークでは27.4%に達しました。

また、SpreadsheetBenchでは45.5%という、ExcelにおけるCopilotの2倍以上のスコアを記録しました。
現在の限界と次のステップ
スライドショー生成など一部の機能はまだベータ版であり、フォーマットオプションが限られていたり、アプリ内プレビューとエクスポートされたファイルの間にわずかな違いが表示されたりする可能性があります。
OpenAIはすでにこのツールの次のバージョンを改良し、デザインと出力品質を強化しています。
ChatGPTエージェントのローンチは、人間とAIのインタラクションの転換を意味します。
推論し、行動し、最終的な成果物を提供する能力により、OpenAIは、ユーザーがAIに単に支援するだけでなく、自律的に仕事を実行することをますます期待するようになると予測しています。エージェントはまだ開発中だが、同社は今回のリリースを、よりインタラクティブでタスク駆動型のAIの未来に向けた下地作りと見ている。
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ





家






