OpenAIがChatGPT Proをo3にアップグレード。
今週は、マイクロソフト、グーグル、Anthropicを含むハイテク大手から重要なAIの開発が目撃された。OpenAIは、コードネーム "io "と呼ばれる野心的なハードウェア構想のために、注目されたジョニー・アイブのデザイン会社を65億ドルで買収したことにとどまらず、独自の画期的なアップデートで発表の慌ただしさを締めくくった。
同社は、ChatGPT内のOperator自律ウェブ・ナビゲーション・システムを大幅に強化し、従来のGPT-4oフレームワークから先進のo3推論モデルに移行した。このグローバルな展開は、2025年5月23日から利用可能で、現在、月額200ドルのChatGPT Pro加入者のためのベータフェーズで動作しています。
このアップデートは「リサーチ・プレビュー」と銘打たれているが、これは現在も改良が続けられていることを示すもので、競争圧力が激化している中でのアップデートである。GoogleのプレミアムAIスイートは、通常250ドル前後(現在、第1四半期は125ドルに割引中)で、Gemini、Imagen、Veoモデルへのアクセスを提供しており、OpenAIの提供はより競争力のある位置にあるように見えます。
OpenAIのOperatorについて
2025年1月にローンチされたOperatorは、OpenAIの半自律型エージェント(CUAs)への先駆的なベンチャーを象徴しています。この技術は、ChatGPTの能力を会話インターフェースから具体的なウェブベースの操作の実行へと拡張する。
このシステムは、ナビゲーション、データ入力、トランザクション処理などのブラウジングタスクを自律的に処理します。セキュリティのため、Operatorは、ローカルブラウザにアクセスするのではなく、専用のクラウドベースの仮想ブラウザ(operator.chatgpt.com)を通じて機能し、リアルタイムのユーザー監視や機密プラットフォームへのアクセス制限を含む強固なセーフガードを備えています。
企業アプリケーションは、出張調整や政府サービスのナビゲーションなど、Operatorの多用途性を実証しており、業界横断的な可能性を浮き彫りにしています。
o3モデルの強化
アップグレードにより、3つの重要な側面で測定可能な改善がもたらされました:

- OSWorldベンチマークでタスク完了率が13%向上(42.9対38.1)
- WebArenaのパフォーマンスが31%向上(48.1から62.9へ)
- GAIAベンチマークの達成率が5倍に急増(62.2対12.3)
ユーザー・エクスペリエンス評価では、o3の構造化された出力が強く好まれていることが示され、前バージョンのあまり整理されていない出力と比較して、78%が位置分析や品質メトリクスを含むレストランの予約に関する詳細な表形式のプレゼンテーションを好んでいる。

セキュリティ・フレームワーク
強化されたモデルでは、厳格な保護対策が維持されています:
- センシティブ・アクションの確認率94%(金融取引の場合は100)
- プロンプト・インジェクションの脆弱性が3%減少(20%対23)
- リスクの高いプラットフォームへのアクセス制限を維持
OpenAIのシステム文書によると、このモデルは生物学的/化学的アプリケーションのクリティカルリスク閾値を下回っており、コーディング環境への直接アクセスがないことが確認されています。

エンタープライズアプリケーション
各業界の技術リーダーは、アップグレードされたOperatorを次のような用途に活用できます:
- MLエンジニアモデル検証プロセスの合理化
- データスペシャリスト自動化されたWebベースのデータ検証
- セキュリティチーム監査のための安全な行動シミュレーション
- ITオーケストレーション:信頼性の高いブラウザ・タスク自動化
このソリューションは、強化された機能とビルトインのリスク軽減を組み合わせ、最新のデジタル運用のためのバランスの取れたツールを提供します。現在、Responses APIはGPT-4oアーキテクチャで動作しており、移行スケジュールは未定です。
関連記事
Manus、ウェブスクレイピングのための100以上のエージェントを備えたAIツール「Wide Research」を発表
中国のAIイノベーターであるManusは、コンシューマーとプロフェッショナルの両方に対応する先駆的なマルチエージェント・オーケストレーション・プラットフォームで注目を集めたが、従来のAI研究アプローチに挑戦する同社の技術の画期的なアプリケーションを発表した。AIを活用した研究の再考OpenAI、Google、xAIのような競合他社は、詳細なレポートを作成するために何時間も調査を行うことができる特別
非営利団体、AIエージェントを活用してチャリティ募金活動を強化
大手テック企業がAIの "エージェント "をビジネスの生産性向上剤として推進する一方で、ある非営利団体はAIが社会的利益に貢献する可能性を実証している。オープン・フィランソロピーが支援する慈善研究グループ、セージ・フューチャーは最近、AIモデルが慈善活動の資金調達にどのように協力できるかを示す革新的な実験を行った。この非営利団体は、OpenAIのGPT-4oとo1、AnthropicのClau
トップAI研究所は、人類はAIシステムを理解する力を失いつつあると警告する
OpenAI、Google DeepMind、Anthropic、Metaの研究者は、前例のない団結を示し、競争上の相違を脇に置いて、責任あるAI開発について集団で警告を発した。これらの通常ライバル関係にある組織から40人以上の一流の科学者が、AIの意思決定プロセスの透明性を確保するための窓が急速に狭まっていることを強調する画期的な研究論文を共同執筆した。この共同研究は、現代のAIシステムにおける
コメント (0)
0/200
今週は、マイクロソフト、グーグル、Anthropicを含むハイテク大手から重要なAIの開発が目撃された。OpenAIは、コードネーム "io "と呼ばれる野心的なハードウェア構想のために、注目されたジョニー・アイブのデザイン会社を65億ドルで買収したことにとどまらず、独自の画期的なアップデートで発表の慌ただしさを締めくくった。
同社は、ChatGPT内のOperator自律ウェブ・ナビゲーション・システムを大幅に強化し、従来のGPT-4oフレームワークから先進のo3推論モデルに移行した。このグローバルな展開は、2025年5月23日から利用可能で、現在、月額200ドルのChatGPT Pro加入者のためのベータフェーズで動作しています。
このアップデートは「リサーチ・プレビュー」と銘打たれているが、これは現在も改良が続けられていることを示すもので、競争圧力が激化している中でのアップデートである。GoogleのプレミアムAIスイートは、通常250ドル前後(現在、第1四半期は125ドルに割引中)で、Gemini、Imagen、Veoモデルへのアクセスを提供しており、OpenAIの提供はより競争力のある位置にあるように見えます。
OpenAIのOperatorについて
2025年1月にローンチされたOperatorは、OpenAIの半自律型エージェント(CUAs)への先駆的なベンチャーを象徴しています。この技術は、ChatGPTの能力を会話インターフェースから具体的なウェブベースの操作の実行へと拡張する。
このシステムは、ナビゲーション、データ入力、トランザクション処理などのブラウジングタスクを自律的に処理します。セキュリティのため、Operatorは、ローカルブラウザにアクセスするのではなく、専用のクラウドベースの仮想ブラウザ(operator.chatgpt.com)を通じて機能し、リアルタイムのユーザー監視や機密プラットフォームへのアクセス制限を含む強固なセーフガードを備えています。
企業アプリケーションは、出張調整や政府サービスのナビゲーションなど、Operatorの多用途性を実証しており、業界横断的な可能性を浮き彫りにしています。
o3モデルの強化
アップグレードにより、3つの重要な側面で測定可能な改善がもたらされました:

- OSWorldベンチマークでタスク完了率が13%向上(42.9対38.1)
- WebArenaのパフォーマンスが31%向上(48.1から62.9へ)
- GAIAベンチマークの達成率が5倍に急増(62.2対12.3)
ユーザー・エクスペリエンス評価では、o3の構造化された出力が強く好まれていることが示され、前バージョンのあまり整理されていない出力と比較して、78%が位置分析や品質メトリクスを含むレストランの予約に関する詳細な表形式のプレゼンテーションを好んでいる。

セキュリティ・フレームワーク
強化されたモデルでは、厳格な保護対策が維持されています:
- センシティブ・アクションの確認率94%(金融取引の場合は100)
- プロンプト・インジェクションの脆弱性が3%減少(20%対23)
- リスクの高いプラットフォームへのアクセス制限を維持
OpenAIのシステム文書によると、このモデルは生物学的/化学的アプリケーションのクリティカルリスク閾値を下回っており、コーディング環境への直接アクセスがないことが確認されています。

エンタープライズアプリケーション
各業界の技術リーダーは、アップグレードされたOperatorを次のような用途に活用できます:
- MLエンジニアモデル検証プロセスの合理化
- データスペシャリスト自動化されたWebベースのデータ検証
- セキュリティチーム監査のための安全な行動シミュレーション
- ITオーケストレーション:信頼性の高いブラウザ・タスク自動化
このソリューションは、強化された機能とビルトインのリスク軽減を組み合わせ、最新のデジタル運用のためのバランスの取れたツールを提供します。現在、Responses APIはGPT-4oアーキテクチャで動作しており、移行スケジュールは未定です。












