GPT-5.4がネイティブのハッキング機能を公開、OSWorldがAIの画期的な進歩で人間を上回る

家

ニュース

2026年4月2日

BenWalker

GPT-5.4がネイティブのハッキング機能を公開、OSWorldがAIの画期的な進歩で人間を上回る

競合他社を凌駕：GPT-5.4がネイティブコンピュータ制御の時代を切り拓く

2026年3月、OpenAIはGPT-5.4をサプライズリリースし、AIエージェントの競争環境を根本から変革しました。OpenAI初のネイティブコンピュータ操作機能を備えた汎用モデルとして、GPT-5.4はもはや外部アダプターに依存しません。その代わりに、画面キャプチャを直接解釈し、マウスクリックやキーボード入力をシミュレートし、まるで人間のユーザーのようにデスクトップソフトウェアを操作します。

実世界のデスクトップ操作能力を測定するOSWorld-Verifiedベンチマークにおいて、GPT-5.4の成功率は75.0%へと急上昇した。参考までに、人間の平均ベースラインは72.4%であり、前世代のGPT-5.2のスコアはわずか47.3%でした。これは、歴史上初めて、AIのコンピュータ操作能力が平均的な人間のユーザーを上回ったことを示しています。

実環境テスト：プロフェッショナル向けの「デジタルダブル」が現実のものに

現在、Web版およびCodexプラットフォームを通じて利用可能な実環境テストにより、GPT-5.4がほぼすべてのコンピュータ操作を処理できることが実証されています：

アプリケーションの高度な習得：カレンダーアプリを起動し、リマインダー設定の権限を自律的に要求できるほか、「Xiaoyuzhou」のようなサードパーティ製アプリを正確に特定・起動し、特定のコンテンツを再生することも可能です。

システムレベルのアクセス：ユーザーは、コンピュータの壁紙を直接変更するよう指示したり、ターミナル内で様々な開発ツールを熟練して利用したりすることができます。

ネイティブ計算ロジック：単なる回答の提供にとどまらず、システムのネイティブ電卓アプリ内で直接シミュレーション演算を実行します。

この「ネイティブな感覚」は、AIが「会話型アシスタント」から「実行主体」へと進化したことを示しています。

完璧な組み合わせ：GPT-5.4がOpenClawの核心的な課題を解決

2026年初頭に人気が急上昇し（スター数が25万を超えた）、オープンソースプロジェクト「OpenClaw」は、その「理想的なモデル」を見出しました。OpenClawの核心的な哲学は「実際に機能するAI」であり、GPT-5.4は以下の4つの重要な側面において完全に一致しています：

ネイティブな制御整合性：GPT-5.4と統合されたOpenClawは、複雑な回避策を必要とせずにデスクトップ自動化を実現し、明らかなパフォーマンス向上をもたらします。

100万トークンのコンテキスト：超長コンテキストウィンドウにより、長時間タスク中にエージェントが直面する「記憶喪失」の問題が解決され、OpenClawに複雑なファイル処理のための広大な「ワークスペース」が提供されます。

ツール検索コストの革命：GPT-5.4のオンデマンド使用メカニズムにより、トークン消費量を47%削減し、エージェントを24時間365日稼働させる際のAPIコストを劇的に低減します。

推論能力の飛躍：専門的な業務において、GPT-5.4は人間の専門家の83%を上回るパフォーマンスを発揮し、OpenClawを単なる「スクリプト実行ツール」から、財務分析や投資メモの処理が可能な上級スペシャリストへと進化させます。

業界インサイト：高度なスキルを要する職務における自動化の特異点が到来

HyperWriteAIのCEOマット・シューマー氏は、GPT-5.4のプログラミング能力を「ほぼ完璧」と評しました。Mercor AIのCEOブレンダ氏は、このモデルがトップクラスのコンサルティング会社、投資銀行、法律事務所に見られる専門知識を凌駕しようとしていると確信しています。これは、かつて人間特有で代替不可能なものと見なされていた役割が、今やAIエージェントからの全面的な挑戦に直面していることを示しています。

Claudeがマルウェア入りnpmパッケージの作成に悪用される：670件以上が侵害され、オープンソースが脅威にさらされる最近のサイバーセキュリティインシデントにより、大規模言語モデル（LLM）が悪意のあるソフトウェア開発のために悪用されている実態が明らかになった。セキュリティ研究者のSibi Moosa氏は、「mousie-5212-super-formatter」という別名を使用する攻撃者が、Anthropic社のAI「Claude」を利用して有害なコードを生成し、npmパッケージエコシステムを汚染していることを

インドが技術開発を加速させる中、リライアンスが1,100億ドルのAI投資計画を発表インドの複合企業リライアンスの会長で億万長者のムケシュ・アンバニ氏は木曜日、今後7年間にわたりインド全土にAIコンピューティングインフラを構築するための10兆ルピー（約1,100億ドル）規模の計画を発表しました。木曜日にニューデリーで開催された「インドAIインパクト・サミット」で講演したアンバニ氏は、この投資により、ギガワット規模のデータセンター、全国規模のエッジコンピューティング・ネットワーク、

Zhiyuan WITA、初のコンプライアンス報告書の提出により「裸の」ロボットとの対話を終了具現化知能分野において、重要な節目を迎えました。上海サイバー空間管理局の最新の発表によると、智源（Zhiyuan）が開発したWITA大規模モデルは届出手続きを無事に完了し、国内で初めて法規制に準拠して展開された具現化知能対話用大規模モデルとなりました。この成果は、単にライセンスを取得しただけにとどまらない。WITAの核心的な目的は、ヒューマノイドロボットが真の意味で会話し、感情を認識し、独自の個性

関連特集おすすめ

アニメーション制作

東華向けAIアニメジェネレーター：ウェブ小説のキャラクターやコミックのアバターを作成する

2026年に最も優れたAIアニメーション生成ツールを探そう。当社が厳選したリストには、見事なウェブ小説のキャラクターやコミックのアバターを作成するための強力なツールが揃っています。無料オプションと有料オプションを実際のテストで比較し、自分に最適な創造的なパートナーを見つけて、今日すぐにXIX.AIであなたの物語を形にしてみましょう。

10 ツール

xix.ai

漫画制作

漫画向けトップAI自動着色ツール：色むらのないフラットカラーを適用

XIX.AIで、2026年版のおすすめマンガ用AI自動着色ツールをご覧ください。厳選されたリストには、一貫性の誤差ゼロでフラットカラーを適用し、生産性を飛躍的に向上させる、高評価の画期的なソリューションが揃っています。無料版と有料版の比較、実地テスト、毎週更新されるランキングを参考に、あなたにぴったりのツールを見つけてください。今すぐAIの力を活用しましょう。

10 ツール

xix.ai

書き込み

AI小説プロファイル作成のトップクリエイター：一貫性のあるキャラクターの動機と致命的な欠点を生成する

深みのあるキャラクターを創り出す、2026年最高のAIフィクションプロファイル作成ツールを発見しましょう。XIX.AIが厳選したこのリストには、一貫した動機や致命的な欠点を生成する、高評価で業界を変革するツールが揃っています。実際のテスト結果をもとに、無料版と有料版を比較してください。今すぐストーリーテリングの可能性を解き放ちましょう。

10 ツール

xix.ai

仕事

AIを活用した価格最適化ソフトのトップ選定：競合他社の動向を追跡し、店舗価格を自動調整

XIX.AIで、2026年最高のAI価格最適化ソフトウェアを見つけましょう。厳選されたリストには、競合他社の動向を追跡し、利益を最大化するために店舗の価格を自動調整する、高評価の画期的なツールが揃っています。実際のテスト結果をもとに、無料版と有料版を比較してください。今すぐ価格設定における優位性を手に入れましょう。

10 ツール

xix.ai

コード

最高のAIコードレビューツール：クリーンコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリング

XIX.AIで、2026年最高のAIコードレビューツールを発見しましょう。厳選されたこのリストには、クリーンなコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリングするための、高評価で画期的なツールが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版を比較してください。今すぐAIの力を活用しましょう。

10 ツール

xix.ai

テキスト読み上げ

ディスレクシアに最適なAI音声合成アプリ：生徒の学習と読解力の向上をサポート

ディスレクシア支援のために厳選された、2026年最新の最高評価AI TTSアプリをご紹介します。専門家によるランキングでは、無料ツールと有料ツールを比較し、読解効率と学習効果を高める強力な機能を詳しく解説しています。生徒の可能性を引き出す、ぜひ試すべき画期的なソリューションをご覧ください。XIX.AIでその第一歩を踏み出しましょう。

10 ツール

xix.ai