OpenAI、100万コンテキストのウィンドウを備えた「GPT-5.4 Pro」および「Thinking Models」を発表

家

ニュース

2026年5月28日

JustinWilliams

要素

OpenAIは、最新の基盤モデル「GPT-5.4」のリリースを正式に発表しました。同社はこれを、これまでで最も高性能かつ効率的なプロフェッショナル向けモデルと位置付けています。AIbaseによると、このシリーズは差別化されたリリース戦略を採用しており、標準版に加え、複雑な論理処理に特化した推論モデル「GPT-5.4Thinking」と、高性能タスク向けに構築された「GPT-5.4Pro」が導入されました。

ChatGPT

技術面では、GPT-5.4のAPI版が大幅なアップグレードを実現し、最大100万トークンというコンテキストウィンドウを備えています。これはOpenAIがこれまでに提供した中で最大規模です。また、トークン効率も著しく向上しており、より少ないリソースで同様の問題を解決できるようになりました。

安全性と精度の面では、新モデルはGPT-5.2と比較して文ごとのエラー率を33%低減し、応答全体の誤りを18%削減しました。推論モデルにおける潜在的な「思考連鎖による欺瞞（chain-of-thought deception）」のリスクを軽減するため、OpenAIは新たなセキュリティ評価システムを導入しました。テストの結果、GPT-5.4Thinkingは透明性を高め、その推論プロセスを隠蔽したり捏造したりすることを困難にしていることが示されています。

ベンチマーク評価において、GPT-5.4は優れた結果を残し、OSWorld-VerifiedやWebArena Verifiedといったコンピュータ使用量テストで新記録を樹立するとともに、GDPval知識タスクでも83%という驚異的なスコアを達成しました。

MercorのCEOであるBrendan Foody氏は、このモデルが金融や法律などの専門分野におけるAPEX-Agentsベンチマークでもトップクラスであり、特に財務モデルの生成、法的分析、その他の長文成果物の作成において卓越した能力を発揮していると指摘した。新しい「ツール検索」システムにより、外部ツールを呼び出す際の効率が向上し、大規模なツール統合シナリオにおけるトークンオーバーヘッドが劇的に削減される。

Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した人工知能（AI）が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ

DeepSeek Code、まもなくリリースへ AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek

マスク氏の「Grok」：1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか？イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX（

関連特集おすすめ

仕事

おすすめのAI採用ツール：履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう！

10 ツール

xix.ai

生産性

AIパーソナルウェルネス＆集中力コーチ：バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス＆集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール

xix.ai

チャットボット

高評価のAI恋愛チャットボット：一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール

xix.ai

教育と学習

最高のAIデータサイエンスメンター：SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール

xix.ai

チャットボット

最高のAIを使ったナンパ＆会話トレーニング：社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール

xix.ai

コード

自動化ユニットテストに最適なAIツール：ワンクリックでJest、PyTest、JUnitのテストケースを生成する

2026年に登場した、自動化ユニットテスト用の最高評価を受けたAIツールを発見してください。当社が厳選したこれらのツールは、Jest、PyTest、JUnitのテストケースを瞬時に生成するための強力で革新的なソリューションです。XIX.AIでは、無料オプションと有料オプションを実際のテストデータと共に比較し、毎週更新されるランキングもご覧いただけます。今すぐAIの力を活用して、開発生産性を向上させましょう。

10 ツール

xix.ai