OpenAI、GPT-5.4 ProおよびThinkingエディションを発表

木曜日、OpenAIは「プロフェッショナルな業務向けに開発された、当社で最も高性能かつ効率的な最先端モデル」と称される新しい基盤モデル「GPT-5.4」を発表した。標準版に加え、GPT-5.4には推論に特化したバージョン(GPT-5.4 Thinking)と、パフォーマンスを最適化したエディション(GPT-5.4 Pro)が用意されている。
このモデルのAPI版は、最大100万トークンのコンテキストウィンドウに対応しており、これはOpenAIがこれまでに提供した中で最大のコンテキスト容量となります。
OpenAIはまた、トークン効率の向上を強調し、GPT-5.4は前世代モデルに比べて大幅に少ないトークン数で同一の問題を解決できると述べています。
この新モデルはベンチマーク結果が大幅に改善され、コンピュータ利用ベンチマークであるOSWorld-VerifiedおよびWebArena Verifiedで過去最高のスコアを記録しました。また、知識労働タスクを対象としたOpenAIのGDPvalテストでも83%というスコアで新記録を樹立しました。
MercorのCEOであるBrendan Foody氏の声明によると、GPT-5.4は、法律および金融分野の専門スキルを評価するMercorのAPEX-Agentsベンチマークにおいてトップの成績を収めている。
「[GPT-5.4]は、スライド資料、財務モデル、法的分析といった長期的な成果物の作成に優れています」とフーディ氏は述べ、「競合する最先端モデルよりも高速かつ低コストで動作しながら、トップクラスのパフォーマンスを発揮します」と付け加えました。
GPT-5.4は、OpenAIが取り組んできた「幻覚」や事実誤認の低減をさらに推進するものです。同社によると、この新モデルはGPT-5.2と比較して、個々の主張における誤りの発生確率が33%低下し、回答全体における誤りの発生確率も18%低下しています。
今回のリリースに伴い、OpenAIはGPT-5.4 APIにおけるツール呼び出しの処理方法を再設計し、「Tool Search」という新システムを導入した。従来、システムプロンプトでは利用可能なすべてのツールを事前に定義する必要があり、ツールライブラリが拡大するにつれて、このプロセスにはかなりのトークンが消費されていた。新システムでは、モデルがオンデマンドでツールの定義を取得できるため、多数のツールが存在する環境において、リクエストの処理が高速化され、コスト効率も向上する。
またOpenAIは、モデルの「思考の連鎖(Chain-of-Thought)」を評価するための新たな安全性評価機能を追加しました。これは、多段階タスクの遂行中にモデルの推論プロセスを明らかにする「進行中の解説」のことです。AI安全性の研究者たちは、推論モデルが自身の思考の連鎖を誤って表現する可能性があることを長らく懸念してきましたが、テストの結果、特定の条件下ではこれが実際に起こり得ることが確認されました。
OpenAIの新たな評価によると、GPT-5.4の「Thinking」バージョンでは欺瞞の可能性が低いことが示されており、「このモデルには推論を隠蔽する能力が欠如しており、CoTモニタリングが依然として有効な安全対策ツールであることを示唆している」としています。
関連記事
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ
関連特集おすすめ
コメント (0)
0/500

木曜日、OpenAIは「プロフェッショナルな業務向けに開発された、当社で最も高性能かつ効率的な最先端モデル」と称される新しい基盤モデル「GPT-5.4」を発表した。標準版に加え、GPT-5.4には推論に特化したバージョン(GPT-5.4 Thinking)と、パフォーマンスを最適化したエディション(GPT-5.4 Pro)が用意されている。
このモデルのAPI版は、最大100万トークンのコンテキストウィンドウに対応しており、これはOpenAIがこれまでに提供した中で最大のコンテキスト容量となります。
OpenAIはまた、トークン効率の向上を強調し、GPT-5.4は前世代モデルに比べて大幅に少ないトークン数で同一の問題を解決できると述べています。
この新モデルはベンチマーク結果が大幅に改善され、コンピュータ利用ベンチマークであるOSWorld-VerifiedおよびWebArena Verifiedで過去最高のスコアを記録しました。また、知識労働タスクを対象としたOpenAIのGDPvalテストでも83%というスコアで新記録を樹立しました。
MercorのCEOであるBrendan Foody氏の声明によると、GPT-5.4は、法律および金融分野の専門スキルを評価するMercorのAPEX-Agentsベンチマークにおいてトップの成績を収めている。
「[GPT-5.4]は、スライド資料、財務モデル、法的分析といった長期的な成果物の作成に優れています」とフーディ氏は述べ、「競合する最先端モデルよりも高速かつ低コストで動作しながら、トップクラスのパフォーマンスを発揮します」と付け加えました。
GPT-5.4は、OpenAIが取り組んできた「幻覚」や事実誤認の低減をさらに推進するものです。同社によると、この新モデルはGPT-5.2と比較して、個々の主張における誤りの発生確率が33%低下し、回答全体における誤りの発生確率も18%低下しています。
今回のリリースに伴い、OpenAIはGPT-5.4 APIにおけるツール呼び出しの処理方法を再設計し、「Tool Search」という新システムを導入した。従来、システムプロンプトでは利用可能なすべてのツールを事前に定義する必要があり、ツールライブラリが拡大するにつれて、このプロセスにはかなりのトークンが消費されていた。新システムでは、モデルがオンデマンドでツールの定義を取得できるため、多数のツールが存在する環境において、リクエストの処理が高速化され、コスト効率も向上する。
またOpenAIは、モデルの「思考の連鎖(Chain-of-Thought)」を評価するための新たな安全性評価機能を追加しました。これは、多段階タスクの遂行中にモデルの推論プロセスを明らかにする「進行中の解説」のことです。AI安全性の研究者たちは、推論モデルが自身の思考の連鎖を誤って表現する可能性があることを長らく懸念してきましたが、テストの結果、特定の条件下ではこれが実際に起こり得ることが確認されました。
OpenAIの新たな評価によると、GPT-5.4の「Thinking」バージョンでは欺瞞の可能性が低いことが示されており、「このモデルには推論を隠蔽する能力が欠如しており、CoTモニタリングが依然として有効な安全対策ツールであることを示唆している」としています。
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ





家






