オプション
ニュース
OpenaiはGPT-4.5「Orion」を起動します:これまでの最大のAIモデル

OpenaiはGPT-4.5「Orion」を起動します:これまでの最大のAIモデル

2025年4月10日
98

更新された午後2時40分PT:GPT-4.5の発売から数時間後、OpenaiはAIモデルのホワイトペーパーを静かに編集しました。彼らは、「GPT-4.5はフロンティアAIモデルではない」というラインを削除しました。ここで元のホワイトペーパーにアクセスできます。以下は元の記事です。

木曜日に、Openaiは、コード名Orionで行われる非常に予想されるAIモデルであるGPT-4.5でカーテンを引き戻しました。 Openaiのこの最新の巨人は、前例のない量のコンピューティングパワーとデータで訓練されており、前任者とは一線を画しています。

その印象的な規模にもかかわらず、Openaiのホワイトペーパーは当初、GPT-4.5はフロンティアモデルとは見なさなかったと述べました。しかし、その声明はその後削除され、モデルの真の可能性について疑問に思うようになりました。

木曜日から、Openaiのプレミアム200か月間のサービスであるChatGpt Proの購読者は、研究プレビューの一環としてGPT-4.5の最初の味を獲得します。 OpenAIの有料API層の開発者は、今日GPT-4.5の使用を開始できますが、OpenAIの広報担当者によると、ChatGpt PlusとChatGptチームのサブスクリプションを使用している人は来週のいつかアクセスを期待するはずです。

テクノロジーの世界はオリオンについて話題になっており、従来のAIトレーニング方法がまだ水を保持しているかどうかのテストと見なしています。 GPT-4.5は、前任者と同じプレイブックを追跡し、トレーニング前と呼ばれる監視されていない学習段階でのコンピューティングパワーとデータの大幅な増加に依存しています。

過去には、スケールアップにより、数学、執筆、コーディングなどのさまざまなドメインに大きなパフォーマンスが飛躍しました。 Openaiは、GPT-4.5のサイズが「より深い世界の知識」と「より高い感情的知性」を与えたと主張しています。しかし、スケールアップからのリターンが減少する可能性があるというヒントがあります。いくつかのAIベンチマークでは、GPT-4.5は、Deepseek、人類、さらにはOpenai自体などの企業からの新しい推論モデルに遅れをとっています。

さらに、GPT-4.5の実行には多額の値札が付いています。 Openaiは、それが非常に高価であると認めているため、長期的にAPIを通じて利用可能にするかどうかを検討しています。開発者は、入力トークンごとに75ドル、100万の出力トークンごとに150ドルを支払います。これは、より手頃な価格のGPT-4Oとはまったく対照的で、100万ドルあたり2.50ドル、100万ドルあたり10ドルかかります。

「私たちは、GPT -4.5を研究プレビューとして共有して、その強みと制限をよりよく理解するためです」とOpenaiはブログ投稿で共有しています。 「私たちはまだその可能性を最大限に発揮しており、人々が予想外の方法でそれをどのように使用するかを楽しみにしています。」

混合パフォーマンス

Openaiは、GPT-4.5がAPIとChatGPTの大部分を駆動する主力モデルであるGPT-4Oを置き換えることを意図していないことは明らかです。 GPT-4.5はファイルと画像のアップロードを処理し、ChatGPTのCanvasツールを使用できますが、現在、ChatGPTのリアルな双方向の音声モードなどの機能をサポートしていません。

明るい面では、GPT-4.5はGPT-4OとOpenAIのSimpleQAベンチマーク上の他の多くのモデルよりも優れています。また、Openaiは、GPT-4.5がほとんどのモデルよりも頻繁に幻覚の頻度が低いと主張しており、理論的には情報の製造の可能性が低くなるはずです。

興味深いことに、Openaiは、SimpleQAの結果に、そのトップパフォーマンスの推論モデル、ディープリサーチの1つを含めていませんでした。 Openaiの広報担当者はTechCrunchに、このベンチマークでDeep Researchのパフォーマンスを公に報告しておらず、関連する比較とは考えていないと語った。ただし、他のベンチマークに関するOpenaiの深い研究と同様に実行されるPerplexityの深い研究モデルは、実際にこの事実上の精度のテストでGPT-4.5を上回っています。

SimpleQA Benchmarks.Imageクレジット:Openai
SWEベンチ検証ベンチマークからのコーディング問題のサブセットでは、GPT-4.5はGPT-4OおよびO3-MINIと同様に機能しますが、Openaiの深い研究と人類のClaude 3.7 Sonnetには及ばない。別のコーディングテストでは、完全なソフトウェア機能を開発するAIモデルの能力を測定するOpenAIのSWEランサーベンチマークでは、GPT-4.5はGPT-4OとO3-MINIの両方を上回りますが、深い研究を上回りません。

OpenaiのSWEベンチ検証benchmark.imageクレジット:Openai
OpenaiのSWE-LAN​​CER DIAMOND BENCHMARK.IMAGE CREDITS:Openai
GPT-4.5は、AIAMEやGPQAなどの挑戦的なアカデミックベンチマークでO3-Mini、DeepseekのR1、Claude 3.7 Sonnetなどの主要なAI推論モデルのパフォーマンスとはまったく一致していませんが、同じテストでの主要な非合理的なモデルに対して独自に保持しています。これは、GPT-4.5が数学および科学関連のタスクに優れていることを示唆しています。

Openaiはまた、GPT-4.5が、人間の意図を理解するなど、ベンチマークがうまくキャプチャしない領域の他のモデルよりも定性的に優れていることを誇っています。彼らは、GPT-4.5がより暖かく、より自然なトーンで反応し、執筆やデザインなどの創造的なタスクでうまく機能すると主張しています。

非公式のテストで、OpenaiはGPT-4.5と他の2つのモデルであるGPT-4OとO3-MINIに、SVG形式でユニコーンを作成するように依頼しました。 GPT-4.5のみがユニコーンに似たものを生産することができました。

左:GPT-4.5、ミドル:GPT-4O、右:O3-mini.imageクレジット:Openai
別のテストで、OpenaiはGPT-4.5と他のモデルに「テストに失敗した後、苦労している」プロンプトに応答するように促しました。 GPT-4OとO3-MINIは有用な情報を提供しましたが、GPT-4.5の応答は最も社会的に適切でした。

「このリリースを通じてGPT-4.5の機能のより完全な写真を獲得できることを楽しみにしています」とOpenaiはブログ投稿に書いています。

GPT-4.5のAction.Image Credits:Openai
スケーリング法は異議を申し立てました

Openaiは、GPT -4.5は「監視されていない学習で可能なことのフロンティアにある」と主張しています。しかし、その制限は、いわゆるトレーニングのスケーリング法が彼らの限界に達している可能性があるという専門家の間での疑いの高まりを支持しているようです。

Openaiの共同設立者で元チーフサイエンティストのIlya Sutskeverは、12月に「私たちはピークデータを達成した」と「疑いなく終わらせることがわかっているようにトレーニング前」と述べました。彼のコメントは、11月にTechCrunchのAI投資家、創業者、研究者が共有する懸念を反映しています。

これらの課題に対応して、Openaiを含む業界は、タスクを実行するのに時間がかかるが、より一貫した結果を提供するという推論モデルに目を向けています。推論モデルをより多くの時間と計算に問題を介して「考える」ことを許可することにより、AI Labsはモデル機能を大幅に強化できると考えています。

Openaiは、最終的にGPTシリーズを「O」推論シリーズと統合する予定で、今年後半にGPT-5から始まります。トレーニングコストが高く、遅延、内部の期待に満ちていないにもかかわらず、GPT-4.5はAIベンチマーククラウンを単独で請求しない場合があります。しかし、Openaiは、それをはるかに強力なものへの重要なステップと見なしている可能性があります。

関連記事
OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Takes Operator to the Next LevelOpenAI is giving its autonomous AI agent, Operator, a major upgrade. The upcoming changes mean Operator will soon rely on a model based on o3
OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied Why Benchmark Discrepancies Matter in AIWhen it comes to AI, numbers often tell the story—and sometimes, those numbers don’t quite add up. Take OpenAI’s o3 model, for instance. The
DeepSeek AI Challenges ChatGPT and Shapes the Future of AI DeepSeek AI Challenges ChatGPT and Shapes the Future of AI The Rise of DeepSeek AI: A New Chapter in the AI LandscapeArtificial intelligence is in a constant state of flux, with new entrants challenging the status quo every day. Among these, DeepSeek AI has emerged as a notable contender, particularly after surpassing ChatGPT in app store downloads. This mi
コメント (50)
0/200
GregoryBaker
GregoryBaker 2025年4月10日 0:00:00 GMT

GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.

NicholasSanchez
NicholasSanchez 2025年4月10日 0:00:00 GMT

GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。

JasonJohnson
JasonJohnson 2025年4月10日 0:00:00 GMT

GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.

JasonAnderson
JasonAnderson 2025年4月10日 0:00:00 GMT

GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.

AvaHill
AvaHill 2025年4月10日 0:00:00 GMT

GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.

KennethMartin
KennethMartin 2025年4月10日 0:00:00 GMT

GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!

トップに戻ります
OR