オプション
ニュース
OpenaiはGPT-4.5「Orion」を起動します:これまでの最大のAIモデル

OpenaiはGPT-4.5「Orion」を起動します:これまでの最大のAIモデル

2025年4月10日
159

更新された午後2時40分PT:GPT-4.5の発売から数時間後、OpenaiはAIモデルのホワイトペーパーを静かに編集しました。彼らは、「GPT-4.5はフロンティアAIモデルではない」というラインを削除しました。ここで元のホワイトペーパーにアクセスできます。以下は元の記事です。

木曜日に、Openaiは、コード名Orionで行われる非常に予想されるAIモデルであるGPT-4.5でカーテンを引き戻しました。 Openaiのこの最新の巨人は、前例のない量のコンピューティングパワーとデータで訓練されており、前任者とは一線を画しています。

その印象的な規模にもかかわらず、Openaiのホワイトペーパーは当初、GPT-4.5はフロンティアモデルとは見なさなかったと述べました。しかし、その声明はその後削除され、モデルの真の可能性について疑問に思うようになりました。

木曜日から、Openaiのプレミアム200か月間のサービスであるChatGpt Proの購読者は、研究プレビューの一環としてGPT-4.5の最初の味を獲得します。 OpenAIの有料API層の開発者は、今日GPT-4.5の使用を開始できますが、OpenAIの広報担当者によると、ChatGpt PlusとChatGptチームのサブスクリプションを使用している人は来週のいつかアクセスを期待するはずです。

テクノロジーの世界はオリオンについて話題になっており、従来のAIトレーニング方法がまだ水を保持しているかどうかのテストと見なしています。 GPT-4.5は、前任者と同じプレイブックを追跡し、トレーニング前と呼ばれる監視されていない学習段階でのコンピューティングパワーとデータの大幅な増加に依存しています。

過去には、スケールアップにより、数学、執筆、コーディングなどのさまざまなドメインに大きなパフォーマンスが飛躍しました。 Openaiは、GPT-4.5のサイズが「より深い世界の知識」と「より高い感情的知性」を与えたと主張しています。しかし、スケールアップからのリターンが減少する可能性があるというヒントがあります。いくつかのAIベンチマークでは、GPT-4.5は、Deepseek、人類、さらにはOpenai自体などの企業からの新しい推論モデルに遅れをとっています。

さらに、GPT-4.5の実行には多額の値札が付いています。 Openaiは、それが非常に高価であると認めているため、長期的にAPIを通じて利用可能にするかどうかを検討しています。開発者は、入力トークンごとに75ドル、100万の出力トークンごとに150ドルを支払います。これは、より手頃な価格のGPT-4Oとはまったく対照的で、100万ドルあたり2.50ドル、100万ドルあたり10ドルかかります。

「私たちは、GPT -4.5を研究プレビューとして共有して、その強みと制限をよりよく理解するためです」とOpenaiはブログ投稿で共有しています。 「私たちはまだその可能性を最大限に発揮しており、人々が予想外の方法でそれをどのように使用するかを楽しみにしています。」

混合パフォーマンス

Openaiは、GPT-4.5がAPIとChatGPTの大部分を駆動する主力モデルであるGPT-4Oを置き換えることを意図していないことは明らかです。 GPT-4.5はファイルと画像のアップロードを処理し、ChatGPTのCanvasツールを使用できますが、現在、ChatGPTのリアルな双方向の音声モードなどの機能をサポートしていません。

明るい面では、GPT-4.5はGPT-4OとOpenAIのSimpleQAベンチマーク上の他の多くのモデルよりも優れています。また、Openaiは、GPT-4.5がほとんどのモデルよりも頻繁に幻覚の頻度が低いと主張しており、理論的には情報の製造の可能性が低くなるはずです。

興味深いことに、Openaiは、SimpleQAの結果に、そのトップパフォーマンスの推論モデル、ディープリサーチの1つを含めていませんでした。 Openaiの広報担当者はTechCrunchに、このベンチマークでDeep Researchのパフォーマンスを公に報告しておらず、関連する比較とは考えていないと語った。ただし、他のベンチマークに関するOpenaiの深い研究と同様に実行されるPerplexityの深い研究モデルは、実際にこの事実上の精度のテストでGPT-4.5を上回っています。

SimpleQA Benchmarks.Imageクレジット:Openai
SWEベンチ検証ベンチマークからのコーディング問題のサブセットでは、GPT-4.5はGPT-4OおよびO3-MINIと同様に機能しますが、Openaiの深い研究と人類のClaude 3.7 Sonnetには及ばない。別のコーディングテストでは、完全なソフトウェア機能を開発するAIモデルの能力を測定するOpenAIのSWEランサーベンチマークでは、GPT-4.5はGPT-4OとO3-MINIの両方を上回りますが、深い研究を上回りません。

OpenaiのSWEベンチ検証benchmark.imageクレジット:Openai
OpenaiのSWE-LAN​​CER DIAMOND BENCHMARK.IMAGE CREDITS:Openai
GPT-4.5は、AIAMEやGPQAなどの挑戦的なアカデミックベンチマークでO3-Mini、DeepseekのR1、Claude 3.7 Sonnetなどの主要なAI推論モデルのパフォーマンスとはまったく一致していませんが、同じテストでの主要な非合理的なモデルに対して独自に保持しています。これは、GPT-4.5が数学および科学関連のタスクに優れていることを示唆しています。

Openaiはまた、GPT-4.5が、人間の意図を理解するなど、ベンチマークがうまくキャプチャしない領域の他のモデルよりも定性的に優れていることを誇っています。彼らは、GPT-4.5がより暖かく、より自然なトーンで反応し、執筆やデザインなどの創造的なタスクでうまく機能すると主張しています。

非公式のテストで、OpenaiはGPT-4.5と他の2つのモデルであるGPT-4OとO3-MINIに、SVG形式でユニコーンを作成するように依頼しました。 GPT-4.5のみがユニコーンに似たものを生産することができました。

左:GPT-4.5、ミドル:GPT-4O、右:O3-mini.imageクレジット:Openai
別のテストで、OpenaiはGPT-4.5と他のモデルに「テストに失敗した後、苦労している」プロンプトに応答するように促しました。 GPT-4OとO3-MINIは有用な情報を提供しましたが、GPT-4.5の応答は最も社会的に適切でした。

「このリリースを通じてGPT-4.5の機能のより完全な写真を獲得できることを楽しみにしています」とOpenaiはブログ投稿に書いています。

GPT-4.5のAction.Image Credits:Openai
スケーリング法は異議を申し立てました

Openaiは、GPT -4.5は「監視されていない学習で可能なことのフロンティアにある」と主張しています。しかし、その制限は、いわゆるトレーニングのスケーリング法が彼らの限界に達している可能性があるという専門家の間での疑いの高まりを支持しているようです。

Openaiの共同設立者で元チーフサイエンティストのIlya Sutskeverは、12月に「私たちはピークデータを達成した」と「疑いなく終わらせることがわかっているようにトレーニング前」と述べました。彼のコメントは、11月にTechCrunchのAI投資家、創業者、研究者が共有する懸念を反映しています。

これらの課題に対応して、Openaiを含む業界は、タスクを実行するのに時間がかかるが、より一貫した結果を提供するという推論モデルに目を向けています。推論モデルをより多くの時間と計算に問題を介して「考える」ことを許可することにより、AI Labsはモデル機能を大幅に強化できると考えています。

Openaiは、最終的にGPTシリーズを「O」推論シリーズと統合する予定で、今年後半にGPT-5から始まります。トレーニングコストが高く、遅延、内部の期待に満ちていないにもかかわらず、GPT-4.5はAIベンチマーククラウンを単独で請求しない場合があります。しかし、Openaiは、それをはるかに強力なものへの重要なステップと見なしている可能性があります。

関連記事
元OpenAIエンジニアが企業文化と急速な成長について語る 元OpenAIエンジニアが企業文化と急速な成長について語る 3週間前、OpenAIの主要製品に貢献したエンジニア、Calvin French-Owenが退社。彼は最近、OpenAIでの1年間を詳細に綴った魅力的なブログを公開し、CursorやAnthropicのClaude Codeに匹敵するコーディングエージェントCodexの開発に注力したことを明かした。French-Owenは、退社の理由が内部の対立ではなく、スタートアップ生活への回帰願望だったと説明
GoogleがOpenAIと競合するエンタープライズ市場向けに生産準備が整ったGemini 2.5 AIモデルを公開 GoogleがOpenAIと競合するエンタープライズ市場向けに生産準備が整ったGemini 2.5 AIモデルを公開 Googleは月曜日、AI戦略を強化し、エンタープライズ向けに高度なGemini 2.5モデルを発表し、価格と性能で競争力のあるコスト効率の高いバリアントを導入しました。Alphabet傘下の同社は、主力AIモデルであるGemini 2.5 ProとGemini 2.5 Flashをテスト段階から完全な利用可能状態に移行し、重要なビジネスアプリケーションへの準備が整っていることを示しました。さらに
MetaがAI人材に高額報酬を提供、1億ドルのサインオンボーナスは否定 MetaがAI人材に高額報酬を提供、1億ドルのサインオンボーナスは否定 Metaは新しいスーパーインテリジェンスラボにAI研究者を引き付けるため、数百万ドル規模の報酬パッケージを提供しています。しかし、採用された研究者や漏洩した内部会議の発言によると、1億ドルの「サインオンボーナス」という主張は本当ではありません。The Vergeが木曜日に報じた漏洩した全社ミーティングでは、Metaの幹部がOpenAIのCEOサム・アルトマンが主張した、Metaがトップ研究者に提供
コメント (58)
0/200
JeffreyRamirez
JeffreyRamirez 2025年8月7日 4:01:00 JST

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!

RalphPerez
RalphPerez 2025年8月6日 0:01:00 JST

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.

WillPerez
WillPerez 2025年7月23日 13:59:29 JST

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?

FredWhite
FredWhite 2025年4月16日 8:21:15 JST

Just tried out GPT-4.5 'Orion' and wow, it's a beast! The responses are so detailed and nuanced, it's like having a super-smart friend on speed dial. Only thing is, it's a bit too advanced for my simple questions sometimes 🤓. Still, a must-try for AI enthusiasts!

WillieHernández
WillieHernández 2025年4月15日 21:54:33 JST

GPT-4.5『オリオン』を試してみたけど、すごいね!回答が詳細でニュアンスも豊か、まるで超賢い友達がすぐそばにいるみたい。ただ、私の簡単な質問にはちょっと高度すぎるかな🤓。それでも、AIファンには試してほしいよ!

FrankSmith
FrankSmith 2025年4月15日 8:57:47 JST

¡GPT-4.5 'Orion' es una bestia! He estado jugando con él y los resultados son impresionantes. ¿La edición silenciosa en el white paper? Movimiento astuto, OpenAI. ¡No puedo esperar a ver qué más tienen en mente! 🚀

トップに戻ります
OR