オプション
ニュース
OpenaiはGPT-4.5「Orion」を起動します:これまでの最大のAIモデル

OpenaiはGPT-4.5「Orion」を起動します:これまでの最大のAIモデル

2025年4月10日
216

更新された午後2時40分PT:GPT-4.5の発売から数時間後、OpenaiはAIモデルのホワイトペーパーを静かに編集しました。彼らは、「GPT-4.5はフロンティアAIモデルではない」というラインを削除しました。ここで元のホワイトペーパーにアクセスできます。以下は元の記事です。

木曜日に、Openaiは、コード名Orionで行われる非常に予想されるAIモデルであるGPT-4.5でカーテンを引き戻しました。 Openaiのこの最新の巨人は、前例のない量のコンピューティングパワーとデータで訓練されており、前任者とは一線を画しています。

その印象的な規模にもかかわらず、Openaiのホワイトペーパーは当初、GPT-4.5はフロンティアモデルとは見なさなかったと述べました。しかし、その声明はその後削除され、モデルの真の可能性について疑問に思うようになりました。

木曜日から、Openaiのプレミアム200か月間のサービスであるChatGpt Proの購読者は、研究プレビューの一環としてGPT-4.5の最初の味を獲得します。 OpenAIの有料API層の開発者は、今日GPT-4.5の使用を開始できますが、OpenAIの広報担当者によると、ChatGpt PlusとChatGptチームのサブスクリプションを使用している人は来週のいつかアクセスを期待するはずです。

テクノロジーの世界はオリオンについて話題になっており、従来のAIトレーニング方法がまだ水を保持しているかどうかのテストと見なしています。 GPT-4.5は、前任者と同じプレイブックを追跡し、トレーニング前と呼ばれる監視されていない学習段階でのコンピューティングパワーとデータの大幅な増加に依存しています。

過去には、スケールアップにより、数学、執筆、コーディングなどのさまざまなドメインに大きなパフォーマンスが飛躍しました。 Openaiは、GPT-4.5のサイズが「より深い世界の知識」と「より高い感情的知性」を与えたと主張しています。しかし、スケールアップからのリターンが減少する可能性があるというヒントがあります。いくつかのAIベンチマークでは、GPT-4.5は、Deepseek、人類、さらにはOpenai自体などの企業からの新しい推論モデルに遅れをとっています。

さらに、GPT-4.5の実行には多額の値札が付いています。 Openaiは、それが非常に高価であると認めているため、長期的にAPIを通じて利用可能にするかどうかを検討しています。開発者は、入力トークンごとに75ドル、100万の出力トークンごとに150ドルを支払います。これは、より手頃な価格のGPT-4Oとはまったく対照的で、100万ドルあたり2.50ドル、100万ドルあたり10ドルかかります。

「私たちは、GPT -4.5を研究プレビューとして共有して、その強みと制限をよりよく理解するためです」とOpenaiはブログ投稿で共有しています。 「私たちはまだその可能性を最大限に発揮しており、人々が予想外の方法でそれをどのように使用するかを楽しみにしています。」

混合パフォーマンス

Openaiは、GPT-4.5がAPIとChatGPTの大部分を駆動する主力モデルであるGPT-4Oを置き換えることを意図していないことは明らかです。 GPT-4.5はファイルと画像のアップロードを処理し、ChatGPTのCanvasツールを使用できますが、現在、ChatGPTのリアルな双方向の音声モードなどの機能をサポートしていません。

明るい面では、GPT-4.5はGPT-4OとOpenAIのSimpleQAベンチマーク上の他の多くのモデルよりも優れています。また、Openaiは、GPT-4.5がほとんどのモデルよりも頻繁に幻覚の頻度が低いと主張しており、理論的には情報の製造の可能性が低くなるはずです。

興味深いことに、Openaiは、SimpleQAの結果に、そのトップパフォーマンスの推論モデル、ディープリサーチの1つを含めていませんでした。 Openaiの広報担当者はTechCrunchに、このベンチマークでDeep Researchのパフォーマンスを公に報告しておらず、関連する比較とは考えていないと語った。ただし、他のベンチマークに関するOpenaiの深い研究と同様に実行されるPerplexityの深い研究モデルは、実際にこの事実上の精度のテストでGPT-4.5を上回っています。

SimpleQA Benchmarks.Imageクレジット:Openai
SWEベンチ検証ベンチマークからのコーディング問題のサブセットでは、GPT-4.5はGPT-4OおよびO3-MINIと同様に機能しますが、Openaiの深い研究と人類のClaude 3.7 Sonnetには及ばない。別のコーディングテストでは、完全なソフトウェア機能を開発するAIモデルの能力を測定するOpenAIのSWEランサーベンチマークでは、GPT-4.5はGPT-4OとO3-MINIの両方を上回りますが、深い研究を上回りません。

OpenaiのSWEベンチ検証benchmark.imageクレジット:Openai
OpenaiのSWE-LAN​​CER DIAMOND BENCHMARK.IMAGE CREDITS:Openai
GPT-4.5は、AIAMEやGPQAなどの挑戦的なアカデミックベンチマークでO3-Mini、DeepseekのR1、Claude 3.7 Sonnetなどの主要なAI推論モデルのパフォーマンスとはまったく一致していませんが、同じテストでの主要な非合理的なモデルに対して独自に保持しています。これは、GPT-4.5が数学および科学関連のタスクに優れていることを示唆しています。

Openaiはまた、GPT-4.5が、人間の意図を理解するなど、ベンチマークがうまくキャプチャしない領域の他のモデルよりも定性的に優れていることを誇っています。彼らは、GPT-4.5がより暖かく、より自然なトーンで反応し、執筆やデザインなどの創造的なタスクでうまく機能すると主張しています。

非公式のテストで、OpenaiはGPT-4.5と他の2つのモデルであるGPT-4OとO3-MINIに、SVG形式でユニコーンを作成するように依頼しました。 GPT-4.5のみがユニコーンに似たものを生産することができました。

左:GPT-4.5、ミドル:GPT-4O、右:O3-mini.imageクレジット:Openai
別のテストで、OpenaiはGPT-4.5と他のモデルに「テストに失敗した後、苦労している」プロンプトに応答するように促しました。 GPT-4OとO3-MINIは有用な情報を提供しましたが、GPT-4.5の応答は最も社会的に適切でした。

「このリリースを通じてGPT-4.5の機能のより完全な写真を獲得できることを楽しみにしています」とOpenaiはブログ投稿に書いています。

GPT-4.5のAction.Image Credits:Openai
スケーリング法は異議を申し立てました

Openaiは、GPT -4.5は「監視されていない学習で可能なことのフロンティアにある」と主張しています。しかし、その制限は、いわゆるトレーニングのスケーリング法が彼らの限界に達している可能性があるという専門家の間での疑いの高まりを支持しているようです。

Openaiの共同設立者で元チーフサイエンティストのIlya Sutskeverは、12月に「私たちはピークデータを達成した」と「疑いなく終わらせることがわかっているようにトレーニング前」と述べました。彼のコメントは、11月にTechCrunchのAI投資家、創業者、研究者が共有する懸念を反映しています。

これらの課題に対応して、Openaiを含む業界は、タスクを実行するのに時間がかかるが、より一貫した結果を提供するという推論モデルに目を向けています。推論モデルをより多くの時間と計算に問題を介して「考える」ことを許可することにより、AI Labsはモデル機能を大幅に強化できると考えています。

Openaiは、最終的にGPTシリーズを「O」推論シリーズと統合する予定で、今年後半にGPT-5から始まります。トレーニングコストが高く、遅延、内部の期待に満ちていないにもかかわらず、GPT-4.5はAIベンチマーククラウンを単独で請求しない場合があります。しかし、Openaiは、それをはるかに強力なものへの重要なステップと見なしている可能性があります。

関連記事
非営利団体、AIエージェントを活用してチャリティ募金活動を強化 非営利団体、AIエージェントを活用してチャリティ募金活動を強化 大手テック企業がAIの "エージェント "をビジネスの生産性向上剤として推進する一方で、ある非営利団体はAIが社会的利益に貢献する可能性を実証している。オープン・フィランソロピーが支援する慈善研究グループ、セージ・フューチャーは最近、AIモデルが慈善活動の資金調達にどのように協力できるかを示す革新的な実験を行った。この非営利団体は、OpenAIのGPT-4oとo1、AnthropicのClau
トップAI研究所は、人類はAIシステムを理解する力を失いつつあると警告する トップAI研究所は、人類はAIシステムを理解する力を失いつつあると警告する OpenAI、Google DeepMind、Anthropic、Metaの研究者は、前例のない団結を示し、競争上の相違を脇に置いて、責任あるAI開発について集団で警告を発した。これらの通常ライバル関係にある組織から40人以上の一流の科学者が、AIの意思決定プロセスの透明性を確保するための窓が急速に狭まっていることを強調する画期的な研究論文を共同執筆した。この共同研究は、現代のAIシステムにおける
ChatGPT、ファイルアクセスにGoogle DriveとDropboxの統合を追加 ChatGPT、ファイルアクセスにGoogle DriveとDropboxの統合を追加 ChatGPTが企業向け新機能で生産性を向上OpenAIは、ChatGPTを包括的なビジネス生産性ツールに変える2つの強力な新機能を発表しました:自動会議文書化とシームレスなクラウドストレージ統合です。革命的な録音機能新しく導入された "記録モード "は、自動テープ起こしや分析を可能にします:重要なビジネス会議創造的なブレーンストーミングセッション 個人の思考プロセスこの
コメント (61)
0/200
GeorgeCarter
GeorgeCarter 2025年8月22日 18:01:17 JST

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🤔

BruceWilson
BruceWilson 2025年8月19日 12:01:00 JST

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky edit to the white paper? Shady move, OpenAI. Makes me wonder what else they're hiding. Still, I'm hyped to see what this model can do! 😎

BruceBrown
BruceBrown 2025年8月12日 3:01:05 JST

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows—why hide that it’s not a frontier model? 🤔 Makes me wonder what OpenAI’s cooking behind the scenes!

JeffreyRamirez
JeffreyRamirez 2025年8月7日 4:01:00 JST

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!

RalphPerez
RalphPerez 2025年8月6日 0:01:00 JST

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.

WillPerez
WillPerez 2025年7月23日 13:59:29 JST

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?

トップに戻ります
OR