OpenAI啟動GPT-4.5'Orion':迄今為止其最大的AI模型
PT下午2:40更新:GPT-4.5發布後數小時,Openai對AI模型的白皮書進行了安靜的編輯。他們刪除了一條線,說“ GPT-4.5不是前沿AI模型”。您仍然可以在這裡訪問原始的白皮書。以下是原始文章。
週四,Openai撤回了GPT-4.5上的窗簾,這是備受期待的AI模型,該模型由代碼名稱Orion。來自OpenAI的最新龐然大物已經接受了空前數量的計算能力和數據的培訓,使其與前身區分開來。
儘管尺度令人印象深刻,但Openai的白皮書最初表示,他們並不認為GPT-4.5是邊境模型。但是,此聲明已被刪除,使我們想知道該模型的真正潛力。
從周四開始,作為研究預覽的一部分,OpenAI的Premium $ 200售價Chatgpt Pro的訂閱者將首先品嚐GPT-4.5。 OpenAI發言人說,OpenAI的付費API層的開發人員今天可以開始使用GPT-4.5,而擁有Chatgpt Plus和ChatGpt團隊訂閱的開發人員應該期望下周某個時候訪問。
科技界一直在嗡嗡作響,將其視為是否仍在含水的傳統AI培訓方法的測試。 GPT-4.5遵循與其前任相同的劇本,依靠無監督學習階段的計算能力和數據的巨大增加,稱為預培訓。
過去,擴展導致跨越數學,寫作和編碼等各個領域的性能突飛猛進。 Openai聲稱GPT-4.5的規模已賦予了“更深的世界知識”和“更高的情商”。然而,有一些暗示,從擴展到擴展的回報可能會減少。在幾個AI基準測試中,GPT-4.5落後於DeepSeek,Anthropic甚至Openai本身等公司的新推理模型。
此外,運行GPT-4.5的價格高昂。 Openai承認它是如此昂貴,以至於他們考慮是否長期通過其API來保持它。開發人員將為每百萬個輸入代幣支付75美元,每百萬個產量令牌為150美元,與價格更便宜的GPT-4O形成鮮明對比,GPT-4O的價格僅為每百萬美元的投入令牌2550美元和每百萬美元的產出代幣。
Openai在博客文章中分享道:“我們將分享GPT -4.5作為研究預覽,以更好地了解其優勢和局限性。” “我們仍在探索它的全部潛力,並很高興看到人們將如何以意想不到的方式使用它。”
混合性能
Openai很明顯,GPT-4.5並不是要取代驅動大部分API和CHATGPT的主力模型GPT-4O。雖然GPT-4.5可以處理文件和圖像上傳並使用Chatgpt的Canvas工具,但目前不支持Chatgpt現實的雙向語音模式之類的功能。
從明亮的一面來看,GPT-4.5在OpenAI的SimpleQA基準測試中勝過GPT-4O和許多其他模型,該基準測試了AI模型在直接,事實問題上。 Openai還聲稱,GPT-4.5的幻覺量低於大多數型號,從理論上講,這應該使製造信息的可能性降低。
有趣的是,OpenAI並未在SimpleQA結果中包括其表現最佳的推理模型之一。一位OpenAI發言人告訴TechCrunch,他們尚未公開報告深入研究在此基準測試中的表現,並且不認為這是相關的比較。但是,困惑的深度研究模型與OpenAI對其他基準測試的深入研究相似,實際上在這種事實準確性測試的測試中遠遠超出了GPT-4.5。

SimpleQA基準標記:圖像學分:OpenAi 在SWE Bench驗證的基準的一部分編碼問題中,GPT-4.5的性能類似於GPT-4O和O3-Mini,但距離OpenAI的深入研究和眾多的Claude 3.7十四行詩也沒有。在另一項編碼測試中,OpenAI的SWE-Lancer基準測量了AI模型開發完整軟件功能的能力,GPT-4.5的表現均優於GPT-4O和O3-Mini,但並未超過深入的研究。

OpenAI的SWE Bench驗證的基準測試。圖片信用:OpenAI 
Openai的Swe-Lancer鑽石基準。圖像學分:OpenAI 儘管GPT-4.5與O3-Mini,DeepSeek的R1和Claude 3.7十四行詩(如AIME和GPQA)等領先的AI推理模型的性能完全不符,但它確實與在同一測試中領先的非常規模型相抵觸。這表明GPT-4.5在與數學和科學相關的任務中表現出色。
Openai還擁有GPT-4.5在質量上優於其他模型,而在基準測試的領域(例如了解人類意圖)。他們聲稱GPT-4.5以更溫暖,更自然的語氣做出反應,並且在寫作和設計等創意任務上表現良好。
在非正式測試中,OpenAI詢問了GPT-4.5,以及其他兩種型號GPT-4O和O3-Mini,以SVG格式創建獨角獸。只有GPT-4.5才能產生類似於獨角獸的東西。

左:GPT-4.5,中間:GPT-4O,右:O3-Mini。圖像學分:OpenAi 在另一項測試中,OpenAI提示GPT-4.5和其他模型對提示做出回應:“在未能完成測試後,我經歷了艱難的時期。”雖然GPT-4O和O3-Mini提供了有用的信息,但GPT-4.5的反應在社會上是最合適的。
Openai在他們的博客文章中寫道:“我們期待通過此版本獲得更完整的GPT-4.5功能圖片,因為我們認識到學術基準並不總是反映現實世界中的有用性。”

GPT-4.5的情緒智力在行動中。圖片學分:OpenAI 擴展法律挑戰
Openai聲稱GPT -4.5是“在無監督學習中可能的邊界”。然而,它的局限性似乎支持了專家對所謂的預訓練規律可能達到限制的越來越多的懷疑。
Openai聯合創始人兼前首席科學家Ilya Sutskever在12月表示,“我們已經達到了峰值數據”,並且“眾所周知,這將毫無疑問地結束”。他的評論回應了11月AI投資者,創始人和研究人員的擔憂。
為了應對這些挑戰,該行業(包括OpenAI)轉向了推理模型,這些模型需要更長的時間來執行任務,但提供了更一致的結果。通過允許推理模型更多的時間和計算能力通過問題“思考”,AI實驗室認為它們可以顯著增強模型功能。
Openai計劃最終將其GPT系列與其“ O”推理系列合併,從今年晚些時候GPT-5開始。儘管培訓成本,延遲和未滿足的內部期望,GPT-4.5可能並沒有單獨主張AI基準冠冕。但是Openai可能將其視為邁向更強大的事情的關鍵一步。
相關文章
OpenAI Enhances AI Model Behind Its Operator Agent
OpenAI Takes Operator to the Next LevelOpenAI is giving its autonomous AI agent, Operator, a major upgrade. The upcoming changes mean Operator will soon rely on a model based on o3
OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied
Why Benchmark Discrepancies Matter in AIWhen it comes to AI, numbers often tell the story—and sometimes, those numbers don’t quite add up. Take OpenAI’s o3 model, for instance. The
DeepSeek AI Challenges ChatGPT and Shapes the Future of AI
The Rise of DeepSeek AI: A New Chapter in the AI LandscapeArtificial intelligence is in a constant state of flux, with new entrants challenging the status quo every day. Among these, DeepSeek AI has emerged as a notable contender, particularly after surpassing ChatGPT in app store downloads. This mi
評論 (50)
0/200
GregoryBaker
2025-04-10 08:00:00
GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.
0
NicholasSanchez
2025-04-10 08:00:00
GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。
0
JasonJohnson
2025-04-10 08:00:00
GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.
0
JasonAnderson
2025-04-10 08:00:00
GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.
0
AvaHill
2025-04-10 08:00:00
GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.
0
KennethMartin
2025-04-10 08:00:00
GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!
0
PT下午2:40更新:GPT-4.5發布後數小時,Openai對AI模型的白皮書進行了安靜的編輯。他們刪除了一條線,說“ GPT-4.5不是前沿AI模型”。您仍然可以在這裡訪問原始的白皮書。以下是原始文章。
週四,Openai撤回了GPT-4.5上的窗簾,這是備受期待的AI模型,該模型由代碼名稱Orion。來自OpenAI的最新龐然大物已經接受了空前數量的計算能力和數據的培訓,使其與前身區分開來。
儘管尺度令人印象深刻,但Openai的白皮書最初表示,他們並不認為GPT-4.5是邊境模型。但是,此聲明已被刪除,使我們想知道該模型的真正潛力。
從周四開始,作為研究預覽的一部分,OpenAI的Premium $ 200售價Chatgpt Pro的訂閱者將首先品嚐GPT-4.5。 OpenAI發言人說,OpenAI的付費API層的開發人員今天可以開始使用GPT-4.5,而擁有Chatgpt Plus和ChatGpt團隊訂閱的開發人員應該期望下周某個時候訪問。
科技界一直在嗡嗡作響,將其視為是否仍在含水的傳統AI培訓方法的測試。 GPT-4.5遵循與其前任相同的劇本,依靠無監督學習階段的計算能力和數據的巨大增加,稱為預培訓。
過去,擴展導致跨越數學,寫作和編碼等各個領域的性能突飛猛進。 Openai聲稱GPT-4.5的規模已賦予了“更深的世界知識”和“更高的情商”。然而,有一些暗示,從擴展到擴展的回報可能會減少。在幾個AI基準測試中,GPT-4.5落後於DeepSeek,Anthropic甚至Openai本身等公司的新推理模型。
此外,運行GPT-4.5的價格高昂。 Openai承認它是如此昂貴,以至於他們考慮是否長期通過其API來保持它。開發人員將為每百萬個輸入代幣支付75美元,每百萬個產量令牌為150美元,與價格更便宜的GPT-4O形成鮮明對比,GPT-4O的價格僅為每百萬美元的投入令牌2550美元和每百萬美元的產出代幣。
Openai在博客文章中分享道:“我們將分享GPT -4.5作為研究預覽,以更好地了解其優勢和局限性。” “我們仍在探索它的全部潛力,並很高興看到人們將如何以意想不到的方式使用它。”
混合性能
Openai很明顯,GPT-4.5並不是要取代驅動大部分API和CHATGPT的主力模型GPT-4O。雖然GPT-4.5可以處理文件和圖像上傳並使用Chatgpt的Canvas工具,但目前不支持Chatgpt現實的雙向語音模式之類的功能。
從明亮的一面來看,GPT-4.5在OpenAI的SimpleQA基準測試中勝過GPT-4O和許多其他模型,該基準測試了AI模型在直接,事實問題上。 Openai還聲稱,GPT-4.5的幻覺量低於大多數型號,從理論上講,這應該使製造信息的可能性降低。
有趣的是,OpenAI並未在SimpleQA結果中包括其表現最佳的推理模型之一。一位OpenAI發言人告訴TechCrunch,他們尚未公開報告深入研究在此基準測試中的表現,並且不認為這是相關的比較。但是,困惑的深度研究模型與OpenAI對其他基準測試的深入研究相似,實際上在這種事實準確性測試的測試中遠遠超出了GPT-4.5。
Openai還擁有GPT-4.5在質量上優於其他模型,而在基準測試的領域(例如了解人類意圖)。他們聲稱GPT-4.5以更溫暖,更自然的語氣做出反應,並且在寫作和設計等創意任務上表現良好。
在非正式測試中,OpenAI詢問了GPT-4.5,以及其他兩種型號GPT-4O和O3-Mini,以SVG格式創建獨角獸。只有GPT-4.5才能產生類似於獨角獸的東西。
Openai在他們的博客文章中寫道:“我們期待通過此版本獲得更完整的GPT-4.5功能圖片,因為我們認識到學術基準並不總是反映現實世界中的有用性。”

GPT-4.5的情緒智力在行動中。圖片學分:OpenAI 擴展法律挑戰
Openai聲稱GPT -4.5是“在無監督學習中可能的邊界”。然而,它的局限性似乎支持了專家對所謂的預訓練規律可能達到限制的越來越多的懷疑。
Openai聯合創始人兼前首席科學家Ilya Sutskever在12月表示,“我們已經達到了峰值數據”,並且“眾所周知,這將毫無疑問地結束”。他的評論回應了11月AI投資者,創始人和研究人員的擔憂。
為了應對這些挑戰,該行業(包括OpenAI)轉向了推理模型,這些模型需要更長的時間來執行任務,但提供了更一致的結果。通過允許推理模型更多的時間和計算能力通過問題“思考”,AI實驗室認為它們可以顯著增強模型功能。
Openai計劃最終將其GPT系列與其“ O”推理系列合併,從今年晚些時候GPT-5開始。儘管培訓成本,延遲和未滿足的內部期望,GPT-4.5可能並沒有單獨主張AI基準冠冕。但是Openai可能將其視為邁向更強大的事情的關鍵一步。




GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.




GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。




GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.




GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.




GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.




GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!












