OpenAI啟動GPT-4.5'Orion':迄今為止其最大的AI模型
PT下午2:40更新:GPT-4.5發布後數小時,Openai對AI模型的白皮書進行了安靜的編輯。他們刪除了一條線,說“ GPT-4.5不是前沿AI模型”。您仍然可以在這裡訪問原始的白皮書。以下是原始文章。
週四,Openai撤回了GPT-4.5上的窗簾,這是備受期待的AI模型,該模型由代碼名稱Orion。來自OpenAI的最新龐然大物已經接受了空前數量的計算能力和數據的培訓,使其與前身區分開來。
儘管尺度令人印象深刻,但Openai的白皮書最初表示,他們並不認為GPT-4.5是邊境模型。但是,此聲明已被刪除,使我們想知道該模型的真正潛力。
從周四開始,作為研究預覽的一部分,OpenAI的Premium $ 200售價Chatgpt Pro的訂閱者將首先品嚐GPT-4.5。 OpenAI發言人說,OpenAI的付費API層的開發人員今天可以開始使用GPT-4.5,而擁有Chatgpt Plus和ChatGpt團隊訂閱的開發人員應該期望下周某個時候訪問。
科技界一直在嗡嗡作響,將其視為是否仍在含水的傳統AI培訓方法的測試。 GPT-4.5遵循與其前任相同的劇本,依靠無監督學習階段的計算能力和數據的巨大增加,稱為預培訓。
過去,擴展導致跨越數學,寫作和編碼等各個領域的性能突飛猛進。 Openai聲稱GPT-4.5的規模已賦予了“更深的世界知識”和“更高的情商”。然而,有一些暗示,從擴展到擴展的回報可能會減少。在幾個AI基準測試中,GPT-4.5落後於DeepSeek,Anthropic甚至Openai本身等公司的新推理模型。
此外,運行GPT-4.5的價格高昂。 Openai承認它是如此昂貴,以至於他們考慮是否長期通過其API來保持它。開發人員將為每百萬個輸入代幣支付75美元,每百萬個產量令牌為150美元,與價格更便宜的GPT-4O形成鮮明對比,GPT-4O的價格僅為每百萬美元的投入令牌2550美元和每百萬美元的產出代幣。
Openai在博客文章中分享道:“我們將分享GPT -4.5作為研究預覽,以更好地了解其優勢和局限性。” “我們仍在探索它的全部潛力,並很高興看到人們將如何以意想不到的方式使用它。”
混合性能
Openai很明顯,GPT-4.5並不是要取代驅動大部分API和CHATGPT的主力模型GPT-4O。雖然GPT-4.5可以處理文件和圖像上傳並使用Chatgpt的Canvas工具,但目前不支持Chatgpt現實的雙向語音模式之類的功能。
從明亮的一面來看,GPT-4.5在OpenAI的SimpleQA基準測試中勝過GPT-4O和許多其他模型,該基準測試了AI模型在直接,事實問題上。 Openai還聲稱,GPT-4.5的幻覺量低於大多數型號,從理論上講,這應該使製造信息的可能性降低。
有趣的是,OpenAI並未在SimpleQA結果中包括其表現最佳的推理模型之一。一位OpenAI發言人告訴TechCrunch,他們尚未公開報告深入研究在此基準測試中的表現,並且不認為這是相關的比較。但是,困惑的深度研究模型與OpenAI對其他基準測試的深入研究相似,實際上在這種事實準確性測試的測試中遠遠超出了GPT-4.5。

SimpleQA基準標記:圖像學分:OpenAi 在SWE Bench驗證的基準的一部分編碼問題中,GPT-4.5的性能類似於GPT-4O和O3-Mini,但距離OpenAI的深入研究和眾多的Claude 3.7十四行詩也沒有。在另一項編碼測試中,OpenAI的SWE-Lancer基準測量了AI模型開發完整軟件功能的能力,GPT-4.5的表現均優於GPT-4O和O3-Mini,但並未超過深入的研究。

OpenAI的SWE Bench驗證的基準測試。圖片信用:OpenAI 
Openai的Swe-Lancer鑽石基準。圖像學分:OpenAI 儘管GPT-4.5與O3-Mini,DeepSeek的R1和Claude 3.7十四行詩(如AIME和GPQA)等領先的AI推理模型的性能完全不符,但它確實與在同一測試中領先的非常規模型相抵觸。這表明GPT-4.5在與數學和科學相關的任務中表現出色。
Openai還擁有GPT-4.5在質量上優於其他模型,而在基準測試的領域(例如了解人類意圖)。他們聲稱GPT-4.5以更溫暖,更自然的語氣做出反應,並且在寫作和設計等創意任務上表現良好。
在非正式測試中,OpenAI詢問了GPT-4.5,以及其他兩種型號GPT-4O和O3-Mini,以SVG格式創建獨角獸。只有GPT-4.5才能產生類似於獨角獸的東西。

左:GPT-4.5,中間:GPT-4O,右:O3-Mini。圖像學分:OpenAi 在另一項測試中,OpenAI提示GPT-4.5和其他模型對提示做出回應:“在未能完成測試後,我經歷了艱難的時期。”雖然GPT-4O和O3-Mini提供了有用的信息,但GPT-4.5的反應在社會上是最合適的。
Openai在他們的博客文章中寫道:“我們期待通過此版本獲得更完整的GPT-4.5功能圖片,因為我們認識到學術基準並不總是反映現實世界中的有用性。”

GPT-4.5的情緒智力在行動中。圖片學分:OpenAI 擴展法律挑戰
Openai聲稱GPT -4.5是“在無監督學習中可能的邊界”。然而,它的局限性似乎支持了專家對所謂的預訓練規律可能達到限制的越來越多的懷疑。
Openai聯合創始人兼前首席科學家Ilya Sutskever在12月表示,“我們已經達到了峰值數據”,並且“眾所周知,這將毫無疑問地結束”。他的評論回應了11月AI投資者,創始人和研究人員的擔憂。
為了應對這些挑戰,該行業(包括OpenAI)轉向了推理模型,這些模型需要更長的時間來執行任務,但提供了更一致的結果。通過允許推理模型更多的時間和計算能力通過問題“思考”,AI實驗室認為它們可以顯著增強模型功能。
Openai計劃最終將其GPT系列與其“ O”推理系列合併,從今年晚些時候GPT-5開始。儘管培訓成本,延遲和未滿足的內部期望,GPT-4.5可能並沒有單獨主張AI基準冠冕。但是Openai可能將其視為邁向更強大的事情的關鍵一步。
相關文章
前OpenAI工程師分享公司文化與快速成長的見解
三週前,Calvin French-Owen,一位為OpenAI關鍵產品做出貢獻的工程師,離開了公司。他最近發表了一篇引人入勝的部落格文章,詳細描述了他在OpenAI一年的經歷,包括開發Codex的緊張努力,這是一個與Cursor和Anthropic的Claude Code競爭的編碼代理。French-Owen澄清,他的離職並非因內部衝突,而是源於他希望回歸創業生活。他之前共同創辦了Segment
Google 揭曉量產級 Gemini 2.5 AI 模型以在企業市場與 OpenAI 競爭
Google 於週一強化其 AI 策略,推出先進的 Gemini 2.5 模型供企業使用,並引入成本效益高的變體,以在價格與性能上競爭。Alphabet 旗下的公司將其旗艦 AI 模型—Gemini 2.5 Pro 與 Gemini 2.5 Flash—從測試階段提升至全面可用,展示其適用於關鍵業務應用的準備度。同時,Google 推出 Gemini 2.5 Flash-Lite,定位為高量任務中
Meta為AI人才提供高薪,否認1億美元簽約獎金
Meta以數百萬美元的薪酬套餐吸引AI研究人員加入其新超級智能實驗室。然而,一位受聘研究員及洩露的內部會議內容顯示,1億美元「簽約獎金」的說法不實。據The Verge週四報導,在一場洩露的公司全體會議中,Meta高管回應了關於OpenAI執行長Sam Altman聲稱Meta向頂尖研究員提供獎金的問題。Meta技術長Andrew Bosworth表示,只有極少數高級領導可能獲得如此高額報酬,但澄
評論 (58)
0/200
JeffreyRamirez
2025-08-07 03:01:00
Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!
0
RalphPerez
2025-08-05 23:01:00
Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.
0
WillPerez
2025-07-23 12:59:29
Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?
0
FredWhite
2025-04-16 07:21:15
Just tried out GPT-4.5 'Orion' and wow, it's a beast! The responses are so detailed and nuanced, it's like having a super-smart friend on speed dial. Only thing is, it's a bit too advanced for my simple questions sometimes 🤓. Still, a must-try for AI enthusiasts!
0
WillieHernández
2025-04-15 20:54:33
GPT-4.5『オリオン』を試してみたけど、すごいね!回答が詳細でニュアンスも豊か、まるで超賢い友達がすぐそばにいるみたい。ただ、私の簡単な質問にはちょっと高度すぎるかな🤓。それでも、AIファンには試してほしいよ!
0
FrankSmith
2025-04-15 07:57:47
¡GPT-4.5 'Orion' es una bestia! He estado jugando con él y los resultados son impresionantes. ¿La edición silenciosa en el white paper? Movimiento astuto, OpenAI. ¡No puedo esperar a ver qué más tienen en mente! 🚀
0
PT下午2:40更新:GPT-4.5發布後數小時,Openai對AI模型的白皮書進行了安靜的編輯。他們刪除了一條線,說“ GPT-4.5不是前沿AI模型”。您仍然可以在這裡訪問原始的白皮書。以下是原始文章。
週四,Openai撤回了GPT-4.5上的窗簾,這是備受期待的AI模型,該模型由代碼名稱Orion。來自OpenAI的最新龐然大物已經接受了空前數量的計算能力和數據的培訓,使其與前身區分開來。
儘管尺度令人印象深刻,但Openai的白皮書最初表示,他們並不認為GPT-4.5是邊境模型。但是,此聲明已被刪除,使我們想知道該模型的真正潛力。
從周四開始,作為研究預覽的一部分,OpenAI的Premium $ 200售價Chatgpt Pro的訂閱者將首先品嚐GPT-4.5。 OpenAI發言人說,OpenAI的付費API層的開發人員今天可以開始使用GPT-4.5,而擁有Chatgpt Plus和ChatGpt團隊訂閱的開發人員應該期望下周某個時候訪問。
科技界一直在嗡嗡作響,將其視為是否仍在含水的傳統AI培訓方法的測試。 GPT-4.5遵循與其前任相同的劇本,依靠無監督學習階段的計算能力和數據的巨大增加,稱為預培訓。
過去,擴展導致跨越數學,寫作和編碼等各個領域的性能突飛猛進。 Openai聲稱GPT-4.5的規模已賦予了“更深的世界知識”和“更高的情商”。然而,有一些暗示,從擴展到擴展的回報可能會減少。在幾個AI基準測試中,GPT-4.5落後於DeepSeek,Anthropic甚至Openai本身等公司的新推理模型。
此外,運行GPT-4.5的價格高昂。 Openai承認它是如此昂貴,以至於他們考慮是否長期通過其API來保持它。開發人員將為每百萬個輸入代幣支付75美元,每百萬個產量令牌為150美元,與價格更便宜的GPT-4O形成鮮明對比,GPT-4O的價格僅為每百萬美元的投入令牌2550美元和每百萬美元的產出代幣。
Openai在博客文章中分享道:“我們將分享GPT -4.5作為研究預覽,以更好地了解其優勢和局限性。” “我們仍在探索它的全部潛力,並很高興看到人們將如何以意想不到的方式使用它。”
混合性能
Openai很明顯,GPT-4.5並不是要取代驅動大部分API和CHATGPT的主力模型GPT-4O。雖然GPT-4.5可以處理文件和圖像上傳並使用Chatgpt的Canvas工具,但目前不支持Chatgpt現實的雙向語音模式之類的功能。
從明亮的一面來看,GPT-4.5在OpenAI的SimpleQA基準測試中勝過GPT-4O和許多其他模型,該基準測試了AI模型在直接,事實問題上。 Openai還聲稱,GPT-4.5的幻覺量低於大多數型號,從理論上講,這應該使製造信息的可能性降低。
有趣的是,OpenAI並未在SimpleQA結果中包括其表現最佳的推理模型之一。一位OpenAI發言人告訴TechCrunch,他們尚未公開報告深入研究在此基準測試中的表現,並且不認為這是相關的比較。但是,困惑的深度研究模型與OpenAI對其他基準測試的深入研究相似,實際上在這種事實準確性測試的測試中遠遠超出了GPT-4.5。
Openai還擁有GPT-4.5在質量上優於其他模型,而在基準測試的領域(例如了解人類意圖)。他們聲稱GPT-4.5以更溫暖,更自然的語氣做出反應,並且在寫作和設計等創意任務上表現良好。
在非正式測試中,OpenAI詢問了GPT-4.5,以及其他兩種型號GPT-4O和O3-Mini,以SVG格式創建獨角獸。只有GPT-4.5才能產生類似於獨角獸的東西。
Openai在他們的博客文章中寫道:“我們期待通過此版本獲得更完整的GPT-4.5功能圖片,因為我們認識到學術基準並不總是反映現實世界中的有用性。”

GPT-4.5的情緒智力在行動中。圖片學分:OpenAI 擴展法律挑戰
Openai聲稱GPT -4.5是“在無監督學習中可能的邊界”。然而,它的局限性似乎支持了專家對所謂的預訓練規律可能達到限制的越來越多的懷疑。
Openai聯合創始人兼前首席科學家Ilya Sutskever在12月表示,“我們已經達到了峰值數據”,並且“眾所周知,這將毫無疑問地結束”。他的評論回應了11月AI投資者,創始人和研究人員的擔憂。
為了應對這些挑戰,該行業(包括OpenAI)轉向了推理模型,這些模型需要更長的時間來執行任務,但提供了更一致的結果。通過允許推理模型更多的時間和計算能力通過問題“思考”,AI實驗室認為它們可以顯著增強模型功能。
Openai計劃最終將其GPT系列與其“ O”推理系列合併,從今年晚些時候GPT-5開始。儘管培訓成本,延遲和未滿足的內部期望,GPT-4.5可能並沒有單獨主張AI基準冠冕。但是Openai可能將其視為邁向更強大的事情的關鍵一步。




Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!




Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.




Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?




Just tried out GPT-4.5 'Orion' and wow, it's a beast! The responses are so detailed and nuanced, it's like having a super-smart friend on speed dial. Only thing is, it's a bit too advanced for my simple questions sometimes 🤓. Still, a must-try for AI enthusiasts!




GPT-4.5『オリオン』を試してみたけど、すごいね!回答が詳細でニュアンスも豊か、まるで超賢い友達がすぐそばにいるみたい。ただ、私の簡単な質問にはちょっと高度すぎるかな🤓。それでも、AIファンには試してほしいよ!




¡GPT-4.5 'Orion' es una bestia! He estado jugando con él y los resultados son impresionantes. ¿La edición silenciosa en el white paper? Movimiento astuto, OpenAI. ¡No puedo esperar a ver qué más tienen en mente! 🚀












