選項
首頁
新聞
OpenAI啟動GPT-4.5'Orion':迄今為止其最大的AI模型

OpenAI啟動GPT-4.5'Orion':迄今為止其最大的AI模型

2025-04-10
278

PT下午2:40更新:GPT-4.5發布後數小時,Openai對AI模型的白皮書進行了安靜的編輯。他們刪除了一條線,說“ GPT-4.5不是前沿AI模型”。您仍然可以在這裡訪問原始的白皮書。以下是原始文章。

週四,Openai撤回了GPT-4.5上的窗簾,這是備受期待的AI模型,該模型由代碼名稱Orion。來自OpenAI的最新龐然大物已經接受了空前數量的計算能力和數據的培訓,使其與前身區分開來。

儘管尺度令人印象深刻,但Openai的白皮書最初表示,他們並不認為GPT-4.5是邊境模型。但是,此聲明已被刪除,使我們想知道該模型的真正潛力。

從周四開始,作為研究預覽的一部分,OpenAI的Premium $ 200售價Chatgpt Pro的訂閱者將首先品嚐GPT-4.5。 OpenAI發言人說,OpenAI的付費API層的開發人員今天可以開始使用GPT-4.5,而擁有Chatgpt Plus和ChatGpt團隊訂閱的開發人員應該期望下周某個時候訪問。

科技界一直在嗡嗡作響,將其視為是否仍在含水的傳統AI培訓方法的測試。 GPT-4.5遵循與其前任相同的劇本,依靠無監督學習階段的計算能力和數據的巨大增加,稱為預培訓。

過去,擴展導致跨越數學,寫作和編碼等各個領域的性能突飛猛進。 Openai聲稱GPT-4.5的規模已賦予了“更深的世界知識”和“更高的情商”。然而,有一些暗示,從擴展到擴展的回報可能會減少。在幾個AI基準測試中,GPT-4.5落後於DeepSeek,Anthropic甚至Openai本身等公司的新推理模型。

此外,運行GPT-4.5的價格高昂。 Openai承認它是如此昂貴,以至於他們考慮是否長期通過其API來保持它。開發人員將為每百萬個輸入代幣支付75美元,每百萬個產量令牌為150美元,與價格更便宜的GPT-4O形成鮮明對比,GPT-4O的價格僅為每百萬美元的投入令牌2550美元和每百萬美元的產出代幣。

Openai在博客文章中分享道:“我們將分享GPT -4.5作為研究預覽,以更好地了解其優勢和局限性。” “我們仍在探索它的全部潛力,並很高興看到人們將如何以意想不到的方式使用它。”

混合性能

Openai很明顯,GPT-4.5並不是要取代驅動大部分API和CHATGPT的主力模型GPT-4O。雖然GPT-4.5可以處理文件和圖像上傳並使用Chatgpt的Canvas工具,但目前不支持Chatgpt現實的雙向語音模式之類的功能。

從明亮的一面來看,GPT-4.5在OpenAI的SimpleQA基準測試中勝過GPT-4O和許多其他模型,該基準測試了AI模型在直接,事實問題上。 Openai還聲稱,GPT-4.5的幻覺量低於大多數型號,從理論上講,這應該使製造信息的可能性降低。

有趣的是,OpenAI並未在SimpleQA結果中包括其表現最佳的推理模型之一。一位OpenAI發言人告訴TechCrunch,他們尚未公開報告深入研究在此基準測試中的表現,並且不認為這是相關的比較。但是,困惑的深度研究模型與OpenAI對其他基準測試的深入研究相似,實際上在這種事實準確性測試的測試中遠遠超出了GPT-4.5。

SimpleQA基準標記:圖像學分:OpenAi
在SWE Bench驗證的基準的一部分編碼問題中,GPT-4.5的性能類似於GPT-4O和O3-Mini,但距離OpenAI的深入研究和眾多的Claude 3.7十四行詩也沒有。在另一項編碼測試中,OpenAI的SWE-Lancer基準測量了AI模型開發完整軟件功能的能力,GPT-4.5的表現均優於GPT-4O和O3-Mini,但並未超過深入的研究。

OpenAI的SWE Bench驗證的基準測試。圖片信用:OpenAI
Openai的Swe-Lancer鑽石基準。圖像學分:OpenAI
儘管GPT-4.5與O3-Mini,DeepSeek的R1和Claude 3.7十四行詩(如AIME和GPQA)等領先的AI推理模型的性能完全不符,但它確實與在同一測試中領先的非常規模型相抵觸。這表明GPT-4.5在與數學和科學相關的任務中表現出色。

Openai還擁有GPT-4.5在質量上優於其他模型,而在基準測試的領域(例如了解人類意圖)。他們聲稱GPT-4.5以更溫暖,更自然的語氣做出反應,並且在寫作和設計等創意任務上表現良好。

在非正式測試中,OpenAI詢問了GPT-4.5,以及其他兩種型號GPT-4O和O3-Mini,以SVG格式創建獨角獸。只有GPT-4.5才能產生類似於獨角獸的東西。

左:GPT-4.5,中間:GPT-4O,右:O3-Mini。圖像學分:OpenAi
在另一項測試中,OpenAI提示GPT-4.5和其他模型對提示做出回應:“在未能完成測試後,我經歷了艱難的時期。”雖然GPT-4O和O3-Mini提供了有用的信息,但GPT-4.5的反應在社會上是最合適的。

Openai在他們的博客文章中寫道:“我們期待通過此版本獲得更完整的GPT-4.5功能圖片,因為我們認識到學術基準並不總是反映現實世界中的有用性。”

GPT-4.5的情緒智力在行動中。圖片學分:OpenAI
擴展法律挑戰

Openai聲稱GPT -4.5是“在無監督學習中可能的邊界”。然而,它的局限性似乎支持了專家對所謂的預訓練規律可能達到限制的越來越多的懷疑。

Openai聯合創始人兼前首席科學家Ilya Sutskever在12月表示,“我們已經達到了峰值數據”,並且“眾所周知,這將毫無疑問地結束”。他的評論回應了11月AI投資者,創始人和研究人員的擔憂。

為了應對這些挑戰,該行業(包括OpenAI)轉向了推理模型,這些模型需要更長的時間來執行任務,但提供了更一致的結果。通過允許推理模型更多的時間和計算能力通過問題“思考”,AI實驗室認為它們可以顯著增強模型功能。

Openai計劃最終將其GPT系列與其“ O”推理系列合併,從今年晚些時候GPT-5開始。儘管培訓成本,延遲和未滿足的內部期望,GPT-4.5可能並沒有單獨主張AI基準冠冕。但是Openai可能將其視為邁向更強大的事情的關鍵一步。

相關文章
薩提亞·納德拉準備利用與OpenAI的新合作關係 薩提亞·納德拉準備利用與OpenAI的新合作關係 週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖 OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖 當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI 葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI 2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研
相關專題推薦
漫畫創作 AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料
AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料

2026年最新最佳AI角色建立工具:發現那些備受好評的工具,它們能夠幫助你為漫畫角色生成詳細的背景故事和視覺素材。我們精心整理的這份每週更新的列表會根據實際測試結果,對比免費與付費選項的優劣。找到這些強大且能改變創作流程的工具,幫助你塑造引人入勝的角色,提升創作效率。立即訪問XIX.AI檢視排名,找到最適合你的故事創作助手吧。

10 個工具
xix.ai
健康與養生 AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫
AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具,為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦,包含免費與付費方案的比較,以及實用經驗分享。透過 XIX.AI 的專家指南,開啟您最健康的孕期旅程。立即探索。

10 個工具
xix.ai
寫作 最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文
最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI,探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單,能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜,比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具
xix.ai
圖像編輯 用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計
用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計

2026最新推薦:探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具,幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項,檢視實際測試結果,從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析,讓您立即開始將故事視覺化呈現吧!

10 個工具
xix.ai
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
評論 (62)
0/500
JonathanMiller
JonathanMiller 2025-10-21 20:30:48

Warum ändern die heimlich die Beschreibung? 🤔 Das klingt nach Marketing-Spielchen. GPT-4.5 ist bestimmt stark, aber solche Änderungen machen mich misstrauisch. Wird da etwa die Leistung übertrieben dargestellt?

GeorgeCarter
GeorgeCarter 2025-08-22 17:01:17

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🤔

BruceWilson
BruceWilson 2025-08-19 11:01:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky edit to the white paper? Shady move, OpenAI. Makes me wonder what else they're hiding. Still, I'm hyped to see what this model can do! 😎

BruceBrown
BruceBrown 2025-08-12 02:01:05

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows—why hide that it’s not a frontier model? 🤔 Makes me wonder what OpenAI’s cooking behind the scenes!

JeffreyRamirez
JeffreyRamirez 2025-08-07 03:01:00

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!

RalphPerez
RalphPerez 2025-08-05 23:01:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.

OR