選項
首頁
新聞
OpenAI啟動GPT-4.5'Orion':迄今為止其最大的AI模型

OpenAI啟動GPT-4.5'Orion':迄今為止其最大的AI模型

2025-04-10
216

PT下午2:40更新:GPT-4.5發布後數小時,Openai對AI模型的白皮書進行了安靜的編輯。他們刪除了一條線,說“ GPT-4.5不是前沿AI模型”。您仍然可以在這裡訪問原始的白皮書。以下是原始文章。

週四,Openai撤回了GPT-4.5上的窗簾,這是備受期待的AI模型,該模型由代碼名稱Orion。來自OpenAI的最新龐然大物已經接受了空前數量的計算能力和數據的培訓,使其與前身區分開來。

儘管尺度令人印象深刻,但Openai的白皮書最初表示,他們並不認為GPT-4.5是邊境模型。但是,此聲明已被刪除,使我們想知道該模型的真正潛力。

從周四開始,作為研究預覽的一部分,OpenAI的Premium $ 200售價Chatgpt Pro的訂閱者將首先品嚐GPT-4.5。 OpenAI發言人說,OpenAI的付費API層的開發人員今天可以開始使用GPT-4.5,而擁有Chatgpt Plus和ChatGpt團隊訂閱的開發人員應該期望下周某個時候訪問。

科技界一直在嗡嗡作響,將其視為是否仍在含水的傳統AI培訓方法的測試。 GPT-4.5遵循與其前任相同的劇本,依靠無監督學習階段的計算能力和數據的巨大增加,稱為預培訓。

過去,擴展導致跨越數學,寫作和編碼等各個領域的性能突飛猛進。 Openai聲稱GPT-4.5的規模已賦予了“更深的世界知識”和“更高的情商”。然而,有一些暗示,從擴展到擴展的回報可能會減少。在幾個AI基準測試中,GPT-4.5落後於DeepSeek,Anthropic甚至Openai本身等公司的新推理模型。

此外,運行GPT-4.5的價格高昂。 Openai承認它是如此昂貴,以至於他們考慮是否長期通過其API來保持它。開發人員將為每百萬個輸入代幣支付75美元,每百萬個產量令牌為150美元,與價格更便宜的GPT-4O形成鮮明對比,GPT-4O的價格僅為每百萬美元的投入令牌2550美元和每百萬美元的產出代幣。

Openai在博客文章中分享道:“我們將分享GPT -4.5作為研究預覽,以更好地了解其優勢和局限性。” “我們仍在探索它的全部潛力,並很高興看到人們將如何以意想不到的方式使用它。”

混合性能

Openai很明顯,GPT-4.5並不是要取代驅動大部分API和CHATGPT的主力模型GPT-4O。雖然GPT-4.5可以處理文件和圖像上傳並使用Chatgpt的Canvas工具,但目前不支持Chatgpt現實的雙向語音模式之類的功能。

從明亮的一面來看,GPT-4.5在OpenAI的SimpleQA基準測試中勝過GPT-4O和許多其他模型,該基準測試了AI模型在直接,事實問題上。 Openai還聲稱,GPT-4.5的幻覺量低於大多數型號,從理論上講,這應該使製造信息的可能性降低。

有趣的是,OpenAI並未在SimpleQA結果中包括其表現最佳的推理模型之一。一位OpenAI發言人告訴TechCrunch,他們尚未公開報告深入研究在此基準測試中的表現,並且不認為這是相關的比較。但是,困惑的深度研究模型與OpenAI對其他基準測試的深入研究相似,實際上在這種事實準確性測試的測試中遠遠超出了GPT-4.5。

SimpleQA基準標記:圖像學分:OpenAi
在SWE Bench驗證的基準的一部分編碼問題中,GPT-4.5的性能類似於GPT-4O和O3-Mini,但距離OpenAI的深入研究和眾多的Claude 3.7十四行詩也沒有。在另一項編碼測試中,OpenAI的SWE-Lancer基準測量了AI模型開發完整軟件功能的能力,GPT-4.5的表現均優於GPT-4O和O3-Mini,但並未超過深入的研究。

OpenAI的SWE Bench驗證的基準測試。圖片信用:OpenAI
Openai的Swe-Lancer鑽石基準。圖像學分:OpenAI
儘管GPT-4.5與O3-Mini,DeepSeek的R1和Claude 3.7十四行詩(如AIME和GPQA)等領先的AI推理模型的性能完全不符,但它確實與在同一測試中領先的非常規模型相抵觸。這表明GPT-4.5在與數學和科學相關的任務中表現出色。

Openai還擁有GPT-4.5在質量上優於其他模型,而在基準測試的領域(例如了解人類意圖)。他們聲稱GPT-4.5以更溫暖,更自然的語氣做出反應,並且在寫作和設計等創意任務上表現良好。

在非正式測試中,OpenAI詢問了GPT-4.5,以及其他兩種型號GPT-4O和O3-Mini,以SVG格式創建獨角獸。只有GPT-4.5才能產生類似於獨角獸的東西。

左:GPT-4.5,中間:GPT-4O,右:O3-Mini。圖像學分:OpenAi
在另一項測試中,OpenAI提示GPT-4.5和其他模型對提示做出回應:“在未能完成測試後,我經歷了艱難的時期。”雖然GPT-4O和O3-Mini提供了有用的信息,但GPT-4.5的反應在社會上是最合適的。

Openai在他們的博客文章中寫道:“我們期待通過此版本獲得更完整的GPT-4.5功能圖片,因為我們認識到學術基準並不總是反映現實世界中的有用性。”

GPT-4.5的情緒智力在行動中。圖片學分:OpenAI
擴展法律挑戰

Openai聲稱GPT -4.5是“在無監督學習中可能的邊界”。然而,它的局限性似乎支持了專家對所謂的預訓練規律可能達到限制的越來越多的懷疑。

Openai聯合創始人兼前首席科學家Ilya Sutskever在12月表示,“我們已經達到了峰值數據”,並且“眾所周知,這將毫無疑問地結束”。他的評論回應了11月AI投資者,創始人和研究人員的擔憂。

為了應對這些挑戰,該行業(包括OpenAI)轉向了推理模型,這些模型需要更長的時間來執行任務,但提供了更一致的結果。通過允許推理模型更多的時間和計算能力通過問題“思考”,AI實驗室認為它們可以顯著增強模型功能。

Openai計劃最終將其GPT系列與其“ O”推理系列合併,從今年晚些時候GPT-5開始。儘管培訓成本,延遲和未滿足的內部期望,GPT-4.5可能並沒有單獨主張AI基準冠冕。但是Openai可能將其視為邁向更強大的事情的關鍵一步。

相關文章
非營利組織利用 AI 代理提升慈善募款工作 非營利組織利用 AI 代理提升慈善募款工作 當各大科技公司將人工智慧「代理」推廣為企業生產力的助推器時,一家非營利組織正在展示人工智慧在社會公益方面的潛力。由 Open Philanthropy 支持的慈善研究組織 Sage Future 最近進行了一項創新實驗,展示 AI 模型如何協同進行慈善募款。該非營利組織將 OpenAI 的 GPT-4o 與 o1,以及 Anthropic 的 Claude 3.6 與 3.7 Sonnet 等
頂尖 AI 實驗室警告人類正在失去理解 AI 系統的能力 頂尖 AI 實驗室警告人類正在失去理解 AI 系統的能力 來自 OpenAI、Google DeepMind、Anthropic 和 Meta 的研究人員,史無前例地展現團結,擱置競爭分歧,就負責任的 AI 開發發出集體警告。來自這些典型競爭組織的 40 多位頂尖科學家共同撰寫了一份突破性的研究論文,強調確保 AI 決策過程透明化的窗口正在快速關閉。此次合作的重點在於現代人工智能系統的一項關鍵發展 - 在產生最終輸出之前,以人類可讀的語言闡明推理過程的新
ChatGPT 新增 Google Drive 和 Dropbox 整合功能以存取檔案 ChatGPT 新增 Google Drive 和 Dropbox 整合功能以存取檔案 ChatGPT 利用新的企業功能增強生產力OpenAI 發表了兩項強大的新功能,將 ChatGPT 轉型為全面的企業生產力工具:自動化會議記錄和無縫雲儲存整合。革命性的錄音功能新推出的 「記錄模式 」可自動轉錄和分析以下內容:重要的商務會議有創意的腦力激盪會議 個人思考過程此優質功能目前為 ChatGPT 團隊訂閱者專屬 (每位使用者每月 $25),可提供:精確、有時
評論 (61)
0/200
GeorgeCarter
GeorgeCarter 2025-08-22 17:01:17

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🤔

BruceWilson
BruceWilson 2025-08-19 11:01:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky edit to the white paper? Shady move, OpenAI. Makes me wonder what else they're hiding. Still, I'm hyped to see what this model can do! 😎

BruceBrown
BruceBrown 2025-08-12 02:01:05

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows—why hide that it’s not a frontier model? 🤔 Makes me wonder what OpenAI’s cooking behind the scenes!

JeffreyRamirez
JeffreyRamirez 2025-08-07 03:01:00

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!

RalphPerez
RalphPerez 2025-08-05 23:01:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.

WillPerez
WillPerez 2025-07-23 12:59:29

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?

回到頂部
OR