AI推理模型進展或於2026年趨平,Epoch AI研究顯示
非營利AI研究機構Epoch AI的一項研究指出,AI領域可能很快將面臨推理AI模型性能顯著提升的挑戰。報告預測,這些模型的進展可能在明年內放緩。
高級推理模型,如OpenAI的o3,近期在AI基準測試中推動了顯著的進步,特別是在數學和編碼任務方面。這些模型利用增加的計算能力來提升性能,儘管這通常導致比傳統模型更長的處理時間。
推理模型的創建過程是先在海量數據集上訓練標準模型,隨後進行強化學習,為模型提供反饋以精進其問題解決能力。
根據Epoch的說法,像OpenAI這樣領先的AI實驗室尚未在推理模型開發的強化學習階段大量使用計算資源。
這一趨勢正在改變。OpenAI透露,其用於訓練o3的計算能力大約是其前身o1的十倍,Epoch認為這大部分資源被分配到強化學習。OpenAI研究員Dan Roberts最近表示,公司計劃進一步優先考慮強化學習,可能使用比初始模型訓練更多的計算資源。
然而,Epoch指出,強化學習可應用的計算能力存在上限。

Epoch AI研究顯示,推理模型訓練的規模擴展可能很快面臨限制。圖片來源:Epoch AI Epoch的分析師兼研究作者Josh You指出,標準AI模型訓練的性能增益目前每年翻四倍,而強化學習的增益每三到五個月增長十倍。他預測,推理模型的進展到2026年可能與整體AI進展趨於一致。
TechCrunch Sessions: AI展示
預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。
TechCrunch Sessions: AI展示
預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。
加州伯克利 | 6月5日起 立即預訂Epoch的研究依賴於某些假設,並納入了AI行業領袖的公開聲明。研究還強調,推理模型的規模擴展可能面臨計算限制以外的其他障礙,如高昂的研究間接成本。
“持續的研究成本可能限制推理模型的可擴展性,”You解釋道。“由於快速的計算規模擴展是其進展的關鍵因素,這值得密切關注。”
任何推理模型可能很快達到性能上限的跡象,都可能在AI行業中引發關注,該行業已對其開發投入了大量資金。研究已顯示,這些模型儘管運行成本高昂,但存在顯著缺陷,包括比某些傳統模型更容易產生不準確的輸出。
相關文章
著名的AI專家揭示了旨在替代全球勞動力的有爭議的創業公司
矽谷的一家初創公司每隔一段時間都帶有一場宣教宣言如此奇怪,以至於很難說它是真實的還是只是在行業中取笑。 Enter Mechanicize,由著名的AI研究員Tamay Besiroglu領導的一項新型企業,在此之後引發了X上的辯論
Chatgpt的能源使用低於預期
來自Openai的聊天機器人Chatgpt可能不是我們認為的能量吉茲勒。但是,根據一項新的研究,非營利性研究小組EPOCH AI在弄清楚Jui多少jui時,它的能源使用量可能會有很大差異。
Stable Diffusion 3.5:進階AI圖像創作指南
人工智能正在革新創意表達,Stable Diffusion 3.5 成為領先的 AI 圖像生成模型。此工具讓使用者能免費從文字提示創建令人驚嘆的視覺效果。無論您是數位藝術家、行銷人員還是 AI 愛好者,掌握 Stable Diffusion 3.5 將為創作引人入勝的視覺內容開啟新可能。本指南將探索其功能、變體以及如何立即開始使用。主要亮點Stable Diffusion 3.5 由 Stabil
評論 (0)
0/200
非營利AI研究機構Epoch AI的一項研究指出,AI領域可能很快將面臨推理AI模型性能顯著提升的挑戰。報告預測,這些模型的進展可能在明年內放緩。
高級推理模型,如OpenAI的o3,近期在AI基準測試中推動了顯著的進步,特別是在數學和編碼任務方面。這些模型利用增加的計算能力來提升性能,儘管這通常導致比傳統模型更長的處理時間。
推理模型的創建過程是先在海量數據集上訓練標準模型,隨後進行強化學習,為模型提供反饋以精進其問題解決能力。
根據Epoch的說法,像OpenAI這樣領先的AI實驗室尚未在推理模型開發的強化學習階段大量使用計算資源。
這一趨勢正在改變。OpenAI透露,其用於訓練o3的計算能力大約是其前身o1的十倍,Epoch認為這大部分資源被分配到強化學習。OpenAI研究員Dan Roberts最近表示,公司計劃進一步優先考慮強化學習,可能使用比初始模型訓練更多的計算資源。
然而,Epoch指出,強化學習可應用的計算能力存在上限。

Epoch的分析師兼研究作者Josh You指出,標準AI模型訓練的性能增益目前每年翻四倍,而強化學習的增益每三到五個月增長十倍。他預測,推理模型的進展到2026年可能與整體AI進展趨於一致。
TechCrunch Sessions: AI展示
預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。
TechCrunch Sessions: AI展示
預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。
加州伯克利 | 6月5日起 立即預訂Epoch的研究依賴於某些假設,並納入了AI行業領袖的公開聲明。研究還強調,推理模型的規模擴展可能面臨計算限制以外的其他障礙,如高昂的研究間接成本。
“持續的研究成本可能限制推理模型的可擴展性,”You解釋道。“由於快速的計算規模擴展是其進展的關鍵因素,這值得密切關注。”
任何推理模型可能很快達到性能上限的跡象,都可能在AI行業中引發關注,該行業已對其開發投入了大量資金。研究已顯示,這些模型儘管運行成本高昂,但存在顯著缺陷,包括比某些傳統模型更容易產生不準確的輸出。



0/200
頭號新聞
Gemini 2.5 Pro現在比Claude,GPT-4O更便宜,更便宜
2025頂級AI影片生成器:Pika Labs與其他對比
Openai增強了AI語音助手以進行更好的聊天
NotebookLM在全球範圍內擴展,添加幻燈片並增強了事實檢查
體驗AI驅動的I/O填字遊戲:經典文字遊戲中的現代轉折
創始人說
NVIDIA首席執行官闡明了對DeepSeek市場影響的誤解
AI配音:真實聲音創作終極指南
Adobe揭幕了10個專業AI代理:發現其業務應用程序
AI語音克隆:掌握語音轉換的終極指南
更多
精選
更多

Claude
認識Claude:您的AI助手智能工作是否希望您有一個知識淵博的同事,他隨時準備

Cici AI
你是否曾經好奇過Cici AI到底是什麼?讓我告訴你,它不僅僅是一個普通的AI聊

Gemini
有沒有想過關於雙子座的嗡嗡聲是什麼?讓我為您分解。雙子座是由Google Dee

DeepSeek
曾經想過什麼是全部意見?讓我為您分解。 DeepSeek不僅是另一個AI平台;無

Grok
聽說過Grok嗎?這是Xai的Nifty AI助手,這一切都是為了給您直接的勺子

ChatGPT
有沒有想過什麼是什麼?好吧,讓我為您分解它 - 聊天不僅僅是您在技術領域的普通喬

OpenAI
有沒有想過Openai周圍的嗡嗡聲是什麼?好吧,讓我為您分解。 Openai不僅

Tencent Hunyuan
騰訊hunyuan-large,是嗎?就像騰訊技術巨頭開發的AI模型的瑞士軍刀一

Qwen AI
有沒有想過Qwen AI是什麼?好吧,讓我向您介紹阿里巴巴雲的這顆寶石。 Qwe

Runway
有沒有想過如何將您的常規視頻剪輯變成非凡的東西?好吧,讓我向您介紹跑道,這是一個