AI推理模型進展或於2026年趨平,Epoch AI研究顯示
非營利AI研究機構Epoch AI的一項研究指出,AI領域可能很快將面臨推理AI模型性能顯著提升的挑戰。報告預測,這些模型的進展可能在明年內放緩。
高級推理模型,如OpenAI的o3,近期在AI基準測試中推動了顯著的進步,特別是在數學和編碼任務方面。這些模型利用增加的計算能力來提升性能,儘管這通常導致比傳統模型更長的處理時間。
推理模型的創建過程是先在海量數據集上訓練標準模型,隨後進行強化學習,為模型提供反饋以精進其問題解決能力。
根據Epoch的說法,像OpenAI這樣領先的AI實驗室尚未在推理模型開發的強化學習階段大量使用計算資源。
這一趨勢正在改變。OpenAI透露,其用於訓練o3的計算能力大約是其前身o1的十倍,Epoch認為這大部分資源被分配到強化學習。OpenAI研究員Dan Roberts最近表示,公司計劃進一步優先考慮強化學習,可能使用比初始模型訓練更多的計算資源。
然而,Epoch指出,強化學習可應用的計算能力存在上限。

Epoch AI研究顯示,推理模型訓練的規模擴展可能很快面臨限制。圖片來源:Epoch AI Epoch的分析師兼研究作者Josh You指出,標準AI模型訓練的性能增益目前每年翻四倍,而強化學習的增益每三到五個月增長十倍。他預測,推理模型的進展到2026年可能與整體AI進展趨於一致。
TechCrunch Sessions: AI展示
預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。
TechCrunch Sessions: AI展示
預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。
加州伯克利 | 6月5日起 立即預訂Epoch的研究依賴於某些假設,並納入了AI行業領袖的公開聲明。研究還強調,推理模型的規模擴展可能面臨計算限制以外的其他障礙,如高昂的研究間接成本。
“持續的研究成本可能限制推理模型的可擴展性,”You解釋道。“由於快速的計算規模擴展是其進展的關鍵因素,這值得密切關注。”
任何推理模型可能很快達到性能上限的跡象,都可能在AI行業中引發關注,該行業已對其開發投入了大量資金。研究已顯示,這些模型儘管運行成本高昂,但存在顯著缺陷,包括比某些傳統模型更容易產生不準確的輸出。
相關文章
著名的AI專家揭示了旨在替代全球勞動力的有爭議的創業公司
矽谷的一家初創公司每隔一段時間都帶有一場宣教宣言如此奇怪,以至於很難說它是真實的還是只是在行業中取笑。 Enter Mechanicize,由著名的AI研究員Tamay Besiroglu領導的一項新型企業,在此之後引發了X上的辯論
Chatgpt的能源使用低於預期
來自Openai的聊天機器人Chatgpt可能不是我們認為的能量吉茲勒。但是,根據一項新的研究,非營利性研究小組EPOCH AI在弄清楚Jui多少jui時,它的能源使用量可能會有很大差異。
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
相關專題推薦
評論 (7)
0/500
Diese Studie wirft wichtige Fragen auf. Wenn das Wachstum wirklich 2026 stagniert, müssen wir uns fragen: Investieren wir zu viel in immer größere Modelle, statt in effizientere Architekturen? Vielleicht ist das ein Weckruf für die Branche, sich auf andere Aspekte wie Energieverbrauch oder praktische Anwendungen zu konzentrieren. Spannend, wohin die Reise geht! 🤔
Mind-blowing study! If AI reasoning hits a wall by 2026, what’s next? Kinda scary to think we might be maxing out so soon. 😬
This AI plateau talk is wild! If reasoning models hit a wall by 2026, what’s next? Kinda feels like we’re racing to the moon but might run out of fuel. 😅 Curious if this’ll push devs to get creative or just lean harder on hardware.
This AI plateau talk is wild! 🤯 Feels like we’re hitting a tech ceiling already. Wonder if it’s a real limit or just a pause before the next big leap?
非營利AI研究機構Epoch AI的一項研究指出,AI領域可能很快將面臨推理AI模型性能顯著提升的挑戰。報告預測,這些模型的進展可能在明年內放緩。
高級推理模型,如OpenAI的o3,近期在AI基準測試中推動了顯著的進步,特別是在數學和編碼任務方面。這些模型利用增加的計算能力來提升性能,儘管這通常導致比傳統模型更長的處理時間。
推理模型的創建過程是先在海量數據集上訓練標準模型,隨後進行強化學習,為模型提供反饋以精進其問題解決能力。
根據Epoch的說法,像OpenAI這樣領先的AI實驗室尚未在推理模型開發的強化學習階段大量使用計算資源。
這一趨勢正在改變。OpenAI透露,其用於訓練o3的計算能力大約是其前身o1的十倍,Epoch認為這大部分資源被分配到強化學習。OpenAI研究員Dan Roberts最近表示,公司計劃進一步優先考慮強化學習,可能使用比初始模型訓練更多的計算資源。
然而,Epoch指出,強化學習可應用的計算能力存在上限。

Epoch的分析師兼研究作者Josh You指出,標準AI模型訓練的性能增益目前每年翻四倍,而強化學習的增益每三到五個月增長十倍。他預測,推理模型的進展到2026年可能與整體AI進展趨於一致。
TechCrunch Sessions: AI展示
預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。
TechCrunch Sessions: AI展示
預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。
加州伯克利 | 6月5日起 立即預訂Epoch的研究依賴於某些假設,並納入了AI行業領袖的公開聲明。研究還強調,推理模型的規模擴展可能面臨計算限制以外的其他障礙,如高昂的研究間接成本。
“持續的研究成本可能限制推理模型的可擴展性,”You解釋道。“由於快速的計算規模擴展是其進展的關鍵因素,這值得密切關注。”
任何推理模型可能很快達到性能上限的跡象,都可能在AI行業中引發關注,該行業已對其開發投入了大量資金。研究已顯示,這些模型儘管運行成本高昂,但存在顯著缺陷,包括比某些傳統模型更容易產生不準確的輸出。
著名的AI專家揭示了旨在替代全球勞動力的有爭議的創業公司
矽谷的一家初創公司每隔一段時間都帶有一場宣教宣言如此奇怪,以至於很難說它是真實的還是只是在行業中取笑。 Enter Mechanicize,由著名的AI研究員Tamay Besiroglu領導的一項新型企業,在此之後引發了X上的辯論
Chatgpt的能源使用低於預期
來自Openai的聊天機器人Chatgpt可能不是我們認為的能量吉茲勒。但是,根據一項新的研究,非營利性研究小組EPOCH AI在弄清楚Jui多少jui時,它的能源使用量可能會有很大差異。
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
Diese Studie wirft wichtige Fragen auf. Wenn das Wachstum wirklich 2026 stagniert, müssen wir uns fragen: Investieren wir zu viel in immer größere Modelle, statt in effizientere Architekturen? Vielleicht ist das ein Weckruf für die Branche, sich auf andere Aspekte wie Energieverbrauch oder praktische Anwendungen zu konzentrieren. Spannend, wohin die Reise geht! 🤔
Mind-blowing study! If AI reasoning hits a wall by 2026, what’s next? Kinda scary to think we might be maxing out so soon. 😬
This AI plateau talk is wild! If reasoning models hit a wall by 2026, what’s next? Kinda feels like we’re racing to the moon but might run out of fuel. 😅 Curious if this’ll push devs to get creative or just lean harder on hardware.
This AI plateau talk is wild! 🤯 Feels like we’re hitting a tech ceiling already. Wonder if it’s a real limit or just a pause before the next big leap?





首頁






