選項
首頁
新聞
AI推理模型進展或於2026年趨平,Epoch AI研究顯示

AI推理模型進展或於2026年趨平,Epoch AI研究顯示

2025-07-28
153

非營利AI研究機構Epoch AI的一項研究指出,AI領域可能很快將面臨推理AI模型性能顯著提升的挑戰。報告預測,這些模型的進展可能在明年內放緩。

高級推理模型,如OpenAI的o3,近期在AI基準測試中推動了顯著的進步,特別是在數學和編碼任務方面。這些模型利用增加的計算能力來提升性能,儘管這通常導致比傳統模型更長的處理時間。

推理模型的創建過程是先在海量數據集上訓練標準模型,隨後進行強化學習,為模型提供反饋以精進其問題解決能力。

根據Epoch的說法,像OpenAI這樣領先的AI實驗室尚未在推理模型開發的強化學習階段大量使用計算資源。

這一趨勢正在改變。OpenAI透露,其用於訓練o3的計算能力大約是其前身o1的十倍,Epoch認為這大部分資源被分配到強化學習。OpenAI研究員Dan Roberts最近表示,公司計劃進一步優先考慮強化學習,可能使用比初始模型訓練更多的計算資源。

然而,Epoch指出,強化學習可應用的計算能力存在上限。

Epoch推理模型訓練
Epoch AI研究顯示,推理模型訓練的規模擴展可能很快面臨限制。圖片來源:Epoch AI

Epoch的分析師兼研究作者Josh You指出,標準AI模型訓練的性能增益目前每年翻四倍,而強化學習的增益每三到五個月增長十倍。他預測,推理模型的進展到2026年可能與整體AI進展趨於一致。

TechCrunch Sessions: AI展示

預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。

TechCrunch Sessions: AI展示

預留您的TechCrunch Sessions: AI展示空間,向超過1,200名決策者展示您的創新成果,費用不貴。名額開放至5月9日或額滿為止。

加州伯克利 | 6月5日起 立即預訂

Epoch的研究依賴於某些假設,並納入了AI行業領袖的公開聲明。研究還強調,推理模型的規模擴展可能面臨計算限制以外的其他障礙,如高昂的研究間接成本。

“持續的研究成本可能限制推理模型的可擴展性,”You解釋道。“由於快速的計算規模擴展是其進展的關鍵因素,這值得密切關注。”

任何推理模型可能很快達到性能上限的跡象,都可能在AI行業中引發關注,該行業已對其開發投入了大量資金。研究已顯示,這些模型儘管運行成本高昂,但存在顯著缺陷,包括比某些傳統模型更容易產生不準確的輸出。

相關文章
著名的AI專家揭示了旨在替代全球勞動力的有爭議的創業公司 著名的AI專家揭示了旨在替代全球勞動力的有爭議的創業公司 矽谷的一家初創公司每隔一段時間都帶有一場宣教宣言如此奇怪,以至於很難說它是真實的還是只是在行業中取笑。 Enter Mechanicize,由著名的AI研究員Tamay Besiroglu領導的一項新型企業,在此之後引發了X上的辯論
Chatgpt的能源使用低於預期 Chatgpt的能源使用低於預期 來自Openai的聊天機器人Chatgpt可能不是我們認為的能量吉茲勒。但是,根據一項新的研究,非營利性研究小組EPOCH AI在弄清楚Jui多少jui時,它的能源使用量可能會有很大差異。
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易 Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易 隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
相關專題推薦
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
教育與學習 最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程
最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師,幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單,獲得強大而具有變革性的指導。透過對比免費和付費選項,並結合實際應用案例進行了解,今天就開啟你的資料科學精通之路吧。

10 個工具
xix.ai
聊天機器人 最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信
最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信

在 XIX.AI 探索 2026 年最頂尖的 AI 調情與對話訓練工具。我們精心挑選、評價最高的精選清單,能助您即時建立社交魅力與自信。探索這些必試且能徹底改變遊戲規則的工具,並透過免費與付費版本的比較,以及每週更新的排行榜,立即解鎖您的社交優勢。

10 個工具
xix.ai
代碼 最適合自動化單元測試的最佳AI工具:一鍵生成Jest、PyTest和JUnit測試用例
最適合自動化單元測試的最佳AI工具:一鍵生成Jest、PyTest和JUnit測試用例

探索2026年最新評選出的頂級AI工具,這些工具專為自動化單元測試而設計。我們精心挑選了那些功能強大、能夠改變開發流程的工具,它們能夠幫助您快速生成Jest、PyTest和JUnit測試用例。在XIX.AI平臺上,您可以免費檢視各種選項,並透過實際測試結果以及每週更新的排名來了解它們的優劣。立即利用這些AI工具,提升您的開發效率吧!

10 個工具
xix.ai
評論 (7)
0/500
RoyMartínez
RoyMartínez 2026-04-15 04:00:52

Diese Studie wirft wichtige Fragen auf. Wenn das Wachstum wirklich 2026 stagniert, müssen wir uns fragen: Investieren wir zu viel in immer größere Modelle, statt in effizientere Architekturen? Vielleicht ist das ein Weckruf für die Branche, sich auf andere Aspekte wie Energieverbrauch oder praktische Anwendungen zu konzentrieren. Spannend, wohin die Reise geht! 🤔

WillieHernández
WillieHernández 2025-10-27 22:30:35

この研究結果はちょっと怖いな…😅 推論AIの限界が見えてきたってこと?企業は次のブレークスルーをどうやって生み出すんだろう。個人的には倫理面の議論がもっと進んでほしい。

PeterPerez
PeterPerez 2025-08-26 13:25:25

Mind-blowing study! If AI reasoning hits a wall by 2026, what’s next? Kinda scary to think we might be maxing out so soon. 😬

RyanGonzalez
RyanGonzalez 2025-08-24 01:01:22

This AI plateau talk is wild! If reasoning models hit a wall by 2026, what’s next? Kinda feels like we’re racing to the moon but might run out of fuel. 😅 Curious if this’ll push devs to get creative or just lean harder on hardware.

AvaPhillips
AvaPhillips 2025-08-20 17:01:15

This AI plateau talk is wild! 🤯 Feels like we’re hitting a tech ceiling already. Wonder if it’s a real limit or just a pause before the next big leap?

EricMiller
EricMiller 2025-08-20 15:01:19

Wow, AI progress hitting a plateau by 2026? That’s wild! I thought we’d keep zooming toward super-smart machines, but maybe it’s time for a new breakthrough to shake things up. 🧠

OR