AI推理模型进展可能在2026年趋于平稳,Epoch AI研究建议
非营利AI研究机构Epoch AI的研究表明,AI行业可能很快面临推理AI模型性能显著提升的挑战。报告预测,这些模型的进展可能在未来一年内减缓。
高级推理模型,如OpenAI的o3,近期在AI基准测试中推动了显著改进,特别是在数学和编码任务中。这些模型利用增加的计算能力来提升性能,尽管这通常导致比传统模型更长的处理时间。
推理模型通过在海量数据集上初步训练标准模型,然后通过强化学习提供反馈,以优化其问题解决能力。
根据Epoch的说法,领先的AI实验室,如OpenAI,尚未在推理模型开发的强化学习阶段大量使用计算资源。
这一趋势正在改变。OpenAI透露,其训练o3的计算能力约为前身o1的十倍,Epoch认为其中大部分用于强化学习。OpenAI研究员Dan Roberts最近表示,公司计划进一步优先发展强化学习,可能使用比初始模型训练更多的计算资源。
然而,Epoch指出,强化学习可应用的计算能力存在极限。

Epoch AI研究表明,推理模型训练的规模扩展可能很快面临限制。图片来源:Epoch AI Epoch分析师兼研究作者Josh You指出,标准AI模型训练的性能增益目前每年翻两番,而强化学习的增益每三到五个月增加十倍。他预测,到2026年,推理模型的进展可能与整体AI进步趋于一致。
TechCrunch Sessions: AI展示
在TC Sessions: AI预留您的展示空间,向超过1200名决策者展示您的创新,且无需高额费用。截止至5月9日或名额满为止。
TechCrunch Sessions: AI展示
在TC Sessions: AI预留您的展示空间,向超过1200名决策者展示您的创新,且无需高额费用。截止至5月9日或名额满为止。
伯克利,加州 | 6月5日起立即预订Epoch的研究依赖于某些假设,并结合了AI行业领导者的公开声明。研究还指出,推理模型的扩展可能面临计算限制以外的其他障碍,如高昂的研究间接成本。
“持续的研究成本可能限制推理模型的可扩展性,”You解释说。“由于快速计算扩展是其进步的关键因素,这需要密切关注。”
推理模型可能很快达到性能上限的任何迹象都可能在AI行业引起担忧,该行业已对其开发进行了大量投资。研究已表明,这些模型尽管运行成本高昂,但存在显著缺陷,包括比一些传统模型更容易产生不准确的输出。
相关文章
著名的AI专家揭示了旨在替代全球劳动力的有争议的创业公司
硅谷的一家初创公司每隔一段时间都带有一场宣教宣言如此奇怪,以至于很难说它是真实的还是只是在行业中取笑。 Enter Mechanicize,由著名的AI研究员Tamay Besiroglu领导的一项新型企业,在此之后引发了X上的辩论
Chatgpt的能源使用低于预期
来自Openai的聊天机器人Chatgpt可能不是我们认为的能量吉兹勒。但是,根据一项新的研究,非营利性研究小组EPOCH AI在弄清楚Jui多少jui时,它的能源使用量可能会有很大差异。
稳定扩散3.5:高级AI图像创作指南
人工智能正在革新创意表达,稳定扩散3.5作为领先的AI图像生成模型脱颖而出。该工具使用户能够免费从文本提示创建令人惊叹的视觉效果。无论你是数字艺术家、营销人员还是AI爱好者,掌握稳定扩散3.5都能为创作引人入胜的视觉内容开启新的可能性。本指南将探讨其功能、变体以及如何立即开始使用。主要亮点稳定扩散3.5,由Stability AI推出,是尖端的AI图像生成模型。它将文本提示转化为高质量图像,且免费
评论 (0)
0/200
非营利AI研究机构Epoch AI的研究表明,AI行业可能很快面临推理AI模型性能显著提升的挑战。报告预测,这些模型的进展可能在未来一年内减缓。
高级推理模型,如OpenAI的o3,近期在AI基准测试中推动了显著改进,特别是在数学和编码任务中。这些模型利用增加的计算能力来提升性能,尽管这通常导致比传统模型更长的处理时间。
推理模型通过在海量数据集上初步训练标准模型,然后通过强化学习提供反馈,以优化其问题解决能力。
根据Epoch的说法,领先的AI实验室,如OpenAI,尚未在推理模型开发的强化学习阶段大量使用计算资源。
这一趋势正在改变。OpenAI透露,其训练o3的计算能力约为前身o1的十倍,Epoch认为其中大部分用于强化学习。OpenAI研究员Dan Roberts最近表示,公司计划进一步优先发展强化学习,可能使用比初始模型训练更多的计算资源。
然而,Epoch指出,强化学习可应用的计算能力存在极限。

Epoch分析师兼研究作者Josh You指出,标准AI模型训练的性能增益目前每年翻两番,而强化学习的增益每三到五个月增加十倍。他预测,到2026年,推理模型的进展可能与整体AI进步趋于一致。
TechCrunch Sessions: AI展示
在TC Sessions: AI预留您的展示空间,向超过1200名决策者展示您的创新,且无需高额费用。截止至5月9日或名额满为止。
TechCrunch Sessions: AI展示
在TC Sessions: AI预留您的展示空间,向超过1200名决策者展示您的创新,且无需高额费用。截止至5月9日或名额满为止。
伯克利,加州 | 6月5日起立即预订Epoch的研究依赖于某些假设,并结合了AI行业领导者的公开声明。研究还指出,推理模型的扩展可能面临计算限制以外的其他障碍,如高昂的研究间接成本。
“持续的研究成本可能限制推理模型的可扩展性,”You解释说。“由于快速计算扩展是其进步的关键因素,这需要密切关注。”
推理模型可能很快达到性能上限的任何迹象都可能在AI行业引起担忧,该行业已对其开发进行了大量投资。研究已表明,这些模型尽管运行成本高昂,但存在显著缺陷,包括比一些传统模型更容易产生不准确的输出。



0/200
头条新闻
Gemini 2.5 Pro现在比Claude,GPT-4O更便宜,更便宜
2025顶级AI视频生成器:Pika Labs与其他对比
Openai增强了AI语音助手以进行更好的聊天
NotebookLM在全球范围内扩展,添加幻灯片并增强了事实检查
体验AI驱动的I/O填字游戏:经典文字游戏中的现代转折
创始人说
NVIDIA首席执行官阐明了对DeepSeek市场影响的误解
AI配音:真实声音创作终极指南
Adobe揭幕了10个专业AI代理:发现其业务应用程序
AI语音克隆:掌握语音转换的终极指南
更多
精选
更多

Claude
认识Claude:您的AI助手智能工作是否希望您有一个知识渊博的同事,他随时准备

Cici AI
你是否曾经好奇过Cici AI到底是什么?让我告诉你,它不仅仅是一个普通的AI聊

Gemini
有没有想过关于双子座的嗡嗡声是什么?让我为您分解。双子座是由Google Dee

DeepSeek
曾经想过什么是全部意见?让我为您分解。 DeepSeek不仅是另一个AI平台;无

Grok
听说过Grok吗?这是Xai的Nifty AI助手,这一切都是为了给您直接的勺子

ChatGPT
有没有想过什么是什么?好吧,让我为您分解它 - 聊天不仅仅是您在技术领域的普通乔

OpenAI
有没有想过Openai周围的嗡嗡声是什么?好吧,让我为您分解。 Openai不仅

Tencent Hunyuan
腾讯hunyuan-large,是吗?就像腾讯技术巨头开发的AI模型的瑞士军刀一

Qwen AI
有没有想过Qwen AI是什么?好吧,让我向您介绍阿里巴巴云的这颗宝石。 Qwe

Runway
有没有想过如何将您的常规视频剪辑变成非凡的东西?好吧,让我向您介绍跑道,这是一个