选项
首页
新闻
AI扩展突破由专家质疑

AI扩展突破由专家质疑

2025-04-10
97

AI扩展突破由专家质疑

社交媒体上有些关于研究人员发现新AI“扩展法则”的讨论,但专家们对此持保留态度。AI扩展法则,更像是非正式指南,显示AI模型在投入更多数据和计算能力后性能提升。直到大约一年前,主流趋势是“预训练”——即在更大数据集上训练更大模型。这仍然有效,但现在又多了两种扩展法则:后训练扩展,专注于调整模型行为;测试时扩展,通过推理时增加计算能力提升模型“推理”能力(例如R1模型)。

最近,谷歌和加州大学伯克利分校的研究人员发表了一篇论文,网上一些人称之为第四法则:“推理时搜索”。该方法让模型同时生成多个可能答案,然后选择最佳答案。研究人员称,这能提升旧模型(如谷歌的Gemini 1.5 Pro)的性能,在科学和数学基准测试中击败OpenAI的o1-preview“推理”模型。

谷歌博士研究员、论文合著者Eric Zhao在X上表示,通过随机采样200个响应并让模型自我验证,Gemini 1.5——他戏称“2024年初古老模型”——能超越o1-preview,甚至接近o1。他指出,自我验证随规模扩大变得更简单,这有些反直觉但很酷。

但并非所有人都信服。阿尔伯塔大学AI研究员兼助理教授Matthew Guzdial对TechCrunch表示,这种方法在有可靠答案评估方式时效果最好。但大多数问题并非如此简单。他说:“如果我们无法编写代码定义需求,就无法使用[推理时]搜索。对于通用语言交互,我们无法做到……这通常不是解决大多数问题的好方法。”

Zhao回应称,他们的论文实际研究了没有明确答案评估方式的情况,模型需自行判断。他认为,有无明确评估方式的差距会随规模扩大而缩小。

伦敦国王学院研究学者Mike Cook支持Guzdial的观点,称推理时搜索并未真正提升模型推理能力,更像是弥补模型自信错误的权宜之计。他指出,如果模型有5%的错误率,检查200次尝试应更容易发现错误。

这对AI行业可能有些打击,行业一直在寻找不花大价钱提升模型“推理”能力的方法。论文作者指出,推理模型解决一个数学问题可能耗费数千美元计算成本。

扩展技术的研究远未结束。

更新于3月20日太平洋时间上午5:12:补充了研究合著者Eric Zhao的评论,他对一位独立研究者的批评意见表示异议。

相关文章
微软研究揭示AI模型在软件调试中的局限性 微软研究揭示AI模型在软件调试中的局限性 来自OpenAI、Anthropic和其他领先AI实验室的AI模型越来越多地用于编码任务。谷歌首席执行官桑达尔·皮查伊在十月指出,AI在公司中生成25%的新代码,而Meta首席执行官马克·扎克伯格计划在社交媒体巨头内部广泛实施AI编码工具。然而,即使是表现最好的模型也难以修复经验丰富的开发者轻松处理的软件错误。微软研发部门近期开展的一项微软研究显示,像Anthropic的Claude 3.7 So
AI驱动的解决方案可显著减少全球碳排放 AI驱动的解决方案可显著减少全球碳排放 伦敦经济学院与Systemiq的最新研究显示,人工智能可在不牺牲现代便利的情况下大幅降低全球碳排放,使AI成为应对气候变化的重要盟友。研究指出,仅在三个领域应用智能AI,到2035年每年可减少32亿至54亿吨温室气体排放。与普遍担忧相反,这些减排量将远超AI运行产生的碳足迹。题为《绿色与智能:AI在气候转型中的作用》的报告将AI视为构建可持续且包容性经济的变革力量,而非仅是渐进式改进的工具。净零排
新研究揭示大语言模型实际记忆的数据量 新研究揭示大语言模型实际记忆的数据量 AI模型实际记忆了多少?新研究揭示惊人见解我们都知道,像ChatGPT、Claude和Gemini这样的大型语言模型(LLMs)是在海量数据集上训练的——包括来自书籍、网站、代码,甚至图像和音频等多媒体的数万亿字词。但这些数据到底发生了什么?这些模型是真正理解语言,还是仅仅在复述记忆的片段?来自Meta、Google DeepMind、Cornell和NVIDIA的一项突破性新研究终于给出了具体答
评论 (35)
0/200
DanielThomas
DanielThomas 2025-04-24 07:49:41

AI 스케일링 돌파구는 멋지게 들리지만, 전문가들은 회의적이에요. 🤔 이제 뭘 믿어야 할지 모르겠어요. 그냥 과대광고일까요? 지켜볼게요, 하지만 기대는 하지 않을게요. 😴

BenRoberts
BenRoberts 2025-04-24 02:12:49

This AI scaling law thing sounds cool, but it's hard to get excited when experts are so skeptical. It's like they're saying, 'Sure, it's interesting, but let's not get carried away.' I guess we'll see if it's the real deal or just another hype train. 🤔

PatrickMartinez
PatrickMartinez 2025-04-22 03:31:56

Essa história de lei de escalabilidade de IA parece legal, mas é difícil se empolgar quando os especialistas são tão céticos. Parece que eles estão dizendo, 'Sim, é interessante, mas não vamos nos empolgar muito'. Vamos ver se é verdade ou só mais um hype. 🤔

JohnYoung
JohnYoung 2025-04-20 08:36:43

AI 스케일링 법칙에 대한 소식은 흥미롭지만, 전문가들이 회의적이라서 흥분하기 어려워. '재미있지만 너무 기대하지 마세요'라는 느낌이야. 실제로 어떻게 될지 지켜봐야겠네. 🤔

HaroldMoore
HaroldMoore 2025-04-17 19:24:24

AIのスケーリングブレイクスルーは面白そうだけど、専門家は懐疑的。🤔 もう何を信じればいいのかわからない。ただの誇大広告かも?注目はするけど、期待はしないよ。😴

AlbertLee
AlbertLee 2025-04-16 23:25:29

El avance en la escala de IA suena genial, pero todavía no lo compro. Es todo un hype en las redes sociales, pero los expertos son escépticos. Esperaré más pruebas sólidas antes de subirme al carro. 🤔

返回顶部
OR