選項
首頁
新聞
AI擴展突破由專家質疑

AI擴展突破由專家質疑

2025-04-10
97

AI擴展突破由專家質疑

社交媒體上有些關於研究人員發現新AI「縮放法則」的討論,但專家們對此持保留態度。AI縮放三法則,更像是非正式指南,顯示AI模型在投入更多數據和計算能力時性能提升。直到大約一年前,主流趨勢是「預訓練」——基本上是使用更大數據集訓練更大模型。這仍然存在,但現在又多了兩種縮放法則:後訓練縮放,專注於調整模型行為;以及測試時縮放,涉及在推理時使用更多計算能力來提升模型的「推理」能力(例如R1模型)。

最近,來自Google和UC Berkeley的研究人員發表了一篇論文,網上一些人稱之為第四法則:「推理時搜索」。這種方法讓模型同時生成多個可能的答案,然後選出最佳答案。研究人員聲稱,這能提升舊模型(如Google的Gemini 1.5 Pro)的性能,在科學和數學基準測試中擊敗OpenAI的o1-preview「推理」模型。

Google博士研究員、論文共同作者之一Eric Zhao在X上分享,通過隨機採樣200個回答並讓模型自我驗證,Gemini 1.5——他開玩笑稱之為「古老的2024年初模型」——能超越o1-preview,甚至接近o1。他指出,隨著規模擴大,自我驗證變得更容易,這有些違反直覺但很酷。

但並非所有人都信服。阿爾伯塔大學AI研究員兼助理教授Matthew Guzdial告訴TechCrunch,這種方法在有可靠答案評判方式時效果最佳。但大多數問題並不簡單。他說:「如果我們無法編寫代碼來定義我們想要的,就無法使用[推理時]搜索。對於一般語言交互,我們做不到這一點……這通常不是解決大多數問題的好方法。」

Zhao回應說,他們的論文實際上探討了沒有明確評判方式的情況,模型必須自行解決。他認為,隨著規模擴大,有無明確評判方式之間的差距會縮小。

倫敦國王學院研究員Mike Cook支持Guzdial的觀點,認為推理時搜索並未真正提升模型的推理能力,更像是彌補模型自信錯誤的權宜之計。他指出,如果模型有5%的錯誤率,檢查200次嘗試應能更容易發現錯誤。

這對AI行業可能有些令人失望,該行業一直在尋找提升模型「推理」能力而不燒錢的方法。論文作者指出,推理模型解決一個數學問題可能花費數千美元的計算成本。

看來尋找新縮放技術的道路還遠未結束。

更新於3/20 太平洋時間上午5:12:新增了論文共同作者Eric Zhao的評論,他對一位獨立研究員的批評意見提出異議。

相關文章
微軟研究揭示AI模型在軟體除錯中的局限性 微軟研究揭示AI模型在軟體除錯中的局限性 來自OpenAI、Anthropic及其他領先AI實驗室的AI模型越來越常用於編碼任務。Google執行長Sundar Pichai於10月表示,AI在公司內生成25%的新程式碼,而Meta執行長Mark Zuckerberg則計劃在這家社群媒體巨頭中廣泛應用AI編碼工具。然而,即使是表現最佳的模型,在修復軟體錯誤時仍難以達到經驗豐富的開發者輕鬆處理的水平。微軟研發部門近期進行的微軟研究顯示,像A
AI驅動的解決方案可顯著降低全球碳排放 AI驅動的解決方案可顯著降低全球碳排放 倫敦經濟學院與Systemiq的最新研究顯示,人工智慧可在不犧牲現代便利性的前提下大幅降低全球碳排放,使AI成為對抗氣候變遷的關鍵盟友。研究指出,僅在三個領域應用智慧AI技術,到2035年每年可減少32億至54億噸的溫室氣體排放。與普遍擔憂相反,這些減排量將遠超AI運營所產生的碳足跡。題為《綠色與智慧:AI在氣候轉型中的角色》的報告,將AI視為打造可持續且包容經濟的轉型力量,而非僅僅是漸進式進展的
新研究揭示大規模語言模型實際記憶的數據量 新研究揭示大規模語言模型實際記憶的數據量 AI模型實際記憶多少?新研究揭示驚人見解我們都知道,像ChatGPT、Claude和Gemini這樣的大規模語言模型(LLMs)是在龐大數據集上訓練的——來自書籍、網站、程式碼,甚至圖像和音頻等多媒體的數兆字詞。但這些數據到底發生了什麼?這些模型真的理解語言,還是僅僅在重複記憶的片段?來自Meta、Google DeepMind、Cornell和NVIDIA的一項突破性新研究終於給出了具體答案——
評論 (35)
0/200
DanielThomas
DanielThomas 2025-04-24 07:49:41

AI 스케일링 돌파구는 멋지게 들리지만, 전문가들은 회의적이에요. 🤔 이제 뭘 믿어야 할지 모르겠어요. 그냥 과대광고일까요? 지켜볼게요, 하지만 기대는 하지 않을게요. 😴

BenRoberts
BenRoberts 2025-04-24 02:12:49

This AI scaling law thing sounds cool, but it's hard to get excited when experts are so skeptical. It's like they're saying, 'Sure, it's interesting, but let's not get carried away.' I guess we'll see if it's the real deal or just another hype train. 🤔

PatrickMartinez
PatrickMartinez 2025-04-22 03:31:56

Essa história de lei de escalabilidade de IA parece legal, mas é difícil se empolgar quando os especialistas são tão céticos. Parece que eles estão dizendo, 'Sim, é interessante, mas não vamos nos empolgar muito'. Vamos ver se é verdade ou só mais um hype. 🤔

JohnYoung
JohnYoung 2025-04-20 08:36:43

AI 스케일링 법칙에 대한 소식은 흥미롭지만, 전문가들이 회의적이라서 흥분하기 어려워. '재미있지만 너무 기대하지 마세요'라는 느낌이야. 실제로 어떻게 될지 지켜봐야겠네. 🤔

HaroldMoore
HaroldMoore 2025-04-17 19:24:24

AIのスケーリングブレイクスルーは面白そうだけど、専門家は懐疑的。🤔 もう何を信じればいいのかわからない。ただの誇大広告かも?注目はするけど、期待はしないよ。😴

AlbertLee
AlbertLee 2025-04-16 23:25:29

El avance en la escala de IA suena genial, pero todavía no lo compro. Es todo un hype en las redes sociales, pero los expertos son escépticos. Esperaré más pruebas sólidas antes de subirme al carro. 🤔

回到頂部
OR