選項
首頁
消息
AI擴展突破由專家質疑

AI擴展突破由專家質疑

2025-04-10
96

AI擴展突破由專家質疑

社交媒體對研究人員發現了新的AI“擴展法”,但專家們正在用鹽分服用它。 AI縮放定律更像是非正式的準則,它表明,當您向其投入更多數據和計算功率時,AI模型如何變得更好。直到大約一年前,最大的趨勢都是關於“預培訓”的 - 基本上,在更大的數據集中培訓更大的模型。這仍然是一回事,但是現在我們在組合中還有另外兩個縮放定律:訓練後的縮放率,這都是關於調整模型的行為和測試時間縮放,其中涉及在推理過程中使用更多的計算能力來增強模型的“推理”功能(認為像R1這樣的模型)。最近,來自Google和UC Berkeley的研究人員放棄了一篇論文,其中一些人在線稱為第四定律:“推理時間搜索”。該方法的模型同時吐出了許多可能的查詢答案,然後選擇最好的答案。研究人員聲稱,它可以使較舊模型的性能(例如Google的Gemini 1.5 Pro)榨汁,以擊敗Openai的O1-preiview“推理”模型。埃里克·趙(Eric Zhao)是Google博士學位研究員,也是該論文的合著者之一,在X上分享了X,只需隨機抽樣200個響應並讓該模型自我驗證,Gemini 1.5(他開玩笑地稱為“ 2024年初模型”),可以超越O1-Preview,甚至接近O1。他指出,隨著擴展的規模,自我驗證變得更加容易,這是違反直覺但很酷的。但並不是每個人都相信。 AI研究人員兼艾伯塔大學助理教授Matthew Guzdial告訴TechCrunch,當您有一種可靠的方法來判斷答案時,這種方法最有效。不過,大多數問題並不是那麼簡單。他說:“如果我們不能編寫代碼來定義我們想要的東西,我們將無法使用[推理時間]搜索。對於一般語言互動之類的東西,我們不能這樣做……這通常不是實際解決大多數問題的好方法。”趙回答說,他們的論文實際上研究了您沒有明確方法來判斷答案的情況,並且該模型必須自行弄清楚。他認為,有一種清晰的判斷方式與沒有一個人可以隨著擴展而縮小的差距。倫敦國王學院的研究員邁克·庫克(Mike Cook)支持了Guzdial的觀點,他說推理時間搜索並不能真正使模型的推理變得更好。這更像是模型犯下自信錯誤的趨勢的解決方法。他指出,如果您的模型有5%的時間搞砸了,請檢查200次嘗試使這些錯誤更容易發現。對於AI行業來說,這一消息可能有點沮喪,該行業總是在尋找不破壞銀行的“推理”模型的方法。正如本文的作者指出的那樣,推理模型可以增加數千美元的計算成本,以解決一個數學問題。看來尋找新的擴展技術還遠遠沒有結束。 *更新了3/20 5:12 AM太平洋:添加了研究共同作者埃里克·趙的評論,他對批評這項工作的獨立研究人員進行了評估。
相關文章
專注於實惠增強現實的真實對焦系統 專注於實惠增強現實的真實對焦系統 顛覆基於投影的增強現實技術來自著名機構電機電子工程師學會(IEEE)的研究人員在基於投影的增強現實領域取得了突破性的進展。他們的解決方案?配備了電控可變焦鏡片(ETL)的特殊眼鏡,這些鏡片模擬人類眼睛自然感知深度的方式。這種創新的方法解決了使投影系統在受控環境中真正實用的主要障礙。想像一下走進一個房間,其中投影的3D物體看起來就像周圍的家具一樣真實。這就是該
我們如何使用AI來幫助城市應對極端熱量 我們如何使用AI來幫助城市應對極端熱量 看起來2024年可能會打破迄今為止最熱的一年的記錄,超過了2023年。這種趨勢對生活在城市熱島的人們來說尤為艱難,這些景點是在混凝土和瀝青浸泡太陽射線,然後散發出熱量的城市中的那些景點。這些區域可以溫暖
“退化”合成面可能會增強面部識別技術 “退化”合成面可能會增強面部識別技術 密歇根州立大學的研究人員提出了一種創新的方式,將合成面孔用於崇高的原因 - 增強圖像識別系統的準確性。這些合成面無代替導致深層現象的貢獻
評論 (35)
0/200
JustinJackson
JustinJackson 2025-04-11 08:00:00

The hype around this new AI scaling law is a bit overblown, if you ask me. Experts are skeptical, and I'm not surprised. It's interesting, but I'm not ready to bet the farm on it just yet. Anyone else feeling the same?

PatrickCarter
PatrickCarter 2025-04-11 08:00:00

この新しいAIスケーリング法の話題、少し大げさに感じます。専門家も懐疑的で、私も驚きません。興味深いですが、まだ全面的に信じるのは早いかなと思います。皆さんも同じ気持ちですか?

AnthonyPerez
AnthonyPerez 2025-04-11 08:00:00

이 새로운 AI 스케일링 법에 대한 과대광고는 조금 과장된 것 같아요. 전문가들도 회의적이고, 저도 놀랍지 않아요. 흥미롭긴 하지만, 아직 이것에 전부를 걸기에는 이릅니다. 다른 분들도 같은 생각이신가요?

JamesTaylor
JamesTaylor 2025-04-11 08:00:00

O hype em torno dessa nova lei de escalabilidade de IA está um pouco exagerado, se me perguntar. Os especialistas estão céticos e eu não fico surpreso. É interessante, mas ainda não estou pronto para apostar tudo nisso. Alguém mais sente o mesmo?

GeorgeEvans
GeorgeEvans 2025-04-11 08:00:00

El entusiasmo alrededor de esta nueva ley de escalabilidad de IA está un poco exagerado, si me lo preguntas. Los expertos son escépticos y no me sorprende. Es interesante, pero no estoy listo para apostar todo en esto todavía. ¿Alguien más siente lo mismo?

PaulHernández
PaulHernández 2025-04-11 08:00:00

Heard about this new AI scaling law? Sounds cool but honestly, I'm not convinced. It feels like every other week there's a new 'breakthrough' that fizzles out. Experts seem skeptical too, so I'm just gonna wait and see. Anyone else feel the same?

回到頂部
OR