AI 스케일링 획기적인 전문가가 의문을 제기했습니다

소셜 미디어에는 새로운 AI "스케일링 법"을 발견하는 연구원에 대한 소셜 미디어가 있었지만 전문가들은 소금 한 덩어리로 그것을 복용하고 있습니다. 비공식적 인 가이드 라인과 비슷한 AI 스케일링 법칙은 더 많은 데이터와 컴퓨팅 파워를 던질 때 AI 모델이 어떻게 더 좋아 지는지를 보여줍니다. 약 1 년 전까지, 큰 트렌드는 "사전 훈련"에 관한 것이 었습니다. 기본적으로 더 큰 데이터 세트에서 더 큰 모델을 훈련시킵니다. 그것은 여전히 일이지만, 이제 우리는 믹스에 두 가지 더 많은 스케일링 법칙을 가지고 있습니다.이 훈련 후 스케일링은 모델의 동작을 조정하는 것과 테스트 시간 스케일링에 관한 것입니다.이 테스트 시간 스케일링은 추론 중에 더 많은 컴퓨팅 파워를 사용하여 모델의 "추론"기능을 장려하는 것입니다 (R1과 같은 모델 생각). 최근 Google과 UC Berkeley의 연구원들은 온라인에서 일부 사람들이 "추론 시간 검색"이라는 제 4 법칙을 부르고 있다는 논문을 버렸습니다. 이 방법에는 모델이 쿼리에 대한 가능한 많은 답변을 동시에 뱉어 내고 가장 좋은 답을 선택했습니다. 연구원들은 Google의 Gemini 1.5 Pro와 같은 구형 모델의 성능을 상승시켜 OpenAi의 O1- 프리뷰 "추론"과학 및 수학 벤치 마크에 대한 모델을 이길 수 있다고 주장합니다. Google 박사 학위 동료이자 논문의 공동 저자 중 한 명인 Eric Zhao는 200 개의 응답을 무작위로 샘플링하고 모델을 스스로 검증하게함으로써 Gemini 1.5를 "고대 2024 년 모델"이라고 불렀으며 O1-Preview와 가까워 질 수있었습니다. 그는 당신이 확장 할 때 자기 검증이 쉬워 졌다고 지적했다. 이는 일종의 반 직관적이지만 시원하다. 그러나 모든 사람이 확신하는 것은 아닙니다. 앨버타 대학교 (University of Alberta)의 AI 연구원이자 조교수 인 Matthew Guzdial은 TechCrunch에 답변을 판단 할 수있는 확실한 방법이있을 때이 접근법이 가장 잘 작동한다고 말했습니다. 그러나 대부분의 질문은 그렇게 간단하지 않습니다. 그는 "우리가 원하는 것을 정의하기 위해 코드를 쓸 수 없다면 [추론 시간] 검색을 사용할 수 없습니다. 일반 언어 상호 작용과 같은 것을 위해서는 이렇게 할 수 없습니다 ... 일반적으로 대부분의 문제를 실제로 해결하는 데 큰 접근법이 아닙니다." Zhao는 신문이 실제로 답을 판단 할 수있는 명확한 방법이없는 경우를보고 있으며 모델은 그 자체로 그것을 파악해야한다고 대답했습니다. 그는 명확한 판단 방법을 갖는 것의 격차와 확장 할 때 축소 될 수 있다고 주장했다. King 's College London의 연구원 인 Mike Cook은 Guzdial의 견해를 뒷받침하면서 추론 시간 검색이 실제로 모델의 추론을 개선하지는 않는다고 말했습니다. 그것은 자신감있는 실수를 저지르는 모델의 경향에 대한 해결 방법과 같습니다. 그는 당신의 모델이 5%의 시간을 엉망으로 만들면 200 번의 시도를 확인하면 실수가 더 쉽게 발견 될 수 있다고 지적했습니다. 이 뉴스는 AI 산업에 약간의 다운 너가 될 수 있으며, 이는 항상 은행을 깨지 않고 모델 "추론"을 높이는 방법을 찾기 위해 항상 사냥하고 있습니다. 논문의 저자가 언급했듯이, 추론 모델은 하나의 수학 문제를 해결하기 위해 컴퓨팅 비용으로 수천 달러를 쌓을 수 있습니다. 새로운 스케일링 기술에 대한 검색이 끝나지 않은 것 같습니다. *업데이트 된 3/20 5:12 AM Pacific : 연구 공동 저자 인 Eric Zhao의 의견이 추가되었습니다.
관련 기사
專注於實惠增強現實的真實對焦系統
顛覆基於投影的增強現實技術來自著名機構電機電子工程師學會(IEEE)的研究人員在基於投影的增強現實領域取得了突破性的進展。他們的解決方案?配備了電控可變焦鏡片(ETL)的特殊眼鏡,這些鏡片模擬人類眼睛自然感知深度的方式。這種創新的方法解決了使投影系統在受控環境中真正實用的主要障礙。想像一下走進一個房間,其中投影的3D物體看起來就像周圍的家具一樣真實。這就是該
我們如何使用AI來幫助城市應對極端熱量
看起來2024年可能會打破迄今為止最熱的一年的記錄,超過了2023年。這種趨勢對生活在城市熱島的人們來說尤為艱難,這些景點是在混凝土和瀝青浸泡太陽射線,然後散發出熱量的城市中的那些景點。這些區域可以溫暖
의견 (35)
0/200
JustinJackson
2025년 4월 11일 오전 12시 0분 0초 GMT
The hype around this new AI scaling law is a bit overblown, if you ask me. Experts are skeptical, and I'm not surprised. It's interesting, but I'm not ready to bet the farm on it just yet. Anyone else feeling the same?
0
PatrickCarter
2025년 4월 11일 오전 12시 0분 0초 GMT
この新しいAIスケーリング法の話題、少し大げさに感じます。専門家も懐疑的で、私も驚きません。興味深いですが、まだ全面的に信じるのは早いかなと思います。皆さんも同じ気持ちですか?
0
AnthonyPerez
2025년 4월 11일 오전 12시 0분 0초 GMT
이 새로운 AI 스케일링 법에 대한 과대광고는 조금 과장된 것 같아요. 전문가들도 회의적이고, 저도 놀랍지 않아요. 흥미롭긴 하지만, 아직 이것에 전부를 걸기에는 이릅니다. 다른 분들도 같은 생각이신가요?
0
JamesTaylor
2025년 4월 11일 오전 12시 0분 0초 GMT
O hype em torno dessa nova lei de escalabilidade de IA está um pouco exagerado, se me perguntar. Os especialistas estão céticos e eu não fico surpreso. É interessante, mas ainda não estou pronto para apostar tudo nisso. Alguém mais sente o mesmo?
0
GeorgeEvans
2025년 4월 11일 오전 12시 0분 0초 GMT
El entusiasmo alrededor de esta nueva ley de escalabilidad de IA está un poco exagerado, si me lo preguntas. Los expertos son escépticos y no me sorprende. Es interesante, pero no estoy listo para apostar todo en esto todavía. ¿Alguien más siente lo mismo?
0
PaulHernández
2025년 4월 11일 오전 12시 0분 0초 GMT
Heard about this new AI scaling law? Sounds cool but honestly, I'm not convinced. It feels like every other week there's a new 'breakthrough' that fizzles out. Experts seem skeptical too, so I'm just gonna wait and see. Anyone else feel the same?
0



The hype around this new AI scaling law is a bit overblown, if you ask me. Experts are skeptical, and I'm not surprised. It's interesting, but I'm not ready to bet the farm on it just yet. Anyone else feeling the same?




この新しいAIスケーリング法の話題、少し大げさに感じます。専門家も懐疑的で、私も驚きません。興味深いですが、まだ全面的に信じるのは早いかなと思います。皆さんも同じ気持ちですか?




이 새로운 AI 스케일링 법에 대한 과대광고는 조금 과장된 것 같아요. 전문가들도 회의적이고, 저도 놀랍지 않아요. 흥미롭긴 하지만, 아직 이것에 전부를 걸기에는 이릅니다. 다른 분들도 같은 생각이신가요?




O hype em torno dessa nova lei de escalabilidade de IA está um pouco exagerado, se me perguntar. Os especialistas estão céticos e eu não fico surpreso. É interessante, mas ainda não estou pronto para apostar tudo nisso. Alguém mais sente o mesmo?




El entusiasmo alrededor de esta nueva ley de escalabilidad de IA está un poco exagerado, si me lo preguntas. Los expertos son escépticos y no me sorprende. Es interesante, pero no estoy listo para apostar todo en esto todavía. ¿Alguien más siente lo mismo?




Heard about this new AI scaling law? Sounds cool but honestly, I'm not convinced. It feels like every other week there's a new 'breakthrough' that fizzles out. Experts seem skeptical too, so I'm just gonna wait and see. Anyone else feel the same?












