オプション
ニュース
専門家から質問されたAIスケーリングブレークスルー

専門家から質問されたAIスケーリングブレークスルー

2025年4月10日
96

専門家から質問されたAIスケーリングブレークスルー

ソーシャルメディアでは、研究者が新しいAIの「スケーリング法」を発見することについて話題がありましたが、専門家はそれを一粒の塩で服用しています。非公式のガイドラインに似たAIスケーリング法は、より多くのデータとコンピューティングパワーを投げるにつれてAIモデルがどのように良くなるかを示します。約1年前まで、大きなトレンドはすべて「トレーニング前」に関するものでした。基本的には、より大きなデータセットでより大きなモデルをトレーニングしています。それはまだ問題ですが、今ではミックスにさらに2つのスケーリング法があります。トレーニング後のスケーリングは、モデルの動作を微調整することと、モデルの「推論」機能を高めるために推論中により多くのコンピューティングパワーを使用することを含むテスト時間スケーリングです(R1のようなモデルを考えてください)。最近、GoogleとUC Berkeleyの研究者は、オンラインでの一部の人々が第4の法律「推論時間検索」と呼んでいる論文を削除しました。この方法では、モデルがクエリに対する多くの可能な回答を同時に吐き出してから、最高の回答を選択します。研究者たちは、GoogleのGemini 1.5 Proのような古いモデルのパフォーマンスをジュースにして、科学と数学のベンチマークに関するOpenaiのO1-Preview「推論」モデルを破ることができると主張しています。 Googleの博士号であり、論文の共著者の1人であるEric Zhaoは、Xで200個の応答をランダムにサンプリングし、モデルを自己検証させることにより、「古代初期の2024年モデル」を冗談で呼んで、O1-Previewを凌ぐことさえでき、さらにO1に近づくことさえできました。彼は、あなたがスケールアップするにつれて自己検証がより簡単になると指摘しました。しかし、誰もが納得しているわけではありません。アルバータ大学のAI研究者であり助教授であるマシュー・グズディアルは、TechCrunchに、答えを判断する堅実な方法があるときにこのアプローチが最適に機能すると語った。しかし、ほとんどの質問はそれほど簡単ではありません。彼は、「私たちが望むものを定義するためのコードを書くことができない場合、[推論時間]検索を使用することはできません。一般的な言語の相互作用のようなものについては、これは一般的にほとんどの問題を解決するための素晴らしいアプローチではありません。」 Zhaoは、彼らの論文が実際にあなたが答えを判断する明確な方法がない場合に実際に見ていると答え、モデルはそれを単独で把握する必要があると答えました。彼は、判断する明確な方法を持つことと、スケールアップするにつれて縮小できることができると主張しました。キングスカレッジロンドンの研究員であるマイククックは、グズディアルの見解をバックアップし、推論時間検索はモデルの推論を実際に改善していないと述べました。これは、モデルが自信を持って間違いを犯す傾向があるための回避策のようなものです。彼は、あなたのモデルが5%の時間を台無しにした場合、200回の試行をチェックすると、それらの間違いが簡単に見つかるはずだと指摘しました。このニュースは、AI業界にとっては少しダウナーかもしれません。これは、銀行を壊すことなくモデルの「推論」を高める方法を常に狩りにしています。論文の著者が指摘したように、推論モデルは、1つの数学の問題を解決するためだけに数千ドルのコンピューティングコストを獲得できます。新しいスケーリングテクニックの検索は、かなり終わっているようです。 *更新された3/20 5:12 AM太平洋:研究の共著者であるエリック・チャオからのコメントを追加しました。
関連記事
專注於實惠增強現實的真實對焦系統 專注於實惠增強現實的真實對焦系統 顛覆基於投影的增強現實技術來自著名機構電機電子工程師學會(IEEE)的研究人員在基於投影的增強現實領域取得了突破性的進展。他們的解決方案?配備了電控可變焦鏡片(ETL)的特殊眼鏡,這些鏡片模擬人類眼睛自然感知深度的方式。這種創新的方法解決了使投影系統在受控環境中真正實用的主要障礙。想像一下走進一個房間,其中投影的3D物體看起來就像周圍的家具一樣真實。這就是該
我們如何使用AI來幫助城市應對極端熱量 我們如何使用AI來幫助城市應對極端熱量 看起來2024年可能會打破迄今為止最熱的一年的記錄,超過了2023年。這種趨勢對生活在城市熱島的人們來說尤為艱難,這些景點是在混凝土和瀝青浸泡太陽射線,然後散發出熱量的城市中的那些景點。這些區域可以溫暖
“退化”合成面可能會增強面部識別技術 “退化”合成面可能會增強面部識別技術 密歇根州立大學的研究人員提出了一種創新的方式,將合成面孔用於崇高的原因 - 增強圖像識別系統的準確性。這些合成面無代替導致深層現象的貢獻
コメント (35)
0/200
JustinJackson
JustinJackson 2025年4月11日 0:00:00 GMT

The hype around this new AI scaling law is a bit overblown, if you ask me. Experts are skeptical, and I'm not surprised. It's interesting, but I'm not ready to bet the farm on it just yet. Anyone else feeling the same?

PatrickCarter
PatrickCarter 2025年4月11日 0:00:00 GMT

この新しいAIスケーリング法の話題、少し大げさに感じます。専門家も懐疑的で、私も驚きません。興味深いですが、まだ全面的に信じるのは早いかなと思います。皆さんも同じ気持ちですか?

AnthonyPerez
AnthonyPerez 2025年4月11日 0:00:00 GMT

이 새로운 AI 스케일링 법에 대한 과대광고는 조금 과장된 것 같아요. 전문가들도 회의적이고, 저도 놀랍지 않아요. 흥미롭긴 하지만, 아직 이것에 전부를 걸기에는 이릅니다. 다른 분들도 같은 생각이신가요?

JamesTaylor
JamesTaylor 2025年4月11日 0:00:00 GMT

O hype em torno dessa nova lei de escalabilidade de IA está um pouco exagerado, se me perguntar. Os especialistas estão céticos e eu não fico surpreso. É interessante, mas ainda não estou pronto para apostar tudo nisso. Alguém mais sente o mesmo?

GeorgeEvans
GeorgeEvans 2025年4月11日 0:00:00 GMT

El entusiasmo alrededor de esta nueva ley de escalabilidad de IA está un poco exagerado, si me lo preguntas. Los expertos son escépticos y no me sorprende. Es interesante, pero no estoy listo para apostar todo en esto todavía. ¿Alguien más siente lo mismo?

PaulHernández
PaulHernández 2025年4月11日 0:00:00 GMT

Heard about this new AI scaling law? Sounds cool but honestly, I'm not convinced. It feels like every other week there's a new 'breakthrough' that fizzles out. Experts seem skeptical too, so I'm just gonna wait and see. Anyone else feel the same?

トップに戻ります
OR