вариант
Дом
Новости
Прорыв для масштабирования искусственного интеллекта, спросил экспертов

Прорыв для масштабирования искусственного интеллекта, спросил экспертов

10 апреля 2025 г.
96

Прорыв для масштабирования искусственного интеллекта, спросил экспертов

В социальных сетях было некоторое шум о том, что исследователи обнаружили новый «Закон о масштабировании», но эксперты принимают его с зерном соли. Законы об масштабировании ИИ, которые больше похожи на неформальные руководящие принципы, показывают, как модели искусственного интеллекта становятся лучше, когда вы добавляете в них больше данных и вычислительной мощности. Еще год назад большая тенденция была о «предварительной тренировке»-в основном, обучение более крупных моделей на более крупных наборах данных. Это все еще вещь, но теперь у нас есть еще два закона о масштабировании в миксе: пост-тренировочное масштабирование, которое предназначено для настройки поведения модели и масштабирования времени теста, что включает в себя использование большей вычислительной мощности во время вывода, чтобы повысить возможности «рассуждения» модели (мыслить такие модели R1). Недавно исследователи из Google и UC Berkeley бросили статью, которую некоторые люди в Интернете называют четвертым законом: «Поиск времени вывода». Этот метод имеет модель одновременно выплюнуть кучу возможных ответов на запрос, а затем выбирайте лучший. Исследователи утверждают, что это может сочетать производительность более старой модели, такой как Google Gemini 1.5 Pro, чтобы победить модель Openai O1-Preview »« Модель »по науке и математическим показателям. Эрик Чжао, научный сотрудник Google и один из соавторов газеты, поделился на X, который, просто случайным образом отбирая 200 ответов и позволив модели самоуверен, Gemini 1.5-который он в шутку назвал «древней моделью начала 2024 года»-мог превзойти O1-Preview и даже приблизиться к O1. Он указал, что самостоятельная трансляция становится легче, когда вы масштабируете, что является нелогичным, но крутым. Но не все убеждены. Мэтью Гусдиал, исследователь ИИ и доцент в Университете Альберты, сказал TechCrunch, что этот подход работает лучше всего, когда у вас есть солидный способ судить ответы. Однако большинство вопросов не так просто. Он сказал: «Если мы не можем написать код, чтобы определить то, что мы хотим, мы не можем использовать поиск [время вывода]. Для чего-то вроде общего языкового взаимодействия мы не можем этого сделать ... как правило, это не большой подход для решения большинства проблем». Чжао ответил, сказав, что их статья на самом деле рассматривает случаи, когда у вас нет четкого способа судить о ответах, и модель должна выяснить это самостоятельно. Он утверждал, что разрыв между наличием четкого способа судить и отсутствием, когда можно сразиться при масштабировании. Майк Кук, научный сотрудник King's College London, поддержал точку зрения Гусдиала, заявив, что поиск времени вывода на самом деле не делает рассуждения модели лучше. Это больше похоже на обходной путь для тенденции модели совершать уверенные ошибки. Он указал, что если ваша модель испортится в 5% случаев, проверка 200 попыток облегчить обнаружение этих ошибок. Эта новость может быть чем -то вроде понижения для индустрии ИИ, которая всегда на охоте за способами повысить модель «рассуждения», не нарушая банк. Как отметили авторы газеты, модели рассуждений могут набрать тысячи долларов на вычислительные затраты, чтобы решить одну математическую проблему. Похоже, что поиск новых методов масштабирования далеко не закончился. *Обновлено 3/20 5:12 Pacific: Добавлены комментарии соавтора исследования Эрика Чжао, который не согласен с оценкой независимого исследователя, который критиковал работу.*
Связанная статья
專注於實惠增強現實的真實對焦系統 專注於實惠增強現實的真實對焦系統 顛覆基於投影的增強現實技術來自著名機構電機電子工程師學會(IEEE)的研究人員在基於投影的增強現實領域取得了突破性的進展。他們的解決方案?配備了電控可變焦鏡片(ETL)的特殊眼鏡,這些鏡片模擬人類眼睛自然感知深度的方式。這種創新的方法解決了使投影系統在受控環境中真正實用的主要障礙。想像一下走進一個房間,其中投影的3D物體看起來就像周圍的家具一樣真實。這就是該
我們如何使用AI來幫助城市應對極端熱量 我們如何使用AI來幫助城市應對極端熱量 看起來2024年可能會打破迄今為止最熱的一年的記錄,超過了2023年。這種趨勢對生活在城市熱島的人們來說尤為艱難,這些景點是在混凝土和瀝青浸泡太陽射線,然後散發出熱量的城市中的那些景點。這些區域可以溫暖
“退化”合成面可能會增強面部識別技術 “退化”合成面可能會增強面部識別技術 密歇根州立大學的研究人員提出了一種創新的方式,將合成面孔用於崇高的原因 - 增強圖像識別系統的準確性。這些合成面無代替導致深層現象的貢獻
Комментарии (35)
JustinJackson
JustinJackson 11 апреля 2025 г., 0:00:00 GMT

The hype around this new AI scaling law is a bit overblown, if you ask me. Experts are skeptical, and I'm not surprised. It's interesting, but I'm not ready to bet the farm on it just yet. Anyone else feeling the same?

PatrickCarter
PatrickCarter 11 апреля 2025 г., 0:00:00 GMT

この新しいAIスケーリング法の話題、少し大げさに感じます。専門家も懐疑的で、私も驚きません。興味深いですが、まだ全面的に信じるのは早いかなと思います。皆さんも同じ気持ちですか?

AnthonyPerez
AnthonyPerez 11 апреля 2025 г., 0:00:00 GMT

이 새로운 AI 스케일링 법에 대한 과대광고는 조금 과장된 것 같아요. 전문가들도 회의적이고, 저도 놀랍지 않아요. 흥미롭긴 하지만, 아직 이것에 전부를 걸기에는 이릅니다. 다른 분들도 같은 생각이신가요?

JamesTaylor
JamesTaylor 11 апреля 2025 г., 0:00:00 GMT

O hype em torno dessa nova lei de escalabilidade de IA está um pouco exagerado, se me perguntar. Os especialistas estão céticos e eu não fico surpreso. É interessante, mas ainda não estou pronto para apostar tudo nisso. Alguém mais sente o mesmo?

GeorgeEvans
GeorgeEvans 11 апреля 2025 г., 0:00:00 GMT

El entusiasmo alrededor de esta nueva ley de escalabilidad de IA está un poco exagerado, si me lo preguntas. Los expertos son escépticos y no me sorprende. Es interesante, pero no estoy listo para apostar todo en esto todavía. ¿Alguien más siente lo mismo?

PaulHernández
PaulHernández 11 апреля 2025 г., 0:00:00 GMT

Heard about this new AI scaling law? Sounds cool but honestly, I'm not convinced. It feels like every other week there's a new 'breakthrough' that fizzles out. Experts seem skeptical too, so I'm just gonna wait and see. Anyone else feel the same?

Вернуться к вершине
OR