opção
Lar
Notícias
AI em escala RUBEURO QUINTADO POR ESPECIALIZADOS

AI em escala RUBEURO QUINTADO POR ESPECIALIZADOS

10 de Abril de 2025
96

AI em escala RUBEURO QUINTADO POR ESPECIALIZADOS

Houve algum burburinho nas mídias sociais sobre pesquisadores descobrindo uma nova "lei de escala" da IA, mas os especialistas estão levando isso com um grão de sal. As leis de escala de IA, que são mais como diretrizes informais, mostram como os modelos de IA melhoram ao lançar mais dados e poder de computação neles. Até cerca de um ano atrás, a grande tendência era sobre "pré-treinamento"-basicamente, treinando modelos maiores em conjuntos de dados maiores. Isso ainda é uma coisa, mas agora temos mais duas leis de escala na mistura: escala pós-treinamento, que trata de ajustar o comportamento de um modelo e o escala no tempo de teste, o que envolve o uso de mais poder de computação durante a inferência para aumentar os recursos de "raciocínio" de um modelo (pense em modelos como R1). Recentemente, pesquisadores do Google e da UC Berkeley abandonaram um artigo que algumas pessoas on-line estão chamando uma quarta lei: "Pesquisa em tempo de inferência". Este método tem o modelo cuspindo várias respostas possíveis para uma consulta ao mesmo tempo e depois escolhe a melhor. Os pesquisadores afirmam que ele pode superar o desempenho de um modelo mais antigo, como o Gemini 1.5 Pro do Google, para vencer o modelo de "raciocínio" do OpenAI-PREVEIGE em ciência e matemática. Eric Zhao, um pesquisador de doutorado do Google e um dos co-autores do artigo, compartilhou em X que apenas amostrando aleatoriamente 200 respostas e deixando o modelo se auto-verificando, Gemini 1.5-que ele chamou de "modelo antigo de 2024"-poderia superar a previsão de O1 e até se aproximar de O1. Ele ressaltou que a auto-verificação fica mais fácil à medida que você aumenta, o que é meio contra-intuitivo, mas legal. Mas nem todo mundo está convencido. Matthew Guzdial, pesquisador de IA e professor assistente da Universidade de Alberta, disse ao TechCrunch que essa abordagem funciona melhor quando você tem uma maneira sólida de julgar as respostas. A maioria das perguntas não é tão direta, no entanto. Ele disse: "Se não podemos escrever código para definir o que queremos, não podemos usar a pesquisa [em tempo de inferência]. Por algo como a interação geral da linguagem, não podemos fazer isso ... geralmente não é uma ótima abordagem para realmente resolver a maioria dos problemas". Zhao respondeu, dizendo que o artigo deles realmente analisa os casos em que você não tem uma maneira clara de julgar as respostas, e o modelo precisa descobrir por conta própria. Ele argumentou que a lacuna entre ter uma maneira clara de julgar e não ter uma pode encolher à medida que você aumenta. Mike Cook, pesquisador do King's College London, apoiou a visão de Guzdial, dizendo que a pesquisa em tempo de inferência não torna o raciocínio do modelo melhor. É mais como uma solução alternativa para a tendência do modelo de cometer erros confiantes. Ele apontou que, se o seu modelo atrapalhar 5% das vezes, verificando 200 tentativas deve facilitar a localização desses erros. Essa notícia pode ser um pouco deprimente para a indústria de IA, que está sempre em busca de maneiras de aumentar o modelo de "raciocínio" sem gastar muito. Como os autores do artigo observaram, os modelos de raciocínio podem acumular milhares de dólares em custos de computação apenas para resolver um problema de matemática. Parece que a busca por novas técnicas de escala está longe de terminar. *Atualizado 20/20 5:12 Pacífico: Adicionado comentários do co-autor do estudo, Eric Zhao, que discute uma avaliação de um pesquisador independente que criticou o trabalho.*
Artigo relacionado
專注於實惠增強現實的真實對焦系統 專注於實惠增強現實的真實對焦系統 顛覆基於投影的增強現實技術來自著名機構電機電子工程師學會(IEEE)的研究人員在基於投影的增強現實領域取得了突破性的進展。他們的解決方案?配備了電控可變焦鏡片(ETL)的特殊眼鏡,這些鏡片模擬人類眼睛自然感知深度的方式。這種創新的方法解決了使投影系統在受控環境中真正實用的主要障礙。想像一下走進一個房間,其中投影的3D物體看起來就像周圍的家具一樣真實。這就是該
我們如何使用AI來幫助城市應對極端熱量 我們如何使用AI來幫助城市應對極端熱量 看起來2024年可能會打破迄今為止最熱的一年的記錄,超過了2023年。這種趨勢對生活在城市熱島的人們來說尤為艱難,這些景點是在混凝土和瀝青浸泡太陽射線,然後散發出熱量的城市中的那些景點。這些區域可以溫暖
“退化”合成面可能會增強面部識別技術 “退化”合成面可能會增強面部識別技術 密歇根州立大學的研究人員提出了一種創新的方式,將合成面孔用於崇高的原因 - 增強圖像識別系統的準確性。這些合成面無代替導致深層現象的貢獻
Comentários (35)
0/200
JustinJackson
JustinJackson 11 de Abril de 2025 à0 00:00:00 GMT

The hype around this new AI scaling law is a bit overblown, if you ask me. Experts are skeptical, and I'm not surprised. It's interesting, but I'm not ready to bet the farm on it just yet. Anyone else feeling the same?

PatrickCarter
PatrickCarter 11 de Abril de 2025 à0 00:00:00 GMT

この新しいAIスケーリング法の話題、少し大げさに感じます。専門家も懐疑的で、私も驚きません。興味深いですが、まだ全面的に信じるのは早いかなと思います。皆さんも同じ気持ちですか?

AnthonyPerez
AnthonyPerez 11 de Abril de 2025 à0 00:00:00 GMT

이 새로운 AI 스케일링 법에 대한 과대광고는 조금 과장된 것 같아요. 전문가들도 회의적이고, 저도 놀랍지 않아요. 흥미롭긴 하지만, 아직 이것에 전부를 걸기에는 이릅니다. 다른 분들도 같은 생각이신가요?

JamesTaylor
JamesTaylor 11 de Abril de 2025 à0 00:00:00 GMT

O hype em torno dessa nova lei de escalabilidade de IA está um pouco exagerado, se me perguntar. Os especialistas estão céticos e eu não fico surpreso. É interessante, mas ainda não estou pronto para apostar tudo nisso. Alguém mais sente o mesmo?

GeorgeEvans
GeorgeEvans 11 de Abril de 2025 à0 00:00:00 GMT

El entusiasmo alrededor de esta nueva ley de escalabilidad de IA está un poco exagerado, si me lo preguntas. Los expertos son escépticos y no me sorprende. Es interesante, pero no estoy listo para apostar todo en esto todavía. ¿Alguien más siente lo mismo?

PaulHernández
PaulHernández 11 de Abril de 2025 à0 00:00:00 GMT

Heard about this new AI scaling law? Sounds cool but honestly, I'm not convinced. It feels like every other week there's a new 'breakthrough' that fizzles out. Experts seem skeptical too, so I'm just gonna wait and see. Anyone else feel the same?

De volta ao topo
OR