opção
Lar
Notícias
AI em escala RUBEURO QUINTADO POR ESPECIALIZADOS

AI em escala RUBEURO QUINTADO POR ESPECIALIZADOS

10 de Abril de 2025
97

AI em escala RUBEURO QUINTADO POR ESPECIALIZADOS

Houve algum alvoroço nas redes sociais sobre pesquisadores descobrindo uma nova "lei de escalonamento" de IA, mas os especialistas estão recebendo isso com certa cautela. As leis de escalonamento de IA, que são mais como diretrizes informais, mostram como os modelos de IA melhoram à medida que você adiciona mais dados e poder computacional. Até cerca de um ano atrás, a grande tendência era toda sobre "pré-treinamento" – basicamente, treinar modelos maiores com conjuntos de dados maiores. Isso ainda é relevante, mas agora temos mais duas leis de escalonamento na mistura: escalonamento pós-treinamento, que se concentra em ajustar o comportamento de um modelo, e escalonamento em tempo de teste, que envolve usar mais poder computacional durante a inferência para impulsionar as capacidades de "raciocínio" de um modelo (pense em modelos como R1).

Recentemente, pesquisadores do Google e da UC Berkeley publicaram um artigo que algumas pessoas online estão chamando de quarta lei: "busca em tempo de inferência". Esse método faz o modelo gerar várias respostas possíveis para uma consulta ao mesmo tempo e depois escolher a melhor. Os pesquisadores afirmam que isso pode melhorar o desempenho de um modelo mais antigo, como o Gemini 1.5 Pro do Google, para superar o modelo de "raciocínio" o1-preview da OpenAI em benchmarks de ciência e matemática.

Eric Zhao, doutorando do Google e um dos coautores do artigo, compartilhou no X que, ao amostrar aleatoriamente 200 respostas e permitir que o modelo se auto-verifique, o Gemini 1.5 – que ele chamou, brincando, de "modelo antigo do início de 2024" – poderia superar o o1-preview e até se aproximar do o1. Ele destacou que a auto-verificação fica mais fácil à medida que você escala, o que é meio contraintuitivo, mas interessante.

Mas nem todos estão convencidos. Matthew Guzdial, pesquisador de IA e professor assistente na Universidade de Alberta, disse ao TechCrunch que essa abordagem funciona melhor quando você tem uma maneira sólida de julgar as respostas. A maioria das perguntas, no entanto, não é tão direta. Ele disse: "Se não podemos escrever código para definir o que queremos, não podemos usar a busca [em tempo de inferência]. Para algo como interação geral de linguagem, não podemos fazer isso... Geralmente, não é uma boa abordagem para realmente resolver a maioria dos problemas."

Zhao respondeu, dizendo que o artigo deles realmente analisa casos em que não há uma maneira clara de julgar as respostas, e o modelo precisa descobrir isso sozinho. Ele argumentou que a diferença entre ter uma maneira clara de julgar e não ter uma pode diminuir à medida que você escala.

Mike Cook, pesquisador da King's College London, apoiou a visão de Guzdial, dizendo que a busca em tempo de inferência não melhora realmente o raciocínio do modelo. É mais como uma solução alternativa para a tendência do modelo de cometer erros confiantes. Ele destacou que, se o seu modelo erra 5% das vezes, verificar 200 tentativas deve facilitar a identificação desses erros.

Essa notícia pode ser um pouco desanimadora para a indústria de IA, que está sempre em busca de maneiras de melhorar o "raciocínio" dos modelos sem gastar muito. Como os autores do artigo observaram, modelos de raciocínio podem acumular milhares de dólares em custos computacionais apenas para resolver um problema de matemática.

Parece que a busca por novas técnicas de escalonamento está longe de terminar.

Atualizado em 20/03 às 5:12 da manhã, horário do Pacífico: Adicionados comentários do coautor do estudo, Eric Zhao, que discorda de uma avaliação feita por um pesquisador independente que criticou o trabalho.

Artigo relacionado
Estudo da Microsoft Revela Limitações de Modelos de IA na Depuração de Software Estudo da Microsoft Revela Limitações de Modelos de IA na Depuração de Software Modelos de IA da OpenAI, Anthropic e outros laboratórios de IA líderes estão sendo cada vez mais utilizados para tarefas de codificação. O CEO da Google, Sundar Pichai, observou em outubro que a IA ge
Soluções Impulsionadas por IA Podem Reduzir Significativamente as Emissões Globais de Carbono Soluções Impulsionadas por IA Podem Reduzir Significativamente as Emissões Globais de Carbono Um estudo recente da London School of Economics e Systemiq revela que a inteligência artificial pode reduzir substancialmente as emissões globais de carbono sem sacrificar conveniências modernas, posi
Novo Estudo Revela Quanto Dados os LLMs Realmente Memorizam Novo Estudo Revela Quanto Dados os LLMs Realmente Memorizam Quanto os Modelos de IA Realmente Memorizam? Nova Pesquisa Revela Insights SurpreendentesTodos sabemos que grandes modelos de linguagem (LLMs) como ChatGPT, Claude e Gemini são treinados em conjuntos
Comentários (35)
0/200
DanielThomas
DanielThomas 24 de Abril de 2025 à41 00:49:41 WEST

AI 스케일링 돌파구는 멋지게 들리지만, 전문가들은 회의적이에요. 🤔 이제 뭘 믿어야 할지 모르겠어요. 그냥 과대광고일까요? 지켜볼게요, 하지만 기대는 하지 않을게요. 😴

BenRoberts
BenRoberts 23 de Abril de 2025 à49 19:12:49 WEST

This AI scaling law thing sounds cool, but it's hard to get excited when experts are so skeptical. It's like they're saying, 'Sure, it's interesting, but let's not get carried away.' I guess we'll see if it's the real deal or just another hype train. 🤔

PatrickMartinez
PatrickMartinez 21 de Abril de 2025 à56 20:31:56 WEST

Essa história de lei de escalabilidade de IA parece legal, mas é difícil se empolgar quando os especialistas são tão céticos. Parece que eles estão dizendo, 'Sim, é interessante, mas não vamos nos empolgar muito'. Vamos ver se é verdade ou só mais um hype. 🤔

JohnYoung
JohnYoung 20 de Abril de 2025 à43 01:36:43 WEST

AI 스케일링 법칙에 대한 소식은 흥미롭지만, 전문가들이 회의적이라서 흥분하기 어려워. '재미있지만 너무 기대하지 마세요'라는 느낌이야. 실제로 어떻게 될지 지켜봐야겠네. 🤔

HaroldMoore
HaroldMoore 17 de Abril de 2025 à24 12:24:24 WEST

AIのスケーリングブレイクスルーは面白そうだけど、専門家は懐疑的。🤔 もう何を信じればいいのかわからない。ただの誇大広告かも?注目はするけど、期待はしないよ。😴

AlbertLee
AlbertLee 16 de Abril de 2025 à29 16:25:29 WEST

El avance en la escala de IA suena genial, pero todavía no lo compro. Es todo un hype en las redes sociales, pero los expertos son escépticos. Esperaré más pruebas sólidas antes de subirme al carro. 🤔

De volta ao topo
OR