opção
Lar
Notícias
Reivindicações antrópicas Ai não está paralisando, está de acordo com os benchmarks

Reivindicações antrópicas Ai não está paralisando, está de acordo com os benchmarks

17 de Abril de 2025
161

Reivindicações antrópicas Ai não está paralisando, está de acordo com os benchmarks

Modelos de linguagem de grande escala (LLMs) e outras tecnologias de IA generativa estão fazendo avanços significativos em autocorreção, o que está abrindo caminho para novas aplicações, incluindo o que é conhecido como "IA agente", segundo Michael Gerstenhaber, Vice-Presidente da Anthropic, uma desenvolvedora líder de modelos de IA.

"Está ficando muito bom em autocorreção, autorreflexão," compartilhou Gerstenhaber, que lidera as tecnologias de API na Anthropic, durante uma entrevista em Nova York com Anurag Rana, da Bloomberg Intelligence. A Anthropic, criadora da família de LLMs Claude, é concorrente direta dos modelos GPT da OpenAI. "A cada poucos meses, lançamos um novo modelo que expande as capacidades dos LLMs," ele acrescentou, destacando a natureza dinâmica da indústria, onde cada revisão de modelo desbloqueia novos usos potenciais.

Novas Capacidades em Modelos de IA

Os modelos mais recentes da Anthropic introduziram capacidades como planejamento de tarefas, permitindo que realizem tarefas em um computador de maneira semelhante a um humano, como pedir pizza online. "Planejar etapas intermediárias, algo que não era viável ontem, agora está ao alcance," observou Gerstenhaber sobre essa execução de tarefas passo a passo.

A discussão, que também contou com Vijay Karunamurthy, Tecnólogo-Chefe da startup de IA Scale AI, fez parte de uma conferência de um dia inteiro organizada pela Bloomberg Intelligence intitulada "Gen AI: Pode cumprir a promessa de produtividade?"

Desafiando o Ceticismo sobre IA

As perspectivas de Gerstenhaber desafiam as visões dos céticos sobre IA, que argumentam que a IA generativa e o campo mais amplo da IA estão "atingindo um muro", sugerindo retornos decrescentes a cada nova iteração de modelo. O estudioso de IA Gary Marcus, por exemplo, tem sido vocal sobre suas preocupações desde 2022, alertando que simplesmente aumentar o tamanho dos modelos de IA (mais parâmetros) não melhorará proporcionalmente seu desempenho.

No entanto, Gerstenhaber afirma que a Anthropic está expandindo os limites além do que os benchmarks atuais de IA podem medir. "Mesmo que pareça que o progresso está desacelerando em algumas áreas, é porque estamos desbloqueando funcionalidades completamente novas, mas saturamos os benchmarks e a capacidade de realizar tarefas mais antigas," ele explicou. Isso torna cada vez mais difícil avaliar a extensão total do que os modelos de IA generativa atuais podem alcançar.

Escalabilidade e Aprendizado

Tanto Gerstenhaber quanto Karunamurthy enfatizaram a importância de escalar modelos de IA generativa para aprimorar suas capacidades de autocorreção. "Definitivamente, estamos vendo cada vez mais escalabilidade da inteligência," observou Gerstenhaber. Karunamurthy acrescentou, "Uma razão pela qual acreditamos que não estamos atingindo um muro com planejamento e raciocínio é que ainda estamos aprendendo como estruturar essas tarefas para que os modelos possam se adaptar a ambientes novos e variados."

Gerstenhaber concordou, afirmando, "Estamos nos estágios iniciais, aprendendo com desenvolvedores de aplicativos sobre suas necessidades e onde os modelos falham, o que podemos então integrar de volta ao modelo de linguagem."

Aprendizado e Adaptação em Tempo Real

Muito desse progresso, segundo Gerstenhaber, é impulsionado pelo ritmo rápido da pesquisa fundamental na Anthropic, bem como pelo aprendizado em tempo real a partir de feedback da indústria. "Estamos nos adaptando ao que a indústria nos diz que precisa, aprendendo em tempo real," ele disse.

Os clientes frequentemente começam com modelos maiores e depois reduzem para modelos mais simples para atender a propósitos específicos. "Inicialmente, eles avaliam se um modelo é inteligente o suficiente para realizar uma tarefa bem, depois se é rápido o suficiente para atender às necessidades de sua aplicação e, finalmente, se pode ser o mais econômico possível," explicou Gerstenhaber.

Artigo relacionado
O jogo O jogo "Xiaolongxia", da Tencent, supera as expectativas; equipe amplia capacidade em 10 vezes, pede desculpas e oferece indenização A Tencent lançou oficialmente o WorkBuddy, um agente inteligente de IA para todos os cenários, marcando uma nova fase na corrida pela camada de aplicação de modelos de grande porte, com alta integraçã
Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá
Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire
Recomendações de tópicos especiais relacionados
Criação de quadrinhos Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia
Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia

Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!

15 ferramentas
xix.ai
Negócios Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas
Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas
xix.ai
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
Comentários (8)
0/500
JoseRoberts
JoseRoberts 12 de Agosto de 2025 à59 16:00:59 WEST

This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?

WalterAnderson
WalterAnderson 31 de Julho de 2025 à39 12:35:39 WEST

It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!

RonaldMartinez
RonaldMartinez 22 de Julho de 2025 à52 08:39:52 WEST

This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄

WillieJackson
WillieJackson 18 de Abril de 2025 à28 08:00:28 WEST

La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔

GeorgeWilson
GeorgeWilson 17 de Abril de 2025 à24 18:45:24 WEST

Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔

NicholasCarter
NicholasCarter 17 de Abril de 2025 à31 12:27:31 WEST

Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔

OR