O novo modelo de IA da Anthropic opera computadores como humanos, erros incluídos

Lar

Notícias

9 de Maio de 2025

PaulGonzalez

133

O novo modelo de IA da Anthropic opera computadores como humanos, erros incluídos

Já sonhou com uma IA que interage perfeitamente com seu computador, como um humano? Esse sonho agora é realidade, graças à última inovação da Anthropic. Na terça-feira, eles lançaram a nova geração do modelo Claude AI, chamado Claude 3.5 Sonnet, que opera um computador com surpreendente habilidade. Atualmente em modo beta, essa IA está disponível para desenvolvedores experimentarem por meio de uma API.

A Anthropic orgulhosamente chama o Claude 3.5 Sonnet de "primeiro modelo de IA de fronteira a oferecer uso de computador em beta público". Isso significa que desenvolvedores podem programá-lo para realizar várias tarefas em um computador, como visualizar a tela, mover o cursor, clicar em botões e até digitar em um teclado virtual. O objetivo? Replicar a forma como interagimos com nossos computadores diariamente.

Embora essa nova IA ainda esteja em fase experimental, não está livre de problemas. Pode ser um pouco desajeitada e propensa a erros às vezes. Mas é exatamente por isso que a Anthropic a lançou em beta — para coletar feedback valioso dos desenvolvedores e refinar o modelo ao longo do tempo.

Por que devemos nos importar com IA usando computadores?

A Anthropic tem uma resposta clara: "Grande parte do trabalho moderno acontece por meio de computadores." Ao permitir que IAs interajam com softwares da mesma forma que humanos, abrem-se inúmeras novas aplicações que assistentes de IA atuais não conseguem realizar.

Como desenvolvedores e usuários podem se beneficiar?

Em vez de criar ferramentas específicas para cada tarefa, a Anthropic está ensinando ao Claude habilidades gerais de computador. Isso permite que a IA utilize uma ampla gama de programas de software padrão projetados para humanos. Desenvolvedores podem aproveitar essa capacidade para automatizar tarefas repetitivas, construir e testar softwares e até realizar pesquisas.

Várias empresas já estão utilizando as habilidades de computador do Claude 3.5 Sonnet, incluindo Asana, Canva, Cognition, DoorDash, Replit e The Browser Company. Por exemplo, a Replit está usando essas capacidades para aprimorar seu produto Replit Agent.

Como treinaram o Claude para usar computadores?

Treinar o Claude para navegar em um computador envolveu muita tentativa e erro, segundo a Anthropic. O processo exige que a IA entenda e interprete imagens da tela do computador, decidindo então quais ações tomar com base no que vê. O Claude 3.5 Sonnet consegue isso analisando capturas de tela, contando pixels para mover o cursor com precisão e emitindo comandos de mouse.

Qual é o desempenho do Claude?

Nos testes de benchmark OSWorld, que avaliam a capacidade dos modelos de IA de usar computadores, o Claude 3.5 Sonnet alcançou uma pontuação de 14,9%. Embora seja significativamente menor que o desempenho humano de 70%-75%, é quase o dobro do 7,7% obtido pelo segundo melhor modelo de IA na mesma categoria.

Apesar desses resultados promissores, o uso de computadores pelo Claude ainda está em sua infância. Ele ainda não consegue realizar tarefas mais complexas, como arrastar janelas ou ampliar a tela. Além disso, por depender de capturas de tela, pode perder algumas ações e notificações.

A Anthropic permanece otimista, afirmando: "Esperamos que o uso de computadores melhore rapidamente, tornando-se mais rápido, confiável e útil para as tarefas que nossos usuários desejam realizar." Eles também destacam que, à medida que a tecnologia evolui, ela se tornará mais acessível para pessoas com menos experiência em desenvolvimento de software, mantendo rigorosas medidas de segurança.

O Claude 3.5 Sonnet agora está acessível a todos. Desenvolvedores podem começar a criar aplicações com o beta de uso de computador na API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud.

Artigo relacionado

Manus lança a ferramenta de IA 'Wide Research' com mais de 100 agentes para raspagem da Web A Manus, empresa chinesa inovadora em IA, que já chamou a atenção por sua plataforma pioneira de orquestração de multiagentes voltada para consumidores e usuários profissionais, revelou uma aplicação

Por que os LLMs ignoram as instruções e como corrigi-las de forma eficaz Entendendo por que os modelos de linguagem grande ignoram as instruçõesOs modelos de linguagem grande (LLMs) transformaram a forma como interagimos com a IA, permitindo aplicativos avançados que vão

Pebble recupera seu nome de marca original após batalha judicial O retorno de Pebble: Nome e tudo maisOs entusiastas do Pebble podem se alegrar - a amada marca de smartwatches não está apenas voltando, mas também recuperando seu nome icônico. "Recuperamos com suces

Comentários (5)

0/200

Enviar

WalterBaker

27 de Agosto de 2025 à33 18:01:33 WEST

Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!

JackWilson

4 de Agosto de 2025 à0 07:01:00 WEST

This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.

JackMitchell

31 de Julho de 2025 à5 02:42:05 WEST

Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!

JohnNelson

29 de Julho de 2025 à16 13:25:16 WEST

Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!

JuanLewis

28 de Julho de 2025 à30 02:19:30 WEST

This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!

Principais notícias

Gemini 2.5 Pro agora ilimitado e mais barato que Claude, GPT-4o Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas Dublagem AI: Guia Definitivo para Criação de Voz Realista A IA de Cambium transforma a madeira desperdiçada em madeira serrada O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Como garantir que seus dados sejam confiáveis para a integração de IA Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia O Google utiliza a IA para suspender mais de 39 milhões de contas de anúncios por suspeita de fraude Clone de Voz por IA: Guia definitivo para dominar a conversão de voz

Mais

Apresentou