O novo modelo de IA da Anthropic opera computadores como humanos, erros incluídos

Já sonhou com uma IA que interage perfeitamente com seu computador, como um humano? Esse sonho agora é realidade, graças à última inovação da Anthropic. Na terça-feira, eles lançaram a nova geração do modelo Claude AI, chamado Claude 3.5 Sonnet, que opera um computador com surpreendente habilidade. Atualmente em modo beta, essa IA está disponível para desenvolvedores experimentarem por meio de uma API.
A Anthropic orgulhosamente chama o Claude 3.5 Sonnet de "primeiro modelo de IA de fronteira a oferecer uso de computador em beta público". Isso significa que desenvolvedores podem programá-lo para realizar várias tarefas em um computador, como visualizar a tela, mover o cursor, clicar em botões e até digitar em um teclado virtual. O objetivo? Replicar a forma como interagimos com nossos computadores diariamente.
Embora essa nova IA ainda esteja em fase experimental, não está livre de problemas. Pode ser um pouco desajeitada e propensa a erros às vezes. Mas é exatamente por isso que a Anthropic a lançou em beta — para coletar feedback valioso dos desenvolvedores e refinar o modelo ao longo do tempo.
Por que devemos nos importar com IA usando computadores?
A Anthropic tem uma resposta clara: "Grande parte do trabalho moderno acontece por meio de computadores." Ao permitir que IAs interajam com softwares da mesma forma que humanos, abrem-se inúmeras novas aplicações que assistentes de IA atuais não conseguem realizar.
Como desenvolvedores e usuários podem se beneficiar?
Em vez de criar ferramentas específicas para cada tarefa, a Anthropic está ensinando ao Claude habilidades gerais de computador. Isso permite que a IA utilize uma ampla gama de programas de software padrão projetados para humanos. Desenvolvedores podem aproveitar essa capacidade para automatizar tarefas repetitivas, construir e testar softwares e até realizar pesquisas.
Várias empresas já estão utilizando as habilidades de computador do Claude 3.5 Sonnet, incluindo Asana, Canva, Cognition, DoorDash, Replit e The Browser Company. Por exemplo, a Replit está usando essas capacidades para aprimorar seu produto Replit Agent.
Como treinaram o Claude para usar computadores?
Treinar o Claude para navegar em um computador envolveu muita tentativa e erro, segundo a Anthropic. O processo exige que a IA entenda e interprete imagens da tela do computador, decidindo então quais ações tomar com base no que vê. O Claude 3.5 Sonnet consegue isso analisando capturas de tela, contando pixels para mover o cursor com precisão e emitindo comandos de mouse.
Qual é o desempenho do Claude?
Nos testes de benchmark OSWorld, que avaliam a capacidade dos modelos de IA de usar computadores, o Claude 3.5 Sonnet alcançou uma pontuação de 14,9%. Embora seja significativamente menor que o desempenho humano de 70%-75%, é quase o dobro do 7,7% obtido pelo segundo melhor modelo de IA na mesma categoria.
Apesar desses resultados promissores, o uso de computadores pelo Claude ainda está em sua infância. Ele ainda não consegue realizar tarefas mais complexas, como arrastar janelas ou ampliar a tela. Além disso, por depender de capturas de tela, pode perder algumas ações e notificações.
A Anthropic permanece otimista, afirmando: "Esperamos que o uso de computadores melhore rapidamente, tornando-se mais rápido, confiável e útil para as tarefas que nossos usuários desejam realizar." Eles também destacam que, à medida que a tecnologia evolui, ela se tornará mais acessível para pessoas com menos experiência em desenvolvimento de software, mantendo rigorosas medidas de segurança.
O Claude 3.5 Sonnet agora está acessível a todos. Desenvolvedores podem começar a criar aplicações com o beta de uso de computador na API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud.
Artigo relacionado
A primeira série dramática com AIGC da Yaoke Media, “O Mistério do Bronze em Qinling”, estreia hoje com protagonistas criados por IA
Hoje marca o lançamento oficial da minissérie de mistério e fantasia com IA da Yaoke Media, “A História Secreta do Bronze de Qinling”. Estrelada pelos dois primeiros atores de IA contratados pela empr
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas
O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
Recomendações de tópicos especiais relacionados
Comentários (8)
Когда ИИ начинает делать те же ошибки, что и я в работе с компьютером, это по-своему успокаивает 😂 Меня беспокоит, насколько мы готовы доверить программному обеспечению такое прямое взаимодействие с интерфейсом. Это ведь прямая дорога как к невероятной производительности, так и к полному хаосу, если что-то пойдет не так. Кажется, пора задуматься о новых 'правилах дорожного движения' для роботов-помощников.
Этот AI, который делает ошибки, как человек, звучит одновременно и забавно, и немного тревожно 😅 Получается, мы создали идеального цифрового стажёра, который тоже путает Ctrl+C и Ctrl+V? Интересно, как это повлияет на безопасность — вдруг он случайно удалит что-то важное, пытаясь 'помочь'?
Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.

Já sonhou com uma IA que interage perfeitamente com seu computador, como um humano? Esse sonho agora é realidade, graças à última inovação da Anthropic. Na terça-feira, eles lançaram a nova geração do modelo Claude AI, chamado Claude 3.5 Sonnet, que opera um computador com surpreendente habilidade. Atualmente em modo beta, essa IA está disponível para desenvolvedores experimentarem por meio de uma API.
A Anthropic orgulhosamente chama o Claude 3.5 Sonnet de "primeiro modelo de IA de fronteira a oferecer uso de computador em beta público". Isso significa que desenvolvedores podem programá-lo para realizar várias tarefas em um computador, como visualizar a tela, mover o cursor, clicar em botões e até digitar em um teclado virtual. O objetivo? Replicar a forma como interagimos com nossos computadores diariamente.
Embora essa nova IA ainda esteja em fase experimental, não está livre de problemas. Pode ser um pouco desajeitada e propensa a erros às vezes. Mas é exatamente por isso que a Anthropic a lançou em beta — para coletar feedback valioso dos desenvolvedores e refinar o modelo ao longo do tempo.
Por que devemos nos importar com IA usando computadores?
A Anthropic tem uma resposta clara: "Grande parte do trabalho moderno acontece por meio de computadores." Ao permitir que IAs interajam com softwares da mesma forma que humanos, abrem-se inúmeras novas aplicações que assistentes de IA atuais não conseguem realizar.
Como desenvolvedores e usuários podem se beneficiar?
Em vez de criar ferramentas específicas para cada tarefa, a Anthropic está ensinando ao Claude habilidades gerais de computador. Isso permite que a IA utilize uma ampla gama de programas de software padrão projetados para humanos. Desenvolvedores podem aproveitar essa capacidade para automatizar tarefas repetitivas, construir e testar softwares e até realizar pesquisas.
Várias empresas já estão utilizando as habilidades de computador do Claude 3.5 Sonnet, incluindo Asana, Canva, Cognition, DoorDash, Replit e The Browser Company. Por exemplo, a Replit está usando essas capacidades para aprimorar seu produto Replit Agent.
Como treinaram o Claude para usar computadores?
Treinar o Claude para navegar em um computador envolveu muita tentativa e erro, segundo a Anthropic. O processo exige que a IA entenda e interprete imagens da tela do computador, decidindo então quais ações tomar com base no que vê. O Claude 3.5 Sonnet consegue isso analisando capturas de tela, contando pixels para mover o cursor com precisão e emitindo comandos de mouse.
Qual é o desempenho do Claude?
Nos testes de benchmark OSWorld, que avaliam a capacidade dos modelos de IA de usar computadores, o Claude 3.5 Sonnet alcançou uma pontuação de 14,9%. Embora seja significativamente menor que o desempenho humano de 70%-75%, é quase o dobro do 7,7% obtido pelo segundo melhor modelo de IA na mesma categoria.
Apesar desses resultados promissores, o uso de computadores pelo Claude ainda está em sua infância. Ele ainda não consegue realizar tarefas mais complexas, como arrastar janelas ou ampliar a tela. Além disso, por depender de capturas de tela, pode perder algumas ações e notificações.
A Anthropic permanece otimista, afirmando: "Esperamos que o uso de computadores melhore rapidamente, tornando-se mais rápido, confiável e útil para as tarefas que nossos usuários desejam realizar." Eles também destacam que, à medida que a tecnologia evolui, ela se tornará mais acessível para pessoas com menos experiência em desenvolvimento de software, mantendo rigorosas medidas de segurança.
O Claude 3.5 Sonnet agora está acessível a todos. Desenvolvedores podem começar a criar aplicações com o beta de uso de computador na API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud.
A primeira série dramática com AIGC da Yaoke Media, “O Mistério do Bronze em Qinling”, estreia hoje com protagonistas criados por IA
Hoje marca o lançamento oficial da minissérie de mistério e fantasia com IA da Yaoke Media, “A História Secreta do Bronze de Qinling”. Estrelada pelos dois primeiros atores de IA contratados pela empr
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas
O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
Когда ИИ начинает делать те же ошибки, что и я в работе с компьютером, это по-своему успокаивает 😂 Меня беспокоит, насколько мы готовы доверить программному обеспечению такое прямое взаимодействие с интерфейсом. Это ведь прямая дорога как к невероятной производительности, так и к полному хаосу, если что-то пойдет не так. Кажется, пора задуматься о новых 'правилах дорожного движения' для роботов-помощников.
Этот AI, который делает ошибки, как человек, звучит одновременно и забавно, и немного тревожно 😅 Получается, мы создали идеального цифрового стажёра, который тоже путает Ctrl+C и Ctrl+V? Интересно, как это повлияет на безопасность — вдруг он случайно удалит что-то важное, пытаясь 'помочь'?
Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.





Lar






