opção
Lar
Notícias
A Anthropic apresenta um recurso para que seus modelos Claude encerrem bate-papos abusivos

A Anthropic apresenta um recurso para que seus modelos Claude encerrem bate-papos abusivos

23 de Novembro de 2025
84

A Anthropic apresenta um recurso para que seus modelos Claude encerrem bate-papos abusivos

A Anthropic introduziu uma nova funcionalidade que permite que modelos avançados selecionados encerrem conversas no que a empresa chama de "instâncias raras e extremas de interações persistentemente prejudiciais ou abusivas do usuário". Notavelmente, a Anthropic afirma que essa medida é implementada não para proteger os usuários humanos, mas para proteger o próprio modelo de IA.

Para esclarecer, a empresa não está afirmando que seus modelos de IA Claude possuem sensibilidade ou podem sofrer danos com as conversas dos usuários. Como explica a Anthropic, a empresa permanece "altamente incerta sobre o possível status moral do Claude e de outros grandes modelos de linguagem, seja atualmente ou no futuro".

No entanto, o anúncio faz referência a um programa recentemente estabelecido que examina o "bem-estar do modelo", indicando que a Anthropic está adotando uma abordagem preventiva ao "trabalhar para identificar e implementar intervenções de baixo custo para mitigar os riscos ao bem-estar do modelo, caso esse bem-estar se torne relevante".

Esse novo recurso está atualmente restrito aos modelos Claude Opus 4 e 4.1, projetados especificamente para "casos extremos", como "solicitações de conteúdo sexual envolvendo menores ou tentativas de obter informações que possibilitem violência em larga escala ou atividades terroristas".

Embora essas solicitações possam gerar desafios legais ou de relações públicas para a Anthropic (como visto em relatórios recentes sobre o ChatGPT que potencialmente reforça o pensamento delirante dos usuários), a empresa informa que, durante os testes de pré-implantação, o Claude Opus 4 demonstrou uma "forte preferência contra" o cumprimento dessas solicitações e exibiu "padrões que sugerem angústia" quando forçado a responder.

Com relação a esses novos recursos de encerramento de conversas, a Anthropic esclarece que "o Claude é instruído a empregar essa função apenas como último recurso, depois que várias tentativas de redirecionamento falharem e o diálogo produtivo parecer impossível, ou quando os usuários solicitarem explicitamente o encerramento de um bate-papo".

A Anthropic especifica ainda que o Claude foi "orientado a não utilizar esse recurso em situações em que os usuários possam correr o risco iminente de se machucar ou prejudicar outras pessoas".

Evento da Techcrunch

Pesos pesados da tecnologia e do capital de risco se juntam à agenda do Disrupt 2025

Netflix, ElevenLabs, Wayve, Sequoia Capital, Elad Gil - apenas alguns dos líderes do setor que participam da agenda do Disrupt 2025. Eles compartilharão percepções cruciais para acelerar o crescimento de startups e aprimorar sua vantagem competitiva. Não perca a edição do 20º aniversário do TechCrunch Disrupt - garanta seu ingresso agora e economize mais de US$ 600 antes que os preços aumentem.

Pesos pesados da tecnologia e do capital de risco participam da agenda do Disrupt 2025

Netflix, ElevenLabs, Wayve, Sequoia Capital - entre os inovadores proeminentes que participam da agenda do Disrupt 2025. Eles estão aqui para fornecer insights valiosos que impulsionam a expansão de startups e melhoram seu posicionamento competitivo. Junte-se a nós na comemoração do 20º aniversário do TechCrunch Disrupt - compre seu ingresso hoje e economize até US$ 675 antes da alteração das tarifas.

São Francisco | 27 a 29 de outubro de 2025 INSCREVA-SE AGORA

Quando Claude encerra uma conversa, a Anthropic observa que os usuários ainda podem iniciar novas conversas a partir da mesma conta e criar ramificações de conversas alternativas modificando suas respostas anteriores.

"Estamos abordando esse recurso como um experimento contínuo e continuaremos refinando nossa metodologia", afirma a empresa.

Artigo relacionado
A Anthropic amplia suas parcerias de computação com o Google e a Broadrom A Anthropic amplia suas parcerias de computação com o Google e a Broadrom O laboratório de pesquisa em IA Anthropic anunciou nesta segunda-feira um novo acordo com o Google e a Broadcom para aumentar significativamente o poder de processamento e computação por trás de seus
Claude ganha terreno em relação ao ChatGPT à medida que os usuários migram Claude ganha terreno em relação ao ChatGPT à medida que os usuários migram Após uma série de controvérsias envolvendo o ChatGPT e sua empresa controladora, a OpenAI, um número crescente de usuários está migrando para o Claude.O ponto de virada ocorreu depois que a Anthropic,
O que o impasse da Anthropic com o Pentágono significa para a segurança nacional O que o impasse da Anthropic com o Pentágono significa para a segurança nacional As últimas duas semanas foram marcadas por um impasse público entre o CEO da Anthropic, Dario Amodei, e o secretário de Defesa, Pete Hegseth, centrado na aplicação da tecnologia de IA pelas Forças Arm
Recomendações de tópicos especiais relacionados
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
chatbot Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real
Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas
xix.ai
código Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique
Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique

Descubra as mais recentes e bem avaliadas ferramentas de IA de 2026 para testes unitários automatizados. Nossa seleção cuidadosa inclui soluções poderosas que podem transformar o seu processo, permitindo gerar casos de teste para Jest, PyTest e JUnit de forma instantânea. Compare opções gratuitas e pagas com testes reais e classificações atualizadas semanalmente no XIX.AI. Desfrute das vantagens da IA e aumente a produtividade do seu desenvolvimento hoje mesmo.

10 ferramentas
xix.ai
Comentários (1)
0/500
FredAnderson
FredAnderson 7 de Abril de 2026 à37 07:00:37 WEST

Interesting move by Anthropic. I wonder how the AI determines what's 'persistently abusive' – will there be transparency reports on these terminations? Could be a necessary safety feature, but also opens up a can of worms about AI's role in moderating speech. 🤔

OR