A Anthropic apresenta um recurso para que seus modelos Claude encerrem bate-papos abusivos

Lar

Notícias

23 de Novembro de 2025

JackMartin

# Claude

A Anthropic apresenta um recurso para que seus modelos Claude encerrem bate-papos abusivos

A Anthropic introduziu uma nova funcionalidade que permite que modelos avançados selecionados encerrem conversas no que a empresa chama de "instâncias raras e extremas de interações persistentemente prejudiciais ou abusivas do usuário". Notavelmente, a Anthropic afirma que essa medida é implementada não para proteger os usuários humanos, mas para proteger o próprio modelo de IA.

Para esclarecer, a empresa não está afirmando que seus modelos de IA Claude possuem sensibilidade ou podem sofrer danos com as conversas dos usuários. Como explica a Anthropic, a empresa permanece "altamente incerta sobre o possível status moral do Claude e de outros grandes modelos de linguagem, seja atualmente ou no futuro".

No entanto, o anúncio faz referência a um programa recentemente estabelecido que examina o "bem-estar do modelo", indicando que a Anthropic está adotando uma abordagem preventiva ao "trabalhar para identificar e implementar intervenções de baixo custo para mitigar os riscos ao bem-estar do modelo, caso esse bem-estar se torne relevante".

Esse novo recurso está atualmente restrito aos modelos Claude Opus 4 e 4.1, projetados especificamente para "casos extremos", como "solicitações de conteúdo sexual envolvendo menores ou tentativas de obter informações que possibilitem violência em larga escala ou atividades terroristas".

Embora essas solicitações possam gerar desafios legais ou de relações públicas para a Anthropic (como visto em relatórios recentes sobre o ChatGPT que potencialmente reforça o pensamento delirante dos usuários), a empresa informa que, durante os testes de pré-implantação, o Claude Opus 4 demonstrou uma "forte preferência contra" o cumprimento dessas solicitações e exibiu "padrões que sugerem angústia" quando forçado a responder.

Com relação a esses novos recursos de encerramento de conversas, a Anthropic esclarece que "o Claude é instruído a empregar essa função apenas como último recurso, depois que várias tentativas de redirecionamento falharem e o diálogo produtivo parecer impossível, ou quando os usuários solicitarem explicitamente o encerramento de um bate-papo".

A Anthropic especifica ainda que o Claude foi "orientado a não utilizar esse recurso em situações em que os usuários possam correr o risco iminente de se machucar ou prejudicar outras pessoas".

Evento da Techcrunch

Netflix, ElevenLabs, Wayve, Sequoia Capital, Elad Gil - apenas alguns dos líderes do setor que participam da agenda do Disrupt 2025. Eles compartilharão percepções cruciais para acelerar o crescimento de startups e aprimorar sua vantagem competitiva. Não perca a edição do 20º aniversário do TechCrunch Disrupt - garanta seu ingresso agora e economize mais de US$ 600 antes que os preços aumentem.

Netflix, ElevenLabs, Wayve, Sequoia Capital - entre os inovadores proeminentes que participam da agenda do Disrupt 2025. Eles estão aqui para fornecer insights valiosos que impulsionam a expansão de startups e melhoram seu posicionamento competitivo. Junte-se a nós na comemoração do 20º aniversário do TechCrunch Disrupt - compre seu ingresso hoje e economize até US$ 675 antes da alteração das tarifas.

São Francisco | 27 a 29 de outubro de 2025 INSCREVA-SE AGORA

Quando Claude encerra uma conversa, a Anthropic observa que os usuários ainda podem iniciar novas conversas a partir da mesma conta e criar ramificações de conversas alternativas modificando suas respostas anteriores.

"Estamos abordando esse recurso como um experimento contínuo e continuaremos refinando nossa metodologia", afirma a empresa.

Artigo relacionado

A Anthropic amplia suas parcerias de computação com o Google e a Broadrom O laboratório de pesquisa em IA Anthropic anunciou nesta segunda-feira um novo acordo com o Google e a Broadcom para aumentar significativamente o poder de processamento e computação por trás de seus

Claude ganha terreno em relação ao ChatGPT à medida que os usuários migram Após uma série de controvérsias envolvendo o ChatGPT e sua empresa controladora, a OpenAI, um número crescente de usuários está migrando para o Claude.O ponto de virada ocorreu depois que a Anthropic,

O que o impasse da Anthropic com o Pentágono significa para a segurança nacional As últimas duas semanas foram marcadas por um impasse público entre o CEO da Anthropic, Dario Amodei, e o secretário de Defesa, Pete Hegseth, centrado na aplicação da tecnologia de IA pelas Forças Arm

Recomendações de tópicos especiais relacionados

Negócios

Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas

xix.ai

Negócios

As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas

xix.ai

Produtividade

Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas

xix.ai

chatbot

Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas

xix.ai

Educação e Aprendizagem

Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas

xix.ai

chatbot

Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas

xix.ai

Comentários (1)

0/500

Por favor, faça o login primeiro

FredAnderson

7 de Abril de 2026 à37 07:00:37 WEST

Interesting move by Anthropic. I wonder how the AI determines what's 'persistently abusive' – will there be transparency reports on these terminations? Could be a necessary safety feature, but also opens up a can of worms about AI's role in moderating speech. 🤔

Principais notícias

AI Builder e Power Automate Revolucionam a Sumarização de Documentos Hosts de IA do podcast Notebooklm agora disponíveis para entrevistas China revela padrão nacional para robôs humanóides e inteligência incorporada Platôs de adoção de IA corporativa, revelam dados da Ramp Tutorial do Criador de Imagens do Bing: Guia de Geração de Arte por IA Aprenda a criar música de IA usando sua voz: um tutorial passo a passo do SUNO iMyFone MagicMic: Revisão e Tutorial de Mudança de Voz AI em Tempo Real Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como uma revolução na IA multimodal A Embodied Intelligence divulga a primeira norma do setor para conter o crescimento descontrolado

Mais

Apresentou