option
Maison
Nouvelles
Anthropic introduit une fonction permettant à ses modèles Claude de mettre fin aux chats abusifs

Anthropic introduit une fonction permettant à ses modèles Claude de mettre fin aux chats abusifs

23 novembre 2025
84

Anthropic introduit une fonction permettant à ses modèles Claude de mettre fin aux chats abusifs

Anthropic a introduit une nouvelle fonctionnalité permettant à certains modèles avancés de mettre fin aux conversations dans ce que l'entreprise appelle "des cas rares et extrêmes d'interactions persistantes avec des utilisateurs nuisibles ou abusifs". Anthropic précise que cette mesure n'est pas mise en œuvre pour protéger les utilisateurs humains, mais pour protéger le modèle d'IA lui-même.

Pour clarifier, l'entreprise n'affirme pas que ses modèles d'IA Claude possèdent une sensibilité ou qu'ils peuvent être affectés par les conversations des utilisateurs. Comme l'explique Anthropic, l'entreprise reste "très incertaine quant au statut moral potentiel de Claude et d'autres grands modèles de langage, que ce soit actuellement ou à l'avenir".

Néanmoins, l'annonce fait référence à un programme récemment mis en place pour examiner le "bien-être du modèle", indiquant qu'Anthropic adopte une approche de précaution en "travaillant à l'identification et à la mise en œuvre d'interventions peu coûteuses pour atténuer les risques pour le bien-être du modèle, si ce bien-être devenait pertinent".

Cette nouvelle capacité est actuellement limitée aux modèles Claude Opus 4 et 4.1, conçus spécifiquement pour les "cas extrêmes" tels que "les demandes de contenus sexuels impliquant des mineurs ou les tentatives d'obtenir des informations permettant des violences à grande échelle ou des activités terroristes".

Alors que de telles demandes pourraient poser des problèmes juridiques ou de relations publiques à Anthropic (comme l'ont montré les récents rapports sur le ChatGPT, qui pourrait renforcer les idées délirantes des utilisateurs), l'entreprise indique que lors des tests de pré-déploiement, Claude Opus 4 a montré une "forte préférence contre" le respect de ces demandes et a affiché des "schémas suggérant une détresse" lorsqu'il a été contraint de répondre.

En ce qui concerne ces nouvelles capacités de fin de conversation, Anthropic précise que "Claude a pour instruction de n'utiliser cette fonction qu'en dernier recours, après que de multiples tentatives de redirection ont échoué et qu'un dialogue productif semble impossible, ou lorsque les utilisateurs demandent explicitement de mettre fin à une conversation".

Anthropic précise en outre que Claude a été "chargé de ne pas utiliser cette fonction dans les situations où les utilisateurs pourraient être confrontés à un risque imminent d'automutilation ou d'atteinte à autrui".

Événement Techcrunch

Les grands noms de la technologie et du capital-risque rejoignent l'agenda de Disrupt 2025

Netflix, ElevenLabs, Wayve, Sequoia Capital, Elad Gil - ce ne sont là que quelques-uns des leaders de l'industrie qui se joindront à l'agenda de Disrupt 2025. Ils partageront des informations cruciales pour accélérer la croissance des startups et renforcer votre avantage concurrentiel. Ne manquez pas l'édition du 20e anniversaire de TechCrunch Disrupt - réservez votre billet dès maintenant et économisez plus de 600 $ avant que les prix n'augmentent.

Les grands noms de la technologie et du capital-risque se joignent à l'agenda de Disrupt 2025

Netflix, ElevenLabs, Wayve, Sequoia Capital - parmi les innovateurs de premier plan qui rejoignent le programme de Disrupt 2025. Ils sont là pour fournir des informations précieuses qui favorisent l'expansion des startups et améliorent votre positionnement concurrentiel. Rejoignez-nous pour la célébration du 20e anniversaire de TechCrunch Disrupt - achetez votre billet dès aujourd'hui et économisez jusqu'à 675 $ avant que les tarifs ne changent.

San Francisco | 27-29 octobre 2025 INSCRIVEZ-VOUS DÈS MAINTENANT

Lorsque Claude met fin à une conversation, Anthropic note que les utilisateurs peuvent toujours lancer de nouvelles conversations à partir du même compte et créer d'autres branches de conversation en modifiant leurs réponses précédentes.

"Nous abordons cette fonctionnalité comme une expérience en cours et nous continuerons à affiner notre méthodologie", déclare l'entreprise.

Article connexe
Anthropic renforce ses partenariats en matière de calcul avec Google et Broadrom Anthropic renforce ses partenariats en matière de calcul avec Google et Broadrom Le laboratoire de recherche en IA Anthropic a annoncé lundi la conclusion d'un nouvel accord avec Google et Broadcom visant à renforcer considérablement la puissance de traitement et de calcul de ses
Claude gagne du terrain face à ChatGPT alors que les utilisateurs migrent vers cette plateforme Claude gagne du terrain face à ChatGPT alors que les utilisateurs migrent vers cette plateforme À la suite d'une série de controverses impliquant ChatGPT et sa société mère OpenAI, un nombre croissant d'utilisateurs se tournent vers Claude.Le tournant s'est produit après qu'A
Ce que l'impasse entre Anthropic et le Pentagone signifie pour la sécurité nationale Ce que l'impasse entre Anthropic et le Pentagone signifie pour la sécurité nationale Ces deux dernières semaines ont été marquées par un bras de fer public entre Dario Amodei, PDG d’Anthropic, et Pete Hegseth, secrétaire à la Défense, portant sur l’utilisation de l’intelligence artifi
Recommandations de sujets spéciaux liés
Entreprise Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats
Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats

Découvrez les meilleurs outils de recrutement basés sur l'IA de 2026 sur XIX.AI. Notre sélection propose des solutions performantes et révolutionnaires pour l'analyse des CV et l'automatisation de la planification des entretiens avec les candidats. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez l'assistant de recrutement idéal et optimisez votre processus de recrutement dès aujourd'hui !

10 outils
xix.ai
Productivité Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale
Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale

Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.

10 outils
xix.ai
chatbot Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes
Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes

Découvrez les meilleurs chatbots romantiques basés sur l'IA de 2026, sélectionnés pour vous aider à nouer des relations authentiques et durables. Notre sélection comprend des personnalités fortes et cohérentes, des comparaisons entre versions gratuites et payantes, ainsi que des tests en conditions réelles. Trouvez le compagnon idéal et commencez dès aujourd'hui sur XIX.AI.

10 outils
xix.ai
Éducation et apprentissage Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique
Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique

Découvrez les meilleurs mentors en sciences des données et en intelligence artificielle pour 2026 afin de maîtriser SQL, Pandas et les workflows d'apprentissage automatique. Explorez notre sélection soigneusement élaborée sur XIX.AI pour bénéficier d'une guidance puissante et révolutionnaire. Comparez les options gratuites et payantes en tenant compte de perspectives pratiques. Développez rapidement vos compétences en sciences des données.

10 outils
xix.ai
chatbot Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel
Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel

Découvrez les meilleurs outils d'entraînement au flirt et à la conversation basés sur l'IA de 2026 sur XIX.AI. Notre sélection triée sur le volet et très bien notée vous aide à développer votre charisme social et votre confiance en vous en temps réel. Découvrez des outils incontournables qui changent la donne, avec des comparaisons entre versions gratuites et payantes ainsi que des classements mis à jour chaque semaine. Développez dès aujourd'hui vos compétences sociales.

10 outils
xix.ai
code Meilleurs outils d'IA pour les tests unitaires automatisés : générer des cas de test Jest, PyTest et JUnit en un clic
Meilleurs outils d'IA pour les tests unitaires automatisés : générer des cas de test Jest, PyTest et JUnit en un clic

Découvrez les derniers outils d'IA hautement réputés de 2026 pour les tests unitaires automatisés. Notre sélection rigoureusement élaborée vous propose des solutions puissantes et révolutionnaires pour générer instantanément des cas de test Jest, PyTest et JUnit. Comparez les options gratuites et payantes à l'aide de tests réels et des classements mises à jour chaque semaine sur XIX.AI. Développez un avantage concurrentiel grâce à l'IA et améliorez rapidement votre productivité en développement.

10 outils
xix.ai
commentaires (1)
0/500
FredAnderson
FredAnderson 7 avril 2026 08:00:37 UTC+02:00

Interesting move by Anthropic. I wonder how the AI determines what's 'persistently abusive' – will there be transparency reports on these terminations? Could be a necessary safety feature, but also opens up a can of worms about AI's role in moderating speech. 🤔

OR