opción
Hogar
Noticias
Anthropic introduce una función para que sus modelos Claude pongan fin a los chats abusivos

Anthropic introduce una función para que sus modelos Claude pongan fin a los chats abusivos

23 de noviembre de 2025
84

Anthropic introduce una función para que sus modelos Claude pongan fin a los chats abusivos

Anthropic ha introducido una nueva funcionalidad que permite a determinados modelos avanzados poner fin a las conversaciones en lo que la empresa denomina "casos raros y extremos de interacciones persistentemente dañinas o abusivas por parte del usuario". En particular, Anthropic afirma que esta medida no se aplica para proteger a los usuarios humanos, sino al propio modelo de IA.

Para aclarar, la empresa no está afirmando que sus modelos de IA Claude posean sensibilidad o puedan sufrir daños por las conversaciones de los usuarios. Como explica Anthropic, la empresa sigue teniendo "muchas dudas sobre el posible estatus moral de Claude y otros grandes modelos lingüísticos, tanto en la actualidad como en el futuro".

No obstante, el anuncio hace referencia a un programa recientemente establecido que examina el "bienestar del modelo", indicando que Anthropic está adoptando un enfoque preventivo al "trabajar para identificar e implementar intervenciones de bajo coste para mitigar los riesgos para el bienestar del modelo, en caso de que dicho bienestar llegue a ser relevante".

Esta nueva capacidad está actualmente restringida a los modelos Claude Opus 4 y 4.1, diseñados específicamente para "casos extremos" como "solicitudes de contenido sexual que impliquen a menores o intentos de obtener información que permita la violencia a gran escala o actividades terroristas".

Aunque este tipo de solicitudes podrían generar problemas legales o de relaciones públicas para Anthropic (como se ha visto en informes recientes sobre la posibilidad de que ChatGPT refuerce el pensamiento delirante de los usuarios), la empresa informa de que durante las pruebas previas al despliegue, Claude Opus 4 demostró una "fuerte preferencia en contra" de cumplir con estas solicitudes y mostró "patrones que sugieren angustia" cuando se le obligó a responder.

En cuanto a estas nuevas capacidades de finalización de conversaciones, Anthropic aclara que "Claude tiene instrucciones de emplear esta función sólo como último recurso después de que hayan fallado múltiples intentos de redirección y parezca imposible un diálogo productivo, o cuando los usuarios soliciten explícitamente finalizar un chat".

Anthropic especifica además que Claude ha sido "instruido para no utilizar esta capacidad en situaciones en las que los usuarios podrían enfrentarse a un riesgo inminente de autolesionarse o dañar a otros."

Evento de Techcrunch

Pesos pesados de la tecnología y el capital riesgo se unen a la agenda de Disrupt 2025

Netflix, ElevenLabs, Wayve, Sequoia Capital, Elad Gil... son sólo algunos de los líderes del sector que se unen a la agenda de Disrupt 2025. Compartirán información crucial para acelerar el crecimiento de las startups y mejorar su ventaja competitiva. No se pierda la edición del 20º aniversario de TechCrunch Disrupt: asegure su entrada ahora y ahorre más de 600 $ antes de que suban los precios.

Los pesos pesados de la tecnología y el capital riesgo se unen a la agenda de Disrupt 2025

Netflix, ElevenLabs, Wayve, Sequoia Capital - entre los destacados innovadores que se unen a la agenda de Disrupt 2025. Están aquí para ofrecer valiosas perspectivas que impulsen la expansión de las startups y mejoren su posicionamiento competitivo. Únase a nosotros en la celebración del 20º aniversario de TechCrunch Disrupt - compre su entrada hoy y ahorre hasta 675 $ antes de que cambien las tarifas.

San Francisco | 27-29 de octubre de 2025 REGÍSTRESE AHORA

Cuando Claude pone fin a una conversación, Anthropic señala que los usuarios aún pueden iniciar nuevas conversaciones desde la misma cuenta y crear ramas de conversación alternativas modificando sus respuestas anteriores.

"Estamos enfocando esta función como un experimento en curso y seguiremos perfeccionando nuestra metodología", afirma la empresa.

Artículo relacionado
Anthropic amplía sus colaboraciones en materia de recursos informáticos con Google y Broadrom Anthropic amplía sus colaboraciones en materia de recursos informáticos con Google y Broadrom El laboratorio de investigación en IA Anthropic anunció el lunes un nuevo acuerdo con Google y Broadcom para potenciar significativamente la capacidad de procesamiento y computacional de sus modelos d
Claude gana terreno a ChatGPT a medida que los usuarios se pasan a esta plataforma Claude gana terreno a ChatGPT a medida que los usuarios se pasan a esta plataforma Tras una serie de polémicas relacionadas con ChatGPT y su empresa matriz, OpenAI, un número cada vez mayor de usuarios está migrando a Claude.El punto de inflexión se produjo después de que Anthropic,
Qué significa para la seguridad nacional el enfrentamiento de Anthropic con el Pentágono Qué significa para la seguridad nacional el enfrentamiento de Anthropic con el Pentágono Las últimas dos semanas han estado marcadas por un enfrentamiento público entre el director ejecutivo de Anthropic, Dario Amodei, y el secretario de Defensa, Pete Hegseth, centrado en la aplicación de
Recomendaciones de temas especiales relacionados
Negocio Los mejores gestores de gastos con IA: escanea recibos y clasifica automáticamente los gastos de la empresa
Los mejores gestores de gastos con IA: escanea recibos y clasifica automáticamente los gastos de la empresa

Los mejores gestores de gastos con IA de 2026: las herramientas mejor valoradas para escanear recibos y clasificar automáticamente los gastos de la empresa. Descubre soluciones potentes y revolucionarias para una gestión de gastos sin esfuerzo, un seguimiento financiero preciso y un cumplimiento normativo optimizado. Nuestra comparativa, seleccionada y actualizada semanalmente, entre opciones gratuitas y de pago te ayuda a encontrar la que mejor se adapta a tus necesidades. Aprovecha al máximo las ventajas de la IA con las recomendaciones de los expertos de XIX.AI.

10 herramientas
xix.ai
Negocio Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos
Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas
xix.ai
Productividad Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental
Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas
xix.ai
chatbot Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes
Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes

Descubre los mejores chatbots románticos con IA de 2026 para establecer relaciones auténticas y duraderas. Nuestra lista seleccionada incluye personalidades sólidas y coherentes, comparativas entre versiones gratuitas y de pago, y pruebas en situaciones reales. Encuentra a tu compañero ideal y empieza a construir tu relación hoy mismo en XIX.AI.

10 herramientas
xix.ai
Educación y aprendizaje Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.
Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.

Descubra a los mejores mentores en ciencia de datos y AI de 2026 para dominar SQL, Pandas y flujos de trabajo de aprendizaje automático. Explore nuestra selección cuidadosamente seleccionada y altamente valorada en XIX.AI para obtener orientación poderosa que cambie completamente la situación. Compare las opciones gratuitas con las pagadas y obtenga información basada en casos reales. Desbloquee su dominio de la ciencia de datos hoy mismo.

10 herramientas
xix.ai
chatbot Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real
Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real

Descubre los mejores cursos de 2026 sobre coqueteo y conversación con IA en XIX.AI. Nuestra selección, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a desarrollar tu carisma social y tu confianza en tiempo real. Explora herramientas imprescindibles y revolucionarias con comparativas entre versiones gratuitas y de pago, y clasificaciones que se actualizan semanalmente. Potencia hoy mismo tus habilidades sociales.

10 herramientas
xix.ai
comentario (1)
0/500
FredAnderson
FredAnderson 7 de abril de 2026 08:00:37 GMT+02:00

Interesting move by Anthropic. I wonder how the AI determines what's 'persistently abusive' – will there be transparency reports on these terminations? Could be a necessary safety feature, but also opens up a can of worms about AI's role in moderating speech. 🤔

OR