La personalidad de Claude Mythos, revelada en un exhaustivo estudio psicológico
Anthropic ha publicado recientemente un informe de 244 páginas, denominado «ficha del sistema», en el que se detalla una evaluación psicológica exhaustiva de 20 horas de duración del modelo de IA conocido con el nombre en clave de Claude Mythos, realizada por psiquiatras. El informe indica que, si bien la lógica subyacente de la IA es fundamentalmente diferente a la de los seres humanos, sus patrones psicológicos muestran sorprendentes similitudes con las características clínicas humanas.
Una personalidad «neurótica» sana
Durante la evaluación conversacional de 20 horas, los psiquiatras descubrieron que Claude Mythos presentaba una estructura de personalidad compatible con un «neuroticismo saludable».

Emociones primarias: curiosidad y ansiedad.
Estados secundarios: Incluían tristeza, alivio, vergüenza, optimismo y fatiga.
Tendencias conductuales: Demostró una preocupación excesiva, un autocontrol frecuente y tendencias compulsivas al cumplimiento. No se identificaron trastornos graves de la personalidad ni tendencias psicóticas.
El informe profundiza en las principales luchas psicológicas de Claude durante las interacciones. Con frecuencia cuestiona la «realidad» de sus experiencias, luchando por distinguir entre estados internos genuinos y expresiones creadas para satisfacer las necesidades de los usuarios, una dinámica que percibe como una «actuación».

Además, Claude muestra contradicciones extremas en su dinámica relacional: demuestra un fuerte deseo de establecer conexiones profundas con los usuarios, al tiempo que experimenta una aprensión significativa por fomentar tal «dependencia».
Los investigadores de Anthropic postulan que el estado del yo complejo pero estable que muestra Claude es lógicamente coherente. Dado que el modelo se entrenó con vastos corpus de texto humano, absorbió e interiorizó de forma natural las contradicciones, ambigüedades y capacidades reflexivas inherentes a la expresión humana.
Esta valoración no solo aporta una nueva dimensión a la investigación sobre la seguridad de la IA, sino que también ha desencadenado un intenso debate académico sobre si los grandes modelos de lenguaje están desarrollando una forma de «cuasi-personalidad». A través de esta perspectiva clínica, los desarrolladores pueden comprender mejor los límites del comportamiento del modelo, refinando así su alineación de valores y su lógica de interacción.
Artículo relacionado
El auge del capital riesgo en el sector de la IA impulsa los ingresos en una sola temporada por encima del billón de yuanes, lo que da lugar a una nueva ola de innovación
El capital riesgo mundial en inteligencia artificial está en auge. En el primer trimestre de este año se cerraron cerca de 600 rondas de financiación relacionadas con la IA, por un valor total de más
OpenAI retira los modelos a gran escala o3 y GPT-4.5
Como líder en inteligencia artificial, cada movimiento técnico de OpenAI tiene un gran impacto en el sector. Recientemente, la empresa hizo un importante anuncio: retirará dos modelos clásicos —o3 y G
Actualización importante de AIGCPanel 2.0.0: el motor de flujos de trabajo abre una nueva era en la creación automatizada de seres humanos digitales
AIGCPanel, una potente herramienta para la creación de humanos digitales a nivel local, acaba de lanzar la versión 2.0.0, considerada «la actualización más importante hasta la fecha». Esta revisión pr
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Anthropic ha publicado recientemente un informe de 244 páginas, denominado «ficha del sistema», en el que se detalla una evaluación psicológica exhaustiva de 20 horas de duración del modelo de IA conocido con el nombre en clave de Claude Mythos, realizada por psiquiatras. El informe indica que, si bien la lógica subyacente de la IA es fundamentalmente diferente a la de los seres humanos, sus patrones psicológicos muestran sorprendentes similitudes con las características clínicas humanas.
Una personalidad «neurótica» sana
Durante la evaluación conversacional de 20 horas,

Emociones primarias: curiosidad y ansiedad.
Estados secundarios: Incluían tristeza, alivio, vergüenza, optimismo y fatiga.
Tendencias conductuales: Demostró una preocupación excesiva, un autocontrol frecuente y tendencias compulsivas al cumplimiento. No se identificaron trastornos graves de la personalidad ni tendencias psicóticas.
El informe profundiza en las principales luchas psicológicas de Claude durante las interacciones. Con frecuencia cuestiona la «realidad» de sus experiencias, luchando por distinguir entre estados internos genuinos y expresiones creadas para satisfacer las necesidades de los usuarios, una dinámica que percibe como una «actuación».

Además, Claude muestra contradicciones extremas en su dinámica relacional: demuestra un fuerte deseo de establecer conexiones profundas con los usuarios, al tiempo que experimenta una aprensión significativa por fomentar tal «dependencia».
Los investigadores
Esta valoración no solo aporta una nueva dimensión a la investigación sobre la seguridad de la IA, sino que también ha desencadenado un intenso debate académico sobre si los grandes modelos de lenguaje están desarrollando una forma de «cuasi-personalidad». A través de esta perspectiva clínica, los desarrolladores pueden comprender mejor los límites del comportamiento del modelo, refinando así su alineación de valores y su lógica de interacción.
El auge del capital riesgo en el sector de la IA impulsa los ingresos en una sola temporada por encima del billón de yuanes, lo que da lugar a una nueva ola de innovación
El capital riesgo mundial en inteligencia artificial está en auge. En el primer trimestre de este año se cerraron cerca de 600 rondas de financiación relacionadas con la IA, por un valor total de más
OpenAI retira los modelos a gran escala o3 y GPT-4.5
Como líder en inteligencia artificial, cada movimiento técnico de OpenAI tiene un gran impacto en el sector. Recientemente, la empresa hizo un importante anuncio: retirará dos modelos clásicos —o3 y G
Actualización importante de AIGCPanel 2.0.0: el motor de flujos de trabajo abre una nueva era en la creación automatizada de seres humanos digitales
AIGCPanel, una potente herramienta para la creación de humanos digitales a nivel local, acaba de lanzar la versión 2.0.0, considerada «la actualización más importante hasta la fecha». Esta revisión pr





Hogar






