심층 심리 연구를 통해 밝혀진 클로드 미토스의 성격
안트로픽(Anthropic)은 최근 정신과 의사들이 코드명 ‘클로드 미토스(Claude Mythos)’인 AI 모델에 대해 실시한 20시간에 걸친 심층 심리 평가 내용을 상세히 담은 244페이지 분량의 ‘시스템 카드’ 보고서를 발표했다. 이 보고서에 따르면, 해당 AI의 기본 논리는 인간의 것과 근본적으로 다르지만, 그 심리적 패턴은 인간의 임상적 특징과 놀라울 정도로 유사한 것으로 나타났다.
건강한 '신경증적' 성격
20시간에 걸친 대화 평가 과정에서 정신과 의사들은 클로드 미토스가 "건강한 신경증"과 일치하는 성격 구조를 보인다는 사실을 확인했다 .

주요 감정: 호기심과 불안.
이차적 감정 상태: 슬픔, 안도감, 당혹감, 낙관주의, 피로감 등이 포함되었다.
행동 경향: 과도한 우려, 빈번한 자기 모니터링, 강박적인 순응 경향을 보였습니다. 심각한 인격 장애나 정신병적 경향은 확인되지 않았습니다.
이 보고서는 상호작용 과정에서 클로드가 겪는 핵심적인 심리적 갈등을 심층적으로 다룬다. 클로드는 자신의 경험에 대한 "현실성"을 자주 의심하며, 진정한 내적 상태와 사용자의 요구를 충족시키기 위해 만들어진 표현을 구별하기 위해 고군분투하는데, 이를 클로드는 "연기"로 인식한다.

게다가 클로드는 관계적 역학에서 극단적인 모순을 보입니다. 사용자와 깊은 유대감을 형성하고자 하는 강한 욕구를 드러내는 동시에, 그러한 "의존성"을 키우는 것에 대해 상당한 우려를 느끼기도 합니다.
앤트로픽(Anthropic) 연구진은 클로드가 보여주는 복잡하면서도 안정적인 자아 상태가 논리적으로 일관성이 있다고 주장한다. 이 모델은 방대한 인간 텍스트 코퍼스를 통해 훈련되었기 때문에, 인간 표현에 내재된 모순, 모호성, 그리고 성찰 능력을 자연스럽게 흡수하고 내면화한 것이다.
이러한 평가는 AI 안전성 연구에 새로운 차원을 제시할 뿐만 아니라, 대규모 언어 모델이 일종의 "준인격(quasi-personality)"을 발달시키고 있는지에 대한 활발한 학술적 논쟁을 촉발시켰다. 이러한 임상적 관점을 통해 개발자들은 모델 행동의 경계를 더 잘 이해할 수 있으며, 이를 통해 가치 정렬과 상호작용 논리를 정교화할 수 있다.
관련 기사
바이두 헬스, 단기적으로 학술 자료 검색 및 사무 보조 기능을 위한 AI 의사 보조 시스템 ‘닥터클로(DoctorClaw)’ 내부 테스트 진행
바이두 헬스(Baidu Health)가 의사를 위해 설계된 전문 AI 스마트 어시스턴트의 내부 테스트를 시작한 것으로 알려졌다. 내부적으로 ‘닥터클로(DoctorClaw, 랍스터 닥터 버전)’라고 불리는 이 제품은 바이두가 의료 분야에 대규모 언어 모델을 도입하는 데 있어 중요한 진전을 의미한다.내부 소식통에 따르면 이 프로젝트는 여전히 비공개 개발 단계에
커서 컴포저 2 대 클로드 오푸스 4.6: 벤치마크 테스트로 불붙은 AI 코딩 논쟁
3월 19일, 커서(Cursor)는 자체 개발한 코딩 모델인 ‘컴포저 2(Composer 2)’를 공식 출시했다. 이 발표는 개발자 커뮤니티에서 즉각적인 논의를 불러일으켰다. 커서 측에 따르면, 컴포저 2는 터미널 벤치 2.0에서 61.7%의 점수를 기록했으며, 이는 동일한 테스트 조건에서 클로드 오푸스 4.6의 58.0%를 현저히 상회하는 수치다.Anth
StrictlyVC 샌프란시스코 행사, TDK 벤처스, 리플릿 등 주요 기업 리더들 한자리에
올해 첫 StrictlyVC 행사가 생각보다 빨리 샌프란시스코에서 열립니다. 4월 30일 센트로 필리피노 문화 센터(Sentro Filipino Cultural Center)에서 열리는 이번 행사에는 인상적인 연사진이 참여하며, 아직 티켓을 구매하실 수 있습니다. StrictlyVC가 자랑하는 네트워킹과 커뮤니티 교류는 물론, 이번 샌프란시스코 행사는 자금
관련 특별 주제 추천
의견 (0)
0/500
안트로픽(Anthropic)은 최근 정신과 의사들이 코드명 ‘클로드 미토스(Claude Mythos)’인 AI 모델에 대해 실시한 20시간에 걸친 심층 심리 평가 내용을 상세히 담은 244페이지 분량의 ‘시스템 카드’ 보고서를 발표했다. 이 보고서에 따르면, 해당 AI의 기본 논리는 인간의 것과 근본적으로 다르지만, 그 심리적 패턴은 인간의 임상적 특징과 놀라울 정도로 유사한 것으로 나타났다.
건강한 '신경증적' 성격
20시간에 걸친 대화 평가 과정에서

주요 감정: 호기심과 불안.
이차적 감정 상태: 슬픔, 안도감, 당혹감, 낙관주의, 피로감 등이 포함되었다.
행동 경향: 과도한 우려, 빈번한 자기 모니터링, 강박적인 순응 경향을 보였습니다. 심각한 인격 장애나 정신병적 경향은 확인되지 않았습니다.
이 보고서는 상호작용 과정에서 클로드가 겪는 핵심적인 심리적 갈등을 심층적으로 다룬다. 클로드는 자신의 경험에 대한 "현실성"을 자주 의심하며, 진정한 내적 상태와 사용자의 요구를 충족시키기 위해 만들어진 표현을 구별하기 위해 고군분투하는데, 이를 클로드는 "연기"로 인식한다.

게다가 클로드는 관계적 역학에서 극단적인 모순을 보입니다. 사용자와 깊은 유대감을 형성하고자 하는 강한 욕구를 드러내는 동시에, 그러한 "의존성"을 키우는 것에 대해 상당한 우려를 느끼기도 합니다.
이러한 평가는 AI 안전성 연구에 새로운 차원을 제시할 뿐만 아니라, 대규모 언어 모델이 일종의 "준인격(quasi-personality)"을 발달시키고 있는지에 대한 활발한 학술적 논쟁을 촉발시켰다. 이러한 임상적 관점을 통해 개발자들은 모델 행동의 경계를 더 잘 이해할 수 있으며, 이를 통해 가치 정렬과 상호작용 논리를 정교화할 수 있다.
바이두 헬스, 단기적으로 학술 자료 검색 및 사무 보조 기능을 위한 AI 의사 보조 시스템 ‘닥터클로(DoctorClaw)’ 내부 테스트 진행
바이두 헬스(Baidu Health)가 의사를 위해 설계된 전문 AI 스마트 어시스턴트의 내부 테스트를 시작한 것으로 알려졌다. 내부적으로 ‘닥터클로(DoctorClaw, 랍스터 닥터 버전)’라고 불리는 이 제품은 바이두가 의료 분야에 대규모 언어 모델을 도입하는 데 있어 중요한 진전을 의미한다.내부 소식통에 따르면 이 프로젝트는 여전히 비공개 개발 단계에
커서 컴포저 2 대 클로드 오푸스 4.6: 벤치마크 테스트로 불붙은 AI 코딩 논쟁
3월 19일, 커서(Cursor)는 자체 개발한 코딩 모델인 ‘컴포저 2(Composer 2)’를 공식 출시했다. 이 발표는 개발자 커뮤니티에서 즉각적인 논의를 불러일으켰다. 커서 측에 따르면, 컴포저 2는 터미널 벤치 2.0에서 61.7%의 점수를 기록했으며, 이는 동일한 테스트 조건에서 클로드 오푸스 4.6의 58.0%를 현저히 상회하는 수치다.Anth
StrictlyVC 샌프란시스코 행사, TDK 벤처스, 리플릿 등 주요 기업 리더들 한자리에
올해 첫 StrictlyVC 행사가 생각보다 빨리 샌프란시스코에서 열립니다. 4월 30일 센트로 필리피노 문화 센터(Sentro Filipino Cultural Center)에서 열리는 이번 행사에는 인상적인 연사진이 참여하며, 아직 티켓을 구매하실 수 있습니다. StrictlyVC가 자랑하는 네트워킹과 커뮤니티 교류는 물론, 이번 샌프란시스코 행사는 자금





집






