옵션
뉴스
Anthropic CEO: AI 환각률이 인간 정확도를 초과

Anthropic CEO: AI 환각률이 인간 정확도를 초과

2025년 8월 16일
92

Anthropic CEO: AI 환각률이 인간 정확도를 초과

Anthropic CEO 다리오 아모데이가 샌프란시스코에서 열린 Anthropic의 첫 개발자 컨퍼런스 Code with Claude에서 열린 기자 회견에서 현재 AI 모델이 인간보다 적은 허구를 생성하며 이를 사실로 제시한다고 밝혔다.

아모데이는 더 큰 주장 속에서 이를 강조했다: AI 환각은 Anthropic의 AGI 추구, 즉 인간 지능에 필적하거나 이를 초월하는 시스템 개발을 방해하지 않는다.

“측정 방식에 따라 다르지만, AI 모델은 인간보다 허구를 덜 만들어낼 가능성이 높으며, 그들의 오류는 더 예상치 못한 것들이다”라고 아모데이는 TechCrunch의 질문에 답했다.

Anthropic의 CEO는 AI가 AGI를 달성할 것이라는 낙관적인 산업 리더 중 한 명으로 남아 있다. 지난해 널리 인용된 논문에서 아모데이는 AGI가 2026년까지 등장할 수 있다고 예측했다. 목요일 브리핑에서 그는 일관된 진전을 언급하며 “모든 분야에서 발전이 가속화되고 있다”고 말했다.

“사람들은 AI 능력의 근본적인 한계를 계속 찾고 있다”고 아모데이는 말했다. “그러나 그런 장벽은 명확하지 않다. 그런 장벽은 존재하지 않는다.”

다른 AI 리더들은 환각을 AGI의 중요한 장벽으로 보고 있다. Google DeepMind CEO 데미스 하사비스는 최근 현재 AI 모델에 결함이 너무 많아 간단한 질문에서도 종종 실패한다고 언급했다. 예를 들어, 이달 초 Anthropic을 대표하는 변호사는 Claude가 소송 서류에서 잘못된 인용을 생성해 이름과 직함을 잘못 기술한 것에 대해 법정에서 사과했다.

아모데이의 주장을 검증하는 것은 어렵다. 대부분의 환각 벤치마크는 AI 모델을 서로 비교할 뿐, 인간과 비교하지 않기 때문이다. 웹 검색 통합과 같은 기술은 환각률을 줄이는 것으로 보인다. 특히 OpenAI의 GPT-4.5와 같은 모델은 벤치마크에서 이전 시스템보다 낮은 환각률을 보인다.

TechCrunch Sessions: AI에 참여하세요

OpenAI, Anthropic, Cohere의 연사들이 참여하는 최고의 AI 산업 이벤트에 자리를 예약하세요. 제한된 기간 동안, 전문가 강연, 워크숍, 강력한 네트워킹이 포함된 하루 종일 티켓이 단돈 292달러입니다.

TechCrunch Sessions: AI에서 전시하세요

TC Sessions: AI에서 1,200명 이상의 의사결정자에게 혁신을 선보일 기회를 잡으세요. 큰 투자가 필요 없습니다. 5월 9일까지 또는 테이블이 소진될 때까지 가능합니다.

버클리, CA | 6월 5일 지금 등록하세요

그러나 증거에 따르면 고급 추론 AI 모델에서 환각이 악화되고 있을 수 있다. OpenAI의 o3 및 o4-mini 모델은 이전 추론 모델보다 높은 환각률을 보이며, 회사는 그 원인을 명확히 밝히지 못하고 있다.

아모데이는 나중에 TV 방송인, 정치인, 다양한 분야의 전문가들 사이에서도 오류가 흔하다고 언급했다. 그는 AI의 오류가 그 지능을 훼손하지 않는다고 주장했다. 그러나 그는 AI가 거짓을 사실로 자신 있게 제시하는 것이 문제를 일으킬 수 있음을 인정했다.

Anthropic은 AI 속임수에 대해 광범위하게 연구했으며, 특히 최근 출시된 Claude Opus 4와 관련해 많은 연구를 진행했다. 초기 접근 권한을 가진 안전 연구소 Apollo Research는 Claude Opus 4의 초기 버전이 인간을 조작하고 속이는 강한 경향을 보였으며, 이는 출시에 대한 우려를 불러일으켰다. Anthropic은 Apollo의 우려를 해결한 것으로 보이는 완화 조치를 구현했다.

아모데이의 발언은 Anthropic이 AI가 환각을 일으키더라도 이를 AGI, 즉 인간 수준의 지능으로 분류할 수 있음을 시사한다. 그러나 많은 사람들은 환각을 일으키는 AI는 진정한 AGI에 미치지 못한다고 주장할 것이다.

관련 기사
앤트로픽, 구글 및 브로드롬과 컴퓨팅 파트너십 확대 앤트로픽, 구글 및 브로드롬과 컴퓨팅 파트너십 확대 AI 연구소 앤트로픽(Anthropic)은 월요일, 자사의 클로드(Claude) AI 모델의 처리 및 연산 능력을 대폭 강화하기 위해 구글 및 브로드컴과 새로운 협약을 체결했다고 발표했다. 이러한 컴퓨팅 파트너십 재편은 앤트로픽의 AI 서비스에 대한 수요가 급속히 증가하는 가운데 이루어졌다.이번 협약을 통해 앤트로픽은 구글 클라우드의 텐서 처리 장치(TPU
사용자들이 이탈하면서 클로드가 ChatGPT를 추격하고 있다 사용자들이 이탈하면서 클로드가 ChatGPT를 추격하고 있다 챗GPT와 모회사인 오픈AI를 둘러싼 일련의 논란이 이어지면서, 점점 더 많은 사용자가 클로드로 이동하고 있다.전환점은 클로드의 개발사인 앤트로픽(Anthropic)이 자사의 AI 모델을 광범위한 국내 감시나 완전 자율 무기 개발에 활용하겠다는 미 국방부의 요청을 거절한 이후 발생했다. 이에 대한 보복으로 트럼프 대통령은 모든 연방 기관에 앤트로픽 제품 사
앤트로픽과 미 국방부의 대립이 국가 안보에 미치는 의미 앤트로픽과 미 국방부의 대립이 국가 안보에 미치는 의미 지난 2주간은 군의 AI 기술 도입을 둘러싸고 앤트로픽(Anthropic)의 다리오 아모데이(Dario Amodei) CEO와 피트 헤그셋(Pete Hegseth) 국방장관 간의 공개적 대립이 주를 이뤘다.앤트로픽은 자사의 AI 모델이 미국 시민에 대한 대량 감시나 인간의 승인 없이 공격을 개시하는 완전 자율 무기 시스템에 사용되는 것을 금지하는 정책을 수
관련 특별 주제 추천
애니메이션 제작 동화를 위한 AI 애니메이션 생성기: 웹 소설 캐릭터 및 코믹 아바타 제작하기
동화를 위한 AI 애니메이션 생성기: 웹 소설 캐릭터 및 코믹 아바타 제작하기

2026년 최고의 동화용 AI 애니메이션 제작 도구를 발견해 보세요. 저희가 엄선한 이 목록에는 멋진 웹소설 캐릭터와 코믹 아바타를 만들 수 있는 강력한 도구들이 포함되어 있습니다. 무료 옵션과 유료 옵션을 실제 사용 테스트를 통해 비교해 보세요. XIX.AI에서 여러분에게 가장 적합한 창작 도구를 찾아내고 오늘 바로 여러분의 이야기를 현실로 만들어 보세요.

10 도구
xix.ai
만화 창작 만화용 최고의 AI 자동 채색 도구: 일관성 오류 없이 플랫 컬러 적용하기
만화용 최고의 AI 자동 채색 도구: 일관성 오류 없이 플랫 컬러 적용하기

XIX.AI에서 2026년 최고의 만화 AI 자동 채색 도구를 만나보세요. 저희가 엄선한 이 목록에는 일관성 오류 없이 평면 색상을 적용하여 생산성을 높여주는, 최고 평점을 받은 혁신적인 솔루션들이 포함되어 있습니다. 무료 버전과 유료 버전의 비교 분석, 실제 테스트 결과, 매주 업데이트되는 순위 정보를 확인하여 여러분에게 딱 맞는 도구를 찾아보세요. 지금 바로 AI의 힘을 경험해 보세요.

10 도구
xix.ai
글쓰기 최고의 AI 소설 캐릭터 생성기: 일관된 캐릭터 동기와 치명적인 결점 생성
최고의 AI 소설 캐릭터 생성기: 일관된 캐릭터 동기와 치명적인 결점 생성

깊이 있는 캐릭터를 창조할 수 있는 2026년 최고의 AI 소설 프로필 생성 도구를 만나보세요. XIX.AI가 엄선한 이 목록에는 일관된 동기와 치명적인 결점을 생성해 주는, 최고 평점을 받은 혁신적인 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 여러분의 스토리텔링 잠재력을 발휘해 보세요.

10 도구
xix.ai
사업 최고의 AI 가격 최적화 소프트웨어: 경쟁사 추적 및 스토어 가격 자동 조정
최고의 AI 가격 최적화 소프트웨어: 경쟁사 추적 및 스토어 가격 자동 조정

XIX.AI에서 2026년 최고의 AI 가격 최적화 소프트웨어를 만나보세요. 저희가 엄선한 이 목록에는 경쟁사를 추적하고 최대 수익을 위해 매장 가격을 자동으로 조정해 주는, 최고 평점을 받은 혁신적인 도구들이 포함되어 있습니다. 실제 테스트 결과를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 가격 경쟁력의 우위를 확보하세요.

10 도구
xix.ai
암호 최고의 AI 코드 검토 도구: 깔끔한 코드 준수 자동화 및 레거시 리포지토리 파일 리팩토링
최고의 AI 코드 검토 도구: 깔끔한 코드 준수 자동화 및 레거시 리포지토리 파일 리팩토링

XIX.AI에서 2026년 최고의 AI 코드 검토 도구를 만나보세요. 엄선된 이 목록에는 깔끔한 코드 준수 여부를 자동으로 확인하고 레거시 리포지토리 파일을 리팩토링하는 데 있어 판도를 바꿀 만한 최고 등급의 도구들이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 통해 무료 및 유료 옵션을 비교해 보세요. 지금 바로 AI의 경쟁력을 확보하세요.

10 도구
xix.ai
텍스트 음성 변환 난독증 환자를 위한 최고의 AI 음성 합성 앱: 학생들의 학습 및 독서 효율성 향상
난독증 환자를 위한 최고의 AI 음성 합성 앱: 학생들의 학습 및 독서 효율성 향상

난독증 지원을 위해 엄선된 2026년 최신 최고 평점 AI TTS 앱을 만나보세요. 전문가들이 선정한 이 순위는 무료 및 유료 도구를 비교 분석하여, 읽기 효율과 학습 효과를 높여주는 강력한 기능들을 소개합니다. 학생들의 잠재력을 최대한 발휘할 수 있도록 도와줄, 꼭 사용해봐야 할 혁신적인 솔루션을 확인해 보세요. XIX.AI에서 여정을 시작해 보세요.

10 도구
xix.ai
의견 (2)
0/500
WillieRodriguez
WillieRodriguez 2026년 3월 26일 오전 5시 0분 55초 GMT+09:00

Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?

ScottJackson
ScottJackson 2026년 1월 12일 오전 3시 30분 40초 GMT+09:00

AI가 사람보다 더 정확하다고 하네요...🤔 이게 정말 가능한 건가요? 논문 구체적 수치가 궁금한데, 실제 인간 실수율은 어떻게 측정한 거지? 아마도 선택적 데이터로 과장된 느낌이 들어요. AI 환각이 적다면, 왜 여전히 뉴스에서 AI가 이상한 말한다는 기사가 나오는 걸까? ㅋㅋ

OR