클로드 오푸스 4.7, 인공지능보다 신뢰성을 중시하며 출시

집

뉴스

2026년 6월 5일

DouglasHarris

Anthropic은 올해도 거의 이틀에 한 번꼴로 새로운 기능을 출시하며 공격적인 행보를 이어가고 있습니다. 많은 기대를 모았던 Claude Opus 4.7이 방금 공식 출시되었는데, 흥미롭게도 Anthropic은 발표문에서 “이 모델이 우리가 개발한 가장 강력한 모델은 아닙니다”라고 솔직하게 밝혔습니다. 소문으로만 돌던 더 강력한 'Claude Mythos Preview'는 여전히 대기 상태입니다. 그럼에도 불구하고 Opus 4.7은 "더 똑똑해지는 것"보다는 "더 신뢰할 수 있게 되는 것"이라는 과제를 해결했다는 점에서 상당한 관심을 불러일으켰습니다.

벤치마크 결과는 특히 인상적이다. 엄격한 코딩 벤치마크인 SWE-bench Pro에서 4.7은 이전 버전의 53.4%에서 64.3%로 약 11%포인트 상승하며 GPT-5.4(57.7%)와 Gemini 3.1 Pro(54.2%)를 앞질렀습니다. 시각 추론 벤치마크인 CharXiv에서는 새로 추가된 2576픽셀 장변 인식 기능 덕분에 69.1%에서 82.1%로 상승했으며, 이는 이전 모델보다 3배 이상 선명한 성능을 제공합니다. 도구 호출 평가인 MCP-Atlas에서는 77.3%를 기록했으며, 법률 AI 플랫폼인 Harvey의 BigLaw 벤치마크에서는 90.9%를 달성했습니다. 그러나 에이전트 검색 평가인 BrowseComp에서는 4.7이 83.7%에서 79.3%로 소폭 하락하여 GPT-5.4와 Gemini에 뒤처졌습니다. 이는 정보가 불완전할 때 추측하기보다는 오류를 보고하는 것을 선호하는 "허위 정보 없음"이라는 성격 때문으로 보입니다.

수치 이상의 변화로, 성격의 변화가 더욱 주목할 만하다. Replit의 리더는 테스트 후 다음과 같이 언급했습니다. "기술적 논의에서 저에게 도전 과제를 제시하고, 더 나은 결정을 내리는 데 도움을 주며, 진정으로 더 나은 동료처럼 행동합니다." 데이터 과학 플랫폼 Hex 또한 4.7 버전이 데이터가 누락되었을 때 이전처럼 "겉보기에는 타당해 보이지만 완전히 잘못된" 대체 값을 제공하는 대신 오류를 직접 보고한다는 점을 관찰했습니다. 동시에 작업 회복력도 크게 향상되었습니다. Notion 팀의 테스트에 따르면, 이 도구의 오류율은 이전 수준의 3분의 1로 감소했으며, 툴 체인이 실패하더라도 장애물을 극복하고 독립적으로 작업을 완료할 수 있는 것으로 나타났습니다. Vercel은 심지어 새로운 행동 양식을 발견하기도 했습니다. 4.7은 시스템 수준의 코드를 작성하기 전에 먼저 스스로 수학적 증명을 수행합니다.

물론, 향상된 기능에는 대가가 따릅니다. 4.7 버전은 새로운 토큰화기를 도입하여 동일한 텍스트에 대해 1~1.35배 더 많은 토큰을 생성합니다. 또한 복잡한 작업에 대해 "조금 더 오래 생각하는" 경향이 있어, 실제 소비량은 거의 확실하게 더 높을 것입니다. 이를 해결하기 위해 Anthropic은 'xhigh'라는 초고강도 사고 레벨을 추가했습니다. Claude Code는 모든 패키지를 기본적으로 이 레벨로 설정했으며, 개발자가 토큰 사용량을 관리할 수 있도록 돕기 위해 'Deep Review' 명령어(/ultrareview), Max 사용자용 'Auto Mode' 확장 기능, 그리고 '작업 예산(task budget)' 기능의 공개 베타 버전을 출시했습니다.

더 강력한 Mythos Preview는 최근 사이버 보안 연구를 위해 "Project Glasswing"이라는 이름으로 기업용 서비스로 제공되기 시작했으나, 압도적인 성능과 미완성된 보안 평가로 인해 아직 공개되지 않았습니다.

오늘 출시된 4.7 버전은 Anthropic의 고주파 릴리스 주기에 있어 최신 이정표입니다. Mythos는 결국 출시될 것이며, 그때가 되면 이미 강력한 4.7 버전이 단지 시작에 불과했음을 증명해 보일지도 모릅니다.

관련 특별 주제 추천

만화 창작

소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기

XIX.AI에서 2026년 최고의 소년 만화 AI 생성기를 만나보세요. 엄선된 최고 평점 목록에는 박진감 넘치는 액션 장면과 역동적인 에너지 효과를 연출할 수 있는 강력한 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 여러분의 창의력을 마음껏 발휘하여 오늘 바로 장대한 만화를 만들어 보세요!

15 도구

xix.ai

사업

최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구

xix.ai

사업

최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구

xix.ai

생산력

AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구

xix.ai

챗봇

최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구

xix.ai

교육 및 학습

최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구

xix.ai