옵션
뉴스
커서 컴포저 2 대 클로드 오푸스 4.6: 벤치마크 테스트로 불붙은 AI 코딩 논쟁

커서 컴포저 2 대 클로드 오푸스 4.6: 벤치마크 테스트로 불붙은 AI 코딩 논쟁

2026년 6월 6일
3

3월 19일, 커서(Cursor)는 자체 개발한 코딩 모델인 ‘컴포저 2(Composer 2)’를 공식 출시했다. 이 발표는 개발자 커뮤니티에서 즉각적인 논의를 불러일으켰다. 커서 측에 따르면, 컴포저 2는 터미널 벤치 2.0에서 61.7%의 점수를 기록했으며, 이는 동일한 테스트 조건에서 클로드 오푸스 4.6의 58.0%를 현저히 상회하는 수치다.

Anthropic의 주력 모델이 자사 IDE에 내장된 모델에게 성능에서 뒤처진 것일까? 이 소식이 퍼지자마자 논쟁이 빠르게 불거졌습니다.

터미널-벤치 2.0 점수 비교를 보여주는 차트

세 가지 주요 벤치마크 결과

커서(Cursor)는 세 가지 벤치마크 결과를 공개했으며, 모두 다음과 같습니다:

Terminal-Bench 2.0 (에이전트 스타일 터미널 코딩 과제): Composer 2는 61.7%를 기록하며 Claude Opus 4.6의 58.0%를 앞질렀습니다. 하지만 OpenAI GPT-5.4는 75.1%로 여전히 선두를 지켰습니다. CursorBench (Cursor 내 실제 코딩 시나리오): Composer 2는 61.3%를 기록했는데, 이는 이전 버전인 Composer 1.5의 44.2%에 비해 상당한 상승세이며, Claude Opus 4.6의 58.2%보다도 높은 수치입니다. SWE-bench Multilingual (다국어 소프트웨어 엔지니어링): Composer 2는 73.7%를 기록하여 전작 대비 눈에 띄는 개선을 보였습니다.

하지만 한 가지 주목할 만한 세부 사항이 있습니다. Anthropic은 이전에 Claude Opus 4.6이 최적화된 설정에서 Terminal-Bench 2.0에서 65.4%를 기록했다고 보고했는데, 이는 Cursor가 인용한 58.0%보다 훨씬 높은 수치입니다. 이러한 차이는 테스트 프레임워크에서 비롯됩니다. 커서는 하버(Harbor)와 같은 타사 에이전트 환경을 사용하고 5회 실행 결과를 평균화한 반면, 앤트로픽의 수치는 자체 최적화된 구성에서 도출된 것입니다. 서로 다른 기준 체계를 사용했기 때문에 이 두 세트의 수치는 직접 비교할 수 없습니다. 커서(Cursor)는 이 점을 회피하지 않았으며, 발표문에서 "결과는 에이전트, 하네스, 설정에 따라 달라진다"고 명시적으로 밝혔습니다.

Opus 4.6의 10분의 1 수준에 불과한 비용

비용 효율성은 Composer 2의 진정한 숨겨진 장점입니다.

입력/출력 토큰 100만 개당 0.50달러/2.50달러인 가격은, Claude Opus 4.6의 5달러/25달러 및 GPT-5.4의 2.5달러/15달러와 비교할 때 그 차이가 확연합니다. 커서(Cursor)는 컴포저 2가 장기적인 코딩 작업을 위해 처음부터 새로 구축되었으며, 자체 개발한 RL 훈련 및 "자가 요약" 기술을 사용하여 지연 시간과 비용을 모두 낮췄다고 설명합니다. 이들은 이를 "최첨단 지능 + 극한의 속도"라고 표현합니다.

Composer 2는 Composer 1(2025년 10월)과 버전 1.5(2026년 2월)에 이은 커서(Cursor)의 세 번째 자체 개발 모델입니다. 이번 릴리스는 "장기적 과제"에 중점을 두었으며, 더 빠르고 가벼운 변형을 커서 IDE의 기본 모델로 설정했습니다.

이 "재기"가 의미하는 바

커서가 자사 모델을 오푸스 4.6과 직접 비교하기로 한 결정은 광범위한 AI 코딩 도구 시장의 변화를 시사한다.

OpenAI와 Anthropic이 일반적인 최첨단 기능에서 경쟁하는 반면, 커서와 같은 수직적 도구 제공업체들은 다른 길을 택했습니다. 즉, 특정 작업에 대한 성능을 탁월한 수준으로 연마한 뒤 가격 경쟁력을 활용해 차별화를 꾀하는 것입니다. VentureBeat와 The New Stack 같은 언론 매체들은 Composer 2가 "다중 모델 라우팅"의 실질적인 도입을 가속화할 것이라고 지적했습니다. 이는 복잡한 추론에는 Opus나 GPT를 사용하고, 일상적이고 빈도가 높은 코딩 작업에는 Composer 2로 전환함으로써 양쪽 모두에서 이점을 얻는 방식입니다.

2월 5일 출시된 Claude Opus 4.6은 Terminal-Bench 2.0, Humanity's Last Exam, GDPval-AA 등 여러 벤치마크에서 선두를 차지했습니다. 커서(Cursor)의 새로운 결과는 적어도 전문 코딩 부문에서의 이러한 우위에 의문을 제기합니다.

현재까지 개발자들의 반응은 대체로 긍정적이지만, 많은 이들은 결론을 내리기 전에 실제 프로젝트에서의 성능을 보고 싶다고 말합니다. 벤치마크는 어디까지나 벤치마크일 뿐이므로 이는 타당한 입장입니다. 커서(Cursor)는 이미 구독 사용자를 대상으로 IDE 내에서 컴포저 2(Composer 2)의 무료 체험을 제공하고 있습니다.

데이터 출처: 2026년 3월 20일 기준 Cursor 공식 발표 및 주요 기술 매체. 현재 순위는 tbench.ai 또는 Cursor 웹사이트에서 확인할 수 있습니다.

관련 기사
바이두 헬스, 단기적으로 학술 자료 검색 및 사무 보조 기능을 위한 AI 의사 보조 시스템 ‘닥터클로(DoctorClaw)’ 내부 테스트 진행 바이두 헬스, 단기적으로 학술 자료 검색 및 사무 보조 기능을 위한 AI 의사 보조 시스템 ‘닥터클로(DoctorClaw)’ 내부 테스트 진행 바이두 헬스(Baidu Health)가 의사를 위해 설계된 전문 AI 스마트 어시스턴트의 내부 테스트를 시작한 것으로 알려졌다. 내부적으로 ‘닥터클로(DoctorClaw, 랍스터 닥터 버전)’라고 불리는 이 제품은 바이두가 의료 분야에 대규모 언어 모델을 도입하는 데 있어 중요한 진전을 의미한다.내부 소식통에 따르면 이 프로젝트는 여전히 비공개 개발 단계에
StrictlyVC 샌프란시스코 행사, TDK 벤처스, 리플릿 등 주요 기업 리더들 한자리에 StrictlyVC 샌프란시스코 행사, TDK 벤처스, 리플릿 등 주요 기업 리더들 한자리에 올해 첫 StrictlyVC 행사가 생각보다 빨리 샌프란시스코에서 열립니다. 4월 30일 센트로 필리피노 문화 센터(Sentro Filipino Cultural Center)에서 열리는 이번 행사에는 인상적인 연사진이 참여하며, 아직 티켓을 구매하실 수 있습니다. StrictlyVC가 자랑하는 네트워킹과 커뮤니티 교류는 물론, 이번 샌프란시스코 행사는 자금
Notion, 워크스페이스를 AI 에이전트의 허브로 탈바꿈하다 Notion, 워크스페이스를 AI 에이전트의 허브로 탈바꿈하다 생산성 소프트웨어 기업 노션(Notion)이 ‘에이전트(agents)’ 시대에 진입하고 있다.수요일 진행된 라이브 스트리밍 제품 발표회에서, 협업형 노트 작성 앱으로 잘 알려진 노션은 자체 AI 에이전트의 기능을 확장하고 외부 에이전트와 연동하며, 팀이 어떤 데이터베이스에서든 데이터를 가져올 수 있는 자동화된 다단계 워크플로를 구축할 수 있게 해주는 새로운
관련 특별 주제 추천
글쓰기 라디오 및 팟캐스팅을 위한 최고의 AI 스크립팅 도구들: 매력적인 오디오 광고를 제작하기
라디오 및 팟캐스팅을 위한 최고의 AI 스크립팅 도구들: 매력적인 오디오 광고를 제작하기

XIX.AI에서 2026년 최고의 라디오 및 팟캐스팅용 AI 스크립팅 도구들을 발견해 보세요. 저희가 엄선하여 선정한 이 목록에는 매력적인 오디오 광고를 빠르게 제작할 수 있도록 해주는 강력하고 혁신적인 도구들이 포함되어 있습니다. 무료 옵션과 유료 옵션을 실제 사용 사례를 통해 비교해 보고, 매주 업데이트되는 순위를 확인해 보세요. 오늘 바로 여러분의 창의성을 발휘해 보세요!

10 도구
xix.ai
사업 최고의 AI 계약서 검토 소프트웨어: 법적 허점과 규정 준수 위험을 즉시 파악하세요
최고의 AI 계약서 검토 소프트웨어: 법적 허점과 규정 준수 위험을 즉시 파악하세요

XIX.AI에서 2026년 최고의 AI 계약서 검토 소프트웨어를 만나보세요. 엄선된 최고 평점 목록에는 법적 허점과 규정 준수 위험을 즉시 파악하는 강력한 도구들이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 통해 무료 및 유료 옵션을 비교해 보세요. 안전하고 효율적인 계약서 분석을 위한 획기적인 솔루션을 찾아보세요. 지금 바로 이 결정적인 가이드를 확인해 보세요.

10 도구
xix.ai
애니메이션 제작 동화를 위한 AI 애니메이션 생성기: 웹 소설 캐릭터 및 코믹 아바타 제작하기
동화를 위한 AI 애니메이션 생성기: 웹 소설 캐릭터 및 코믹 아바타 제작하기

2026년 최고의 동화용 AI 애니메이션 제작 도구를 발견해 보세요. 저희가 엄선한 이 목록에는 멋진 웹소설 캐릭터와 코믹 아바타를 만들 수 있는 강력한 도구들이 포함되어 있습니다. 무료 옵션과 유료 옵션을 실제 사용 테스트를 통해 비교해 보세요. XIX.AI에서 여러분에게 가장 적합한 창작 도구를 찾아내고 오늘 바로 여러분의 이야기를 현실로 만들어 보세요.

10 도구
xix.ai
만화 창작 만화용 최고의 AI 자동 채색 도구: 일관성 오류 없이 플랫 컬러 적용하기
만화용 최고의 AI 자동 채색 도구: 일관성 오류 없이 플랫 컬러 적용하기

XIX.AI에서 2026년 최고의 만화 AI 자동 채색 도구를 만나보세요. 저희가 엄선한 이 목록에는 일관성 오류 없이 평면 색상을 적용하여 생산성을 높여주는, 최고 평점을 받은 혁신적인 솔루션들이 포함되어 있습니다. 무료 버전과 유료 버전의 비교 분석, 실제 테스트 결과, 매주 업데이트되는 순위 정보를 확인하여 여러분에게 딱 맞는 도구를 찾아보세요. 지금 바로 AI의 힘을 경험해 보세요.

10 도구
xix.ai
글쓰기 최고의 AI 소설 캐릭터 생성기: 일관된 캐릭터 동기와 치명적인 결점 생성
최고의 AI 소설 캐릭터 생성기: 일관된 캐릭터 동기와 치명적인 결점 생성

깊이 있는 캐릭터를 창조할 수 있는 2026년 최고의 AI 소설 프로필 생성 도구를 만나보세요. XIX.AI가 엄선한 이 목록에는 일관된 동기와 치명적인 결점을 생성해 주는, 최고 평점을 받은 혁신적인 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 여러분의 스토리텔링 잠재력을 발휘해 보세요.

10 도구
xix.ai
사업 최고의 AI 가격 최적화 소프트웨어: 경쟁사 추적 및 스토어 가격 자동 조정
최고의 AI 가격 최적화 소프트웨어: 경쟁사 추적 및 스토어 가격 자동 조정

XIX.AI에서 2026년 최고의 AI 가격 최적화 소프트웨어를 만나보세요. 저희가 엄선한 이 목록에는 경쟁사를 추적하고 최대 수익을 위해 매장 가격을 자동으로 조정해 주는, 최고 평점을 받은 혁신적인 도구들이 포함되어 있습니다. 실제 테스트 결과를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 가격 경쟁력의 우위를 확보하세요.

10 도구
xix.ai
의견 (0)
0/500
OR