Дом
Cursor Composer 2 против Claude Opus 4.6: тест производительности разжигает новую дискуссию о программировании с помощью ИИ
19 марта компания Cursor официально представила свою собственную модель кодирования — Composer 2. Это объявление сразу же вызвало бурную дискуссию в сообществе разработчиков — по данным Cursor, Composer 2 набрал 61,7% в тесте Terminal-Bench 2.0, что значительно превосходит результат Claude Opus 4.6 (58,0%) при одинаковых условиях тестирования.
Неужели флагманская модель Anthropic уступила по производительности модели, встроенной в собственную IDE? Как только эта новость распространилась, сразу же разгорелись споры.

Три ключевых результата тестирования
Cursor опубликовал три набора результатов тестирования, все из которых были обнародованы:
Terminal-Bench 2.0 (задачи по кодированию в терминале в стиле агента): Composer 2 набрал 61,7%, обойдя Claude Opus 4.6 с результатом 58,0%. Однако OpenAI GPT-5.4 по-прежнему лидирует с результатом 75,1%. CursorBench (реальные сценарии программирования в Cursor): Composer 2 достиг 61,3%, что является значительным скачком по сравнению с 44,2% у предыдущего Composer 1.5, а также выше, чем 58,2%у Claude Opus 4.6. SWE-bench Multilingual (многоязычная разработка программного обеспечения): Composer 2 достиг 73,7%, что является заметным улучшением по сравнению с его предшественником.Однако стоит отметить одну деталь: ранее Anthropic сообщала, что Claude Opus 4.6 набрал 65,4% в Terminal-Bench 2.0 при оптимизированных настройках, что значительно выше 58,0%, указанных Cursor. Расхождение связано с тестовой средой — Cursor использовал сторонние агентские среды, такие как Harbor, и усреднил результаты по пяти прогонам, в то время как цифры Anthropic были получены на основе собственной оптимизированной конфигурации. Эти два набора цифр не поддаются прямому сравнению, поскольку в них используются разные системы отсчета. Cursor не уклонился от этого; в объявлении прямо указано, что «результаты зависят от агента, тестового набора и настроек».
Стоимость составляет всего одну десятую от Opus 4.6
Экономическая эффективность — это истинное скрытое преимущество Composer 2.
Стоимость составляет 0,50–2,50 доллара за миллион токенов ввода/вывода, в то время как у Claude Opus 4.6 она составляет 5–25 долларов, а у GPT-5.4 — 2,5–15 долларов, и контраст здесь разительный. Cursor объясняет, что Composer 2 был с нуля разработан для задач кодирования с длительным горизонтом, используя собственное обучение RL и технологию «самообобщения» для снижения как задержки, так и стоимости — то, что они описывают как «передовой интеллект + экстремальная скорость».
Composer 2 — третья собственная модель Cursor, следующая за Composer 1 (октябрь 2025 г.) и версией 1.5 (февраль 2026 г.). В этом выпуске сделан акцент на «задачах с длительным горизонтом», а более быстрая и облегченная версия стала моделью по умолчанию в Cursor IDE.
Что означает это «возрождение из пепла»
Решение Cursor напрямую сравнить свою модель с Opus 4.6 сигнализирует о сдвиге в более широком ландшафте инструментов для программирования ИИ.
OpenAI и Anthropic соревнуются в области общих передовых возможностей, в то время как поставщики вертикальных инструментов, такие как Cursor, пошли по другому пути: они довели производительность при решении конкретных задач до исключительного уровня, а затем используют ценовые преимущества, чтобы выделиться. Средства массовой информации, такие как VentureBeat и The New Stack, отметили, что Composer 2 ускорит практическое внедрение «мультимодельной маршрутизации» — использования Opus или GPT для сложного рассуждения и переключения на Composer 2 для повседневного высокочастотного кодирования, получая преимущества с обеих сторон.
Claude Opus 4.6 был запущен 5 февраля и лидировал в нескольких тестах, включая Terminal-Bench 2.0, Humanity's Last Exam и GDPval-AA. Новые результаты Cursor, по крайней мере, ставят под сомнение это доминирование в сегменте специализированного кодирования.
Реакция разработчиков пока в основном положительная, но многие говорят, что хотят увидеть реальную производительность в проектах, прежде чем делать выводы — это справедливая позиция, поскольку тесты — это всего лишь тесты. Cursor уже сделал Composer 2 доступным для бесплатного пробного использования в IDE для пользователей с подпиской.
Источник данных: официальные заявления Cursor и ведущие технические СМИ, по состоянию на 20 марта 2026 года. Текущие рейтинги можно посмотреть на сайте tbench.ai или на сайте Cursor.
Связанная статья
Компания Baidu Health в ближайшее время проведет внутреннее тестирование AI-помощника врача DoctorClaw для поиска научной информации и оказания помощи в офисной работе
По имеющимся данным, компания Baidu Health приступила к внутреннему тестированию профессионального интеллектуального помощника на базе искусственного интеллекта, предназначенного для врачей. Этот прод
На конференции StrictlyVC в Сан-Франциско соберутся руководители компаний TDK Ventures, Replit и других
Первое в этом году мероприятие StrictlyVC состоится в Сан-Франциско раньше, чем вы думаете. Еще есть билеты на нашу встречу 30 апреля в Sentro Filipino Cultural Center, где выступит впечатляющий соста
Notion превращает свое рабочее пространство в центр для ИИ-агентов
Компания Notion, разработчик программного обеспечения для повышения продуктивности, вступает в эру агентов.Во время прямой трансляции анонса продукта в среду компания Notion, наиболее известная своим
Рекомендации по связанным специальным темам
Комментарии (0)
19 марта компания Cursor официально представила свою собственную модель кодирования — Composer 2. Это объявление сразу же вызвало бурную дискуссию в сообществе разработчиков — по данным Cursor, Composer 2 набрал 61,7% в тесте Terminal-Bench 2.0, что значительно превосходит результат Claude Opus 4.6 (58,0%) при одинаковых условиях тестирования.
Неужели флагманская модель Anthropic уступила по производительности модели, встроенной в собственную IDE? Как только эта новость распространилась, сразу же разгорелись споры.

Три ключевых результата тестирования
Cursor опубликовал три набора результатов тестирования, все из которых были обнародованы:
Terminal-Bench 2.0 (задачи по кодированию в терминале в стиле агента): Composer 2 набрал 61,7%, обойдя Claude Opus 4.6 с результатом 58,0%. Однако OpenAI GPT-5.4 по-прежнему лидирует с результатом 75,1%. CursorBench (реальные сценарии программирования в Cursor): Composer 2 достиг 61,3%, что является значительным скачком по сравнению с 44,2% у предыдущего Composer 1.5, а также выше, чем 58,2%у Claude Opus 4.6. SWE-bench Multilingual (многоязычная разработка программного обеспечения): Composer 2 достиг 73,7%, что является заметным улучшением по сравнению с его предшественником.Однако стоит отметить одну деталь: ранее Anthropic сообщала, что Claude Opus 4.6 набрал 65,4% в Terminal-Bench 2.0 при оптимизированных настройках, что значительно выше 58,0%, указанных Cursor. Расхождение связано с тестовой средой — Cursor использовал сторонние агентские среды, такие как Harbor, и усреднил результаты по пяти прогонам, в то время как цифры Anthropic были получены на основе собственной оптимизированной конфигурации. Эти два набора цифр не поддаются прямому сравнению, поскольку в них используются разные системы отсчета. Cursor не уклонился от этого; в объявлении прямо указано, что «результаты зависят от агента, тестового набора и настроек».
Стоимость составляет всего одну десятую от Opus 4.6
Экономическая эффективность — это истинное скрытое преимущество Composer 2.
Стоимость составляет 0,50–2,50 доллара за миллион токенов ввода/вывода, в то время как у Claude Opus 4.6 она составляет 5–25 долларов, а у GPT-5.4 — 2,5–15 долларов, и контраст здесь разительный. Cursor объясняет, что Composer 2 был с нуля разработан для задач кодирования с длительным горизонтом, используя собственное обучение RL и технологию «самообобщения» для снижения как задержки, так и стоимости — то, что они описывают как «передовой интеллект + экстремальная скорость».
Composer 2 — третья собственная модель Cursor, следующая за Composer 1 (октябрь 2025 г.) и версией 1.5 (февраль 2026 г.). В этом выпуске сделан акцент на «задачах с длительным горизонтом», а более быстрая и облегченная версия стала моделью по умолчанию в Cursor IDE.
Что означает это «возрождение из пепла»
Решение Cursor напрямую сравнить свою модель с Opus 4.6 сигнализирует о сдвиге в более широком ландшафте инструментов для программирования ИИ.
OpenAI и Anthropic соревнуются в области общих передовых возможностей, в то время как поставщики вертикальных инструментов, такие как Cursor, пошли по другому пути: они довели производительность при решении конкретных задач до исключительного уровня, а затем используют ценовые преимущества, чтобы выделиться. Средства массовой информации, такие как VentureBeat и The New Stack, отметили, что Composer 2 ускорит практическое внедрение «мультимодельной маршрутизации» — использования Opus или GPT для сложного рассуждения и переключения на Composer 2 для повседневного высокочастотного кодирования, получая преимущества с обеих сторон.
Claude Opus 4.6 был запущен 5 февраля и лидировал в нескольких тестах, включая Terminal-Bench 2.0, Humanity's Last Exam и GDPval-AA. Новые результаты Cursor, по крайней мере, ставят под сомнение это доминирование в сегменте специализированного кодирования.
Реакция разработчиков пока в основном положительная, но многие говорят, что хотят увидеть реальную производительность в проектах, прежде чем делать выводы — это справедливая позиция, поскольку тесты — это всего лишь тесты. Cursor уже сделал Composer 2 доступным для бесплатного пробного использования в IDE для пользователей с подпиской.
Источник данных: официальные заявления Cursor и ведущие технические СМИ, по состоянию на 20 марта 2026 года. Текущие рейтинги можно посмотреть на сайте tbench.ai или на сайте Cursor.
Компания Baidu Health в ближайшее время проведет внутреннее тестирование AI-помощника врача DoctorClaw для поиска научной информации и оказания помощи в офисной работе
По имеющимся данным, компания Baidu Health приступила к внутреннему тестированию профессионального интеллектуального помощника на базе искусственного интеллекта, предназначенного для врачей. Этот прод
На конференции StrictlyVC в Сан-Франциско соберутся руководители компаний TDK Ventures, Replit и других
Первое в этом году мероприятие StrictlyVC состоится в Сан-Франциско раньше, чем вы думаете. Еще есть билеты на нашу встречу 30 апреля в Sentro Filipino Cultural Center, где выступит впечатляющий соста
Notion превращает свое рабочее пространство в центр для ИИ-агентов
Компания Notion, разработчик программного обеспечения для повышения продуктивности, вступает в эру агентов.Во время прямой трансляции анонса продукта в среду компания Notion, наиболее известная своим











