Дом

Новости

Cursor Composer 2 против Claude Opus 4.6: тест производительности разжигает новую дискуссию о программировании с помощью ИИ

Cursor Composer 2 против Claude Opus 4.6: тест производительности разжигает новую дискуссию о программировании с помощью ИИ

6 июня 2026 г.

TerryGonzález

19 марта компания Cursor официально представила свою собственную модель кодирования — Composer 2. Это объявление сразу же вызвало бурную дискуссию в сообществе разработчиков — по данным Cursor, Composer 2 набрал 61,7% в тесте Terminal-Bench 2.0, что значительно превосходит результат Claude Opus 4.6 (58,0%) при одинаковых условиях тестирования.

Неужели флагманская модель Anthropic уступила по производительности модели, встроенной в собственную IDE? Как только эта новость распространилась, сразу же разгорелись споры.

График, демонстрирующий сравнение результатов в Terminal-Bench 2.0

Три ключевых результата тестирования

Cursor опубликовал три набора результатов тестирования, все из которых были обнародованы:

Terminal-Bench 2.0 (задачи по кодированию в терминале в стиле агента): Composer 2 набрал 61,7%, обойдя Claude Opus 4.6 с результатом 58,0%. Однако OpenAI GPT-5.4 по-прежнему лидирует с результатом 75,1%. CursorBench (реальные сценарии программирования в Cursor): Composer 2 достиг 61,3%, что является значительным скачком по сравнению с 44,2% у предыдущего Composer 1.5, а также выше, чем 58,2%у Claude Opus 4.6. SWE-bench Multilingual (многоязычная разработка программного обеспечения): Composer 2 достиг 73,7%, что является заметным улучшением по сравнению с его предшественником.

Однако стоит отметить одну деталь: ранее Anthropic сообщала, что Claude Opus 4.6 набрал 65,4% в Terminal-Bench 2.0 при оптимизированных настройках, что значительно выше 58,0%, указанных Cursor. Расхождение связано с тестовой средой — Cursor использовал сторонние агентские среды, такие как Harbor, и усреднил результаты по пяти прогонам, в то время как цифры Anthropic были получены на основе собственной оптимизированной конфигурации. Эти два набора цифр не поддаются прямому сравнению, поскольку в них используются разные системы отсчета. Cursor не уклонился от этого; в объявлении прямо указано, что «результаты зависят от агента, тестового набора и настроек».

Стоимость составляет всего одну десятую от Opus 4.6

Экономическая эффективность — это истинное скрытое преимущество Composer 2.

Стоимость составляет 0,50–2,50 доллара за миллион токенов ввода/вывода, в то время как у Claude Opus 4.6 она составляет 5–25 долларов, а у GPT-5.4 — 2,5–15 долларов, и контраст здесь разительный. Cursor объясняет, что Composer 2 был с нуля разработан для задач кодирования с длительным горизонтом, используя собственное обучение RL и технологию «самообобщения» для снижения как задержки, так и стоимости — то, что они описывают как «передовой интеллект + экстремальная скорость».

Composer 2 — третья собственная модель Cursor, следующая за Composer 1 (октябрь 2025 г.) и версией 1.5 (февраль 2026 г.). В этом выпуске сделан акцент на «задачах с длительным горизонтом», а более быстрая и облегченная версия стала моделью по умолчанию в Cursor IDE.

Что означает это «возрождение из пепла»

Решение Cursor напрямую сравнить свою модель с Opus 4.6 сигнализирует о сдвиге в более широком ландшафте инструментов для программирования ИИ.

OpenAI и Anthropic соревнуются в области общих передовых возможностей, в то время как поставщики вертикальных инструментов, такие как Cursor, пошли по другому пути: они довели производительность при решении конкретных задач до исключительного уровня, а затем используют ценовые преимущества, чтобы выделиться. Средства массовой информации, такие как VentureBeat и The New Stack, отметили, что Composer 2 ускорит практическое внедрение «мультимодельной маршрутизации» — использования Opus или GPT для сложного рассуждения и переключения на Composer 2 для повседневного высокочастотного кодирования, получая преимущества с обеих сторон.

Claude Opus 4.6 был запущен 5 февраля и лидировал в нескольких тестах, включая Terminal-Bench 2.0, Humanity's Last Exam и GDPval-AA. Новые результаты Cursor, по крайней мере, ставят под сомнение это доминирование в сегменте специализированного кодирования.

Реакция разработчиков пока в основном положительная, но многие говорят, что хотят увидеть реальную производительность в проектах, прежде чем делать выводы — это справедливая позиция, поскольку тесты — это всего лишь тесты. Cursor уже сделал Composer 2 доступным для бесплатного пробного использования в IDE для пользователей с подпиской.

Источник данных: официальные заявления Cursor и ведущие технические СМИ, по состоянию на 20 марта 2026 года. Текущие рейтинги можно посмотреть на сайте tbench.ai или на сайте Cursor.

Связанная статья

Компания Baidu Health в ближайшее время проведет внутреннее тестирование AI-помощника врача DoctorClaw для поиска научной информации и оказания помощи в офисной работе По имеющимся данным, компания Baidu Health приступила к внутреннему тестированию профессионального интеллектуального помощника на базе искусственного интеллекта, предназначенного для врачей. Этот прод

На конференции StrictlyVC в Сан-Франциско соберутся руководители компаний TDK Ventures, Replit и других Первое в этом году мероприятие StrictlyVC состоится в Сан-Франциско раньше, чем вы думаете. Еще есть билеты на нашу встречу 30 апреля в Sentro Filipino Cultural Center, где выступит впечатляющий соста

Notion превращает свое рабочее пространство в центр для ИИ-агентов Компания Notion, разработчик программного обеспечения для повышения продуктивности, вступает в эру агентов.Во время прямой трансляции анонса продукта в среду компания Notion, наиболее известная своим

Рекомендации по связанным специальным темам

письмо

Лучшие инструменты для создания скриптов на основе искусственного интеллекта для радио и подкастинга: написание увлекательных аудиореклам

Откройте для себя лучшие инструменты для создания скриптов на основе искусственного интеллекта в 2026 году, предназначенные для радио- и подкастинга, на сайте XIX.AI. Наш тщательно отобранный список включает мощные решения, способные значительно ускорить процесс создания привлекательных аудиореклам. Сравните бесплатные и платные варианты на основе реальных тестов и еженедельно обновляемых рейтингов. Раскройте свой творческий потенциал уже сегодня!

10 инструментов

xix.ai

Бизнес

Лучшее программное обеспечение для проверки договоров с помощью ИИ: мгновенное выявление юридических лазеек и рисков несоблюдения нормативных требований

Откройте для себя лучшее программное обеспечение 2026 года для анализа договоров с помощью ИИ на сайте XIX.AI. В нашем тщательно отобранном списке лидеров представлены мощные инструменты, которые мгновенно выявляют юридические лазейки и риски несоответствия нормативным требованиям. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Найдите решение, которое кардинально изменит ваш подход к безопасному и эффективному анализу договоров. Ознакомьтесь с исчерпывающим руководством прямо сейчас.

10 инструментов

xix.ai

Создание анимации

Генератор аниме на основе искусственного интеллекта для Donghua: Создание персонажей для веб-романов и аватаров для комиксов

Откройте для себя лучшие генераторы аниме на основе искусственного интеллекта 2026 года для создания донхуа. Наш список, составленный специально для вас, включает мощные инструменты, позволяющие создавать потрясающих персонажей для веб-новелл и комиксов. Сравните бесплатные и платные варианты на основе реальных тестов. Найдите идеального помощника в творчестве и превратите свои истории в жизнь сегодня на сайте XIX.AI.

10 инструментов

xix.ai

Создание комиксов

Лучшие инструменты для автоматической раскраски манги с помощью ИИ: нанесение плоских цветов без ошибок в цветовом решении

Откройте для себя лучшие инструменты для автоматической раскраски манги с помощью ИИ в 2026 году на сайте XIX.AI. В нашем тщательно составленном списке представлены самые популярные и революционные решения, которые наносят плоские цвета без единой ошибки в цветовом соответствии, что значительно повышает вашу продуктивность. Изучите сравнения бесплатных и платных версий, результаты реальных тестов и еженедельно обновляемые рейтинги, чтобы найти идеальный вариант для себя. Воспользуйтесь преимуществами ИИ уже сегодня.

10 инструментов

xix.ai

письмо

Лучшие программы для создания персонажей в жанре научной фантастики: генерация последовательных мотиваций персонажей и их роковых недостатков

Откройте для себя 20 лучших инструментов 2026 года для создания персонажей с помощью искусственного интеллекта, которые помогут вам придать своим героям глубину. В тщательно подобранном списке XIX.AI представлены самые популярные и революционные инструменты, способные генерировать правдоподобные мотивации и роковые недостатки персонажей. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой потенциал в области создания историй уже сейчас.

10 инструментов

xix.ai

Бизнес

Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине

Откройте для себя лучшее программное обеспечение 2026 года для оптимизации цен с помощью ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены высокооцененные, революционные инструменты, которые отслеживают конкурентов и автоматически корректируют цены в вашем магазине для получения максимальной прибыли. Сравните бесплатные и платные варианты на основе реальных тестов. Получите преимущество в ценообразовании уже сейчас.

10 инструментов

xix.ai