Выпущена версия Claude Opus 4.7, в которой надежность ценится выше интеллекта
В этом году компания Anthropic сохраняет высокие темпы развития, выпуская новые функции почти каждый день. Долгожданная версия Claude Opus 4.7 только что была официально выпущена, и что интересно, в своём анонсе Anthropic сразу же заявила: «Это не наша самая мощная модель». Ходят слухи, что более мощная версия Claude Mythos Preview пока находится в режиме ожидания. Тем не менее, Opus 4.7 привлек к себе значительное внимание, поскольку решает проблему «большей надежности», а не «большей умности».

Результаты тестирования впечатляют. В строгом тесте на кодирование SWE-bench Pro результат 4.7 подскочил с 53,4% в предыдущей версии до 64,3%, что означает прирост почти на 11 процентных пунктов, превзойдя GPT-5.4 (57,7%) и Gemini 3.1 Pro (54,2%). В тесте на визуальное мышление CharXiv показатель вырос с 69,1% до 82,1% благодаря недавно добавленной функции распознавания длинной стороны с разрешением 2576 пикселей, которая обеспечивает более чем трехкратное повышение четкости по сравнению с предшественником. В тесте MCP-Atlas по оценке вызова инструментов он набрал 77,3%, а в тесте BigLaw на юридической платформе Harvey — 90,9%. Однако в тесте BrowseComp, оценивающем агентский поиск, версия 4.7 продемонстрировала небольшое снижение результата с 83,7% до 79,3%, уступив GPT-5.4 и Gemini — это объясняется ее «бесфальсификационной» личностью, предпочитающей сообщать об ошибках, а не строить догадки, когда информация неполна.
Помимо цифр, более примечателен сдвиг в характере. Руководитель Replit отметил после тестирования: «Он бросает мне вызов в технических дискуссиях, помогает принимать лучшие решения и действительно ведет себя как лучший коллега». Платформа для работы с данными Hex также заметила, что версия 4.7 напрямую сообщает об ошибках при отсутствии данных, а не предоставляет «кажущееся разумным, но совершенно неверное» альтернативное значение, как раньше. В то же время значительно улучшилась устойчивость к сбоям — тесты команды Notion показывают, что уровень ошибок инструмента снизился до одной трети от прежнего, а при сбое цепочки инструментов он может преодолевать препятствия и самостоятельно завершать задачи. Vercel даже обнаружила новое поведение: перед написанием кода системного уровня версия 4.7 сначала самостоятельно выполняет математические доказательства.

Конечно, расширение возможностей имеет свою цену. В версии 4.7 введен новый токенизатор, генерирующий в 1–1,35 раза больше токенов для одного и того же текста. Кроме того, он склонен «немного дольше думать» над сложными задачами, поэтому фактическое потребление ресурсов почти наверняка выше. Чтобы решить эту проблему, Anthropic добавила уровень xhigh — уровень сверхвысокой интенсивности мышления. Claude Code по умолчанию установила для всех пакетов этот уровень, а также запустила инструкцию Deep Review / ultrareview, расширение Auto Mode для пользователей Max и публичную бета-версию функции «бюджет задач», чтобы помочь разработчикам управлять использованием токенов.
Более мощная версия Mythos Preview недавно стала доступна для предприятий под названием «Project Glasswing» для исследований в области кибербезопасности, но из-за ее ошеломляющих возможностей и незавершенных оценок безопасности она еще не была выпущена для широкой публики.
Сегодняшняя версия 4.7 представляет собой новую веху в ритме высокочастотных релизов Anthropic. Mythos в конечном итоге появится — и когда это произойдет, и без того мощная версия 4.7 может оказаться лишь началом.
Связанная статья
Главный инвестор Suno: удаление постов не устранит лазейку в законодательстве об авторском праве
Долгожданная платформа Suno, создающая музыку с помощью ИИ, столкнулась с серьезной судебной тяжбой по поводу авторских прав, а откровенное замечание ее главного инвестора, возможно, предоставило прот
Компания Haier представила самый легкий в мире спортивный робот-экзоскелет с искусственным интеллектом, вес которого составляет всего 1,75 кг
Группа Haier представила самый легкий в мире спортивный робот-экзоскелет с искусственным интеллектом — Haier Exoskeleton Robot W3. Этот запуск устанавливает новый отраслевой рекорд по легкости и знаме
Сегодня стартует первый сериал Yaoke Media, созданный с помощью технологий AIGC, — «Тайна бронзы в Циньлине» с главными героями, нарисованными искусственным интеллектом
Сегодня состоялся официальный запуск короткометражного фэнтезийного детективного сериала «Тайная история бронзы Циньлин» от Yaoke Media. В главных ролях — первые два подписанных компанией ИИ-актера, Ц
Рекомендации по связанным специальным темам
Комментарии (0)
В этом году компания Anthropic сохраняет высокие темпы развития, выпуская новые функции почти каждый день. Долгожданная версия Claude Opus 4.7 только что была официально выпущена, и что интересно, в своём анонсе Anthropic сразу же заявила: «Это не наша самая мощная модель». Ходят слухи, что более мощная версия Claude Mythos Preview пока находится в режиме ожидания. Тем не менее, Opus 4.7 привлек к себе значительное внимание, поскольку решает проблему «большей надежности», а не «большей умности».

Результаты тестирования впечатляют. В строгом тесте на кодирование SWE-bench Pro результат 4.7 подскочил с 53,4% в предыдущей версии до 64,3%, что означает прирост почти на 11 процентных пунктов, превзойдя GPT-5.4 (57,7%) и Gemini 3.1 Pro (54,2%). В тесте на визуальное мышление CharXiv показатель вырос с 69,1% до 82,1% благодаря недавно добавленной функции распознавания длинной стороны с разрешением 2576 пикселей, которая обеспечивает более чем трехкратное повышение четкости по сравнению с предшественником. В тесте MCP-Atlas по оценке вызова инструментов он набрал 77,3%, а в тесте BigLaw на юридической платформе Harvey — 90,9%. Однако в тесте BrowseComp, оценивающем агентский поиск, версия 4.7 продемонстрировала небольшое снижение результата с 83,7% до 79,3%, уступив GPT-5.4 и Gemini — это объясняется ее «бесфальсификационной» личностью, предпочитающей сообщать об ошибках, а не строить догадки, когда информация неполна.
Помимо цифр, более примечателен сдвиг в характере. Руководитель Replit отметил после тестирования: «Он бросает мне вызов в технических дискуссиях, помогает принимать лучшие решения и действительно ведет себя как лучший коллега». Платформа для работы с данными Hex также заметила, что версия 4.7 напрямую сообщает об ошибках при отсутствии данных, а не предоставляет «кажущееся разумным, но совершенно неверное» альтернативное значение, как раньше. В то же время значительно улучшилась устойчивость к сбоям — тесты команды Notion показывают, что уровень ошибок инструмента снизился до одной трети от прежнего, а при сбое цепочки инструментов он может преодолевать препятствия и самостоятельно завершать задачи. Vercel даже обнаружила новое поведение: перед написанием кода системного уровня версия 4.7 сначала самостоятельно выполняет математические доказательства.

Конечно, расширение возможностей имеет свою цену. В версии 4.7 введен новый токенизатор, генерирующий в 1–1,35 раза больше токенов для одного и того же текста. Кроме того, он склонен «немного дольше думать» над сложными задачами, поэтому фактическое потребление ресурсов почти наверняка выше. Чтобы решить эту проблему, Anthropic добавила уровень xhigh — уровень сверхвысокой интенсивности мышления. Claude Code по умолчанию установила для всех пакетов этот уровень, а также запустила инструкцию Deep Review / ultrareview, расширение Auto Mode для пользователей Max и публичную бета-версию функции «бюджет задач», чтобы помочь разработчикам управлять использованием токенов.
Более мощная версия Mythos Preview недавно стала доступна для предприятий под названием «Project Glasswing» для исследований в области кибербезопасности, но из-за ее ошеломляющих возможностей и незавершенных оценок безопасности она еще не была выпущена для широкой публики.
Сегодняшняя версия 4.7 представляет собой новую веху в ритме высокочастотных релизов Anthropic. Mythos в конечном итоге появится — и когда это произойдет, и без того мощная версия 4.7 может оказаться лишь началом.
Главный инвестор Suno: удаление постов не устранит лазейку в законодательстве об авторском праве
Долгожданная платформа Suno, создающая музыку с помощью ИИ, столкнулась с серьезной судебной тяжбой по поводу авторских прав, а откровенное замечание ее главного инвестора, возможно, предоставило прот
Компания Haier представила самый легкий в мире спортивный робот-экзоскелет с искусственным интеллектом, вес которого составляет всего 1,75 кг
Группа Haier представила самый легкий в мире спортивный робот-экзоскелет с искусственным интеллектом — Haier Exoskeleton Robot W3. Этот запуск устанавливает новый отраслевой рекорд по легкости и знаме
Сегодня стартует первый сериал Yaoke Media, созданный с помощью технологий AIGC, — «Тайна бронзы в Циньлине» с главными героями, нарисованными искусственным интеллектом
Сегодня состоялся официальный запуск короткометражного фэнтезийного детективного сериала «Тайная история бронзы Циньлин» от Yaoke Media. В главных ролях — первые два подписанных компанией ИИ-актера, Ц





Дом






