вариант
Дом
Новости
Антропический использовал покемона для сравнения своей новейшей модели искусственного интеллекта

Антропический использовал покемона для сравнения своей новейшей модели искусственного интеллекта

10 апреля 2025 г.
313

В неожиданном шаге Anthropic решила протестировать свою последнюю модель ИИ, Claude 3.7 Sonnet, на классической игре для Game Boy — Pokémon Red. Согласно посту в блоге, опубликованному в понедельник, компания оснастила модель необходимым: памятью, способностью считывать пиксели экрана и возможностью нажимать кнопки и перемещаться по игровому экрану. Это позволило Claude 3.7 Sonnet погрузиться в мир Pokémon и продолжать играть.

Claude 3.7 Sonnet выделяется своим умением «длительного мышления». Подобно другим моделям, таким как OpenAI o3-mini и DeepSeek R1, она может решать сложные задачи, увеличивая вычислительную мощность и тщательно обдумывая решения.

Эта функция стала переломным моментом в Pokémon Red. Если старая модель Claude 3.0 Sonnet не могла даже выбраться из начальной зоны в Pallet Town, то Claude 3.7 Sonnet сумела победить трех лидеров спортзалов и получить их значки.

Anthropic Pokémon Red

Изображение предоставлено: Anthropic
Anthropic не раскрыла, сколько именно вычислительной мощности потребовалось или сколько времени ушло на достижение этих результатов. Они лишь упомянули, что модель выполнила колоссальные 35 000 действий, чтобы сразиться с последним лидером спортзала, Surge.

На прошлой неделе исследователь опробовал раннюю версию Claude 3.7 Sonnet.

Результаты были поразительными. За несколько часов Claude победил Brock. Спустя дни он разгромил Misty. Прогресс, которого старые модели едва ли могли достичь.

Оказывается, длительное мышление чрезвычайно эффективно. pic.twitter.com/RspsLgj2Uf

— Anthropic (@AnthropicAI) 25 февраля 2025

Скоро какой-нибудь сообразительный разработчик разберется в деталях.

Хотя Pokémon Red может показаться просто забавным тестом, игры уже давно используются для тестирования ИИ. За последние несколько месяцев появилось множество новых приложений и платформ для проверки того, как хорошо модели ИИ могут играть в игры, от Street Fighter до Pictionary.

Связанная статья
ИИ Gemini от Google побеждает Pokémon Blue с помощью ИИ Gemini от Google побеждает Pokémon Blue с помощью Веха в развитии искусственного интеллекта от Google: Покорение классического приключения покемоновСамая продвинутая модель искусственного интеллекта Google, похоже, достигла значительного игрового про
Дебаты по сравнению с ИИ достигли покемонов Дебаты по сравнению с ИИ достигли покемонов Даже любимый мир покемонов не застрахован от драмы, окружающей тесты ИИ. Недавний вирусный пост на X разжигал настоящий гул, утверждая, что последняя модель Gemini Google опередила ведущую модель Claude Antropic в классической трилогии видеоигр Pokémon. Согласно сообщению, Близнецы
Grok от Маска: 1,5 триллиона параметров и поглощение кода курсора — прорыв или блеф? Grok от Маска: 1,5 триллиона параметров и поглощение кода курсора — прорыв или блеф? Илон Маск наконец-то делает ход.В гонке по программированию ИИ компании OpenAI и Anthropic набирают обороты, в то время как xAI, похоже, отстает. Маск не раз заявлял о своем намерении составить конкур
Рекомендации по связанным специальным темам
Производительность Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии
Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью
Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов
xix.ai
Образование и обучение Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения
Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени
Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени

Откройте для себя 20 лучших тренажеров по флирту и общению с ИИ на сайте XIX.AI. Наша тщательно подобранная подборка самых популярных инструментов поможет вам развить коммуникабельность и уверенность в себе в режиме реального времени. Ознакомьтесь с незаменимыми инструментами, которые кардинально изменят вашу жизнь, — с сравнением бесплатных и платных версий и еженедельно обновляемым рейтингом. Раскройте свой коммуникативный потенциал уже сегодня.

10 инструментов
xix.ai
код Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом
Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом

Откройте для себя самые новые и высоко оцененные инструменты ИИ 2026 года для автоматизированного тестирования модулей. Наша тщательно подобранная коллекция включает мощные решения, способные радикально изменить процесс разработки, позволяющие мгновенно генерировать тестовые случаи для Jest, PyTest и JUnit. Сравните бесплатные и платные варианты с результатами реальных тестов, а также еженедельно обновляемыми рейтингами на сайте XIX.AI. Раскройте потенциал ИИ и повысьте эффективность своей работы в области разработки сегодня же.

10 инструментов
xix.ai
Анализ данных Лучшие инструменты для визуализации данных с помощью ИИ: автоматическое создание интерактивных панелей BI на основе исходных файлов
Лучшие инструменты для визуализации данных с помощью ИИ: автоматическое создание интерактивных панелей BI на основе исходных файлов

Откройте для себя лучшие инструменты визуализации данных на базе ИИ 2026 года на сайте XIX.AI. Наша тщательно отобранная подборка лидеров рейтинга поможет вам мгновенно создавать мощные интерактивные информационные панели BI на основе необработанных файлов. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Раскройте потенциал ваших данных уже сегодня.

10 инструментов
xix.ai
Комментарии (19)
0/500
GaryWilson
GaryWilson 29 октября 2025 г., 21:31:10 GMT+03:00

와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?

BillyAdams
BillyAdams 27 августа 2025 г., 15:59:25 GMT+03:00

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎

FrankSanchez
FrankSanchez 11 августа 2025 г., 20:01:02 GMT+03:00

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄

PaulSanchez
PaulSanchez 23 июля 2025 г., 7:59:29 GMT+03:00

Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️

LawrenceLopez
LawrenceLopez 22 апреля 2025 г., 7:33:07 GMT+03:00

Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂

JeffreyRamirez
JeffreyRamirez 20 апреля 2025 г., 11:47:48 GMT+03:00

Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂

OR