Дом
Антропический использовал покемона для сравнения своей новейшей модели искусственного интеллекта
В неожиданном шаге Anthropic решила протестировать свою последнюю модель ИИ, Claude 3.7 Sonnet, на классической игре для Game Boy — Pokémon Red. Согласно посту в блоге, опубликованному в понедельник, компания оснастила модель необходимым: памятью, способностью считывать пиксели экрана и возможностью нажимать кнопки и перемещаться по игровому экрану. Это позволило Claude 3.7 Sonnet погрузиться в мир Pokémon и продолжать играть.
Claude 3.7 Sonnet выделяется своим умением «длительного мышления». Подобно другим моделям, таким как OpenAI o3-mini и DeepSeek R1, она может решать сложные задачи, увеличивая вычислительную мощность и тщательно обдумывая решения.
Эта функция стала переломным моментом в Pokémon Red. Если старая модель Claude 3.0 Sonnet не могла даже выбраться из начальной зоны в Pallet Town, то Claude 3.7 Sonnet сумела победить трех лидеров спортзалов и получить их значки.

Изображение предоставлено: Anthropic Anthropic не раскрыла, сколько именно вычислительной мощности потребовалось или сколько времени ушло на достижение этих результатов. Они лишь упомянули, что модель выполнила колоссальные 35 000 действий, чтобы сразиться с последним лидером спортзала, Surge.На прошлой неделе исследователь опробовал раннюю версию Claude 3.7 Sonnet.
Результаты были поразительными. За несколько часов Claude победил Brock. Спустя дни он разгромил Misty. Прогресс, которого старые модели едва ли могли достичь.
Оказывается, длительное мышление чрезвычайно эффективно. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 февраля 2025
Скоро какой-нибудь сообразительный разработчик разберется в деталях.
Хотя Pokémon Red может показаться просто забавным тестом, игры уже давно используются для тестирования ИИ. За последние несколько месяцев появилось множество новых приложений и платформ для проверки того, как хорошо модели ИИ могут играть в игры, от Street Fighter до Pictionary.
Связанная статья
ИИ Gemini от Google побеждает Pokémon Blue с помощью
Веха в развитии искусственного интеллекта от Google: Покорение классического приключения покемоновСамая продвинутая модель искусственного интеллекта Google, похоже, достигла значительного игрового про
Дебаты по сравнению с ИИ достигли покемонов
Даже любимый мир покемонов не застрахован от драмы, окружающей тесты ИИ. Недавний вирусный пост на X разжигал настоящий гул, утверждая, что последняя модель Gemini Google опередила ведущую модель Claude Antropic в классической трилогии видеоигр Pokémon. Согласно сообщению, Близнецы
Выпущена версия Claude Opus 4.7, в которой надежность ценится выше интеллекта
В этом году компания Anthropic сохраняет высокие темпы развития, выпуская новые функции почти каждый день. Долгожданная версия Claude Opus 4.7 только что была официально выпущена, и что интересно, в с
Рекомендации по связанным специальным темам
Комментарии (19)
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂
В неожиданном шаге Anthropic решила протестировать свою последнюю модель ИИ, Claude 3.7 Sonnet, на классической игре для Game Boy — Pokémon Red. Согласно посту в блоге, опубликованному в понедельник, компания оснастила модель необходимым: памятью, способностью считывать пиксели экрана и возможностью нажимать кнопки и перемещаться по игровому экрану. Это позволило Claude 3.7 Sonnet погрузиться в мир Pokémon и продолжать играть.
Claude 3.7 Sonnet выделяется своим умением «длительного мышления». Подобно другим моделям, таким как OpenAI o3-mini и DeepSeek R1, она может решать сложные задачи, увеличивая вычислительную мощность и тщательно обдумывая решения.
Эта функция стала переломным моментом в Pokémon Red. Если старая модель Claude 3.0 Sonnet не могла даже выбраться из начальной зоны в Pallet Town, то Claude 3.7 Sonnet сумела победить трех лидеров спортзалов и получить их значки.

На прошлой неделе исследователь опробовал раннюю версию Claude 3.7 Sonnet.
Результаты были поразительными. За несколько часов Claude победил Brock. Спустя дни он разгромил Misty. Прогресс, которого старые модели едва ли могли достичь.
Оказывается, длительное мышление чрезвычайно эффективно. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 февраля 2025
Скоро какой-нибудь сообразительный разработчик разберется в деталях.
Хотя Pokémon Red может показаться просто забавным тестом, игры уже давно используются для тестирования ИИ. За последние несколько месяцев появилось множество новых приложений и платформ для проверки того, как хорошо модели ИИ могут играть в игры, от Street Fighter до Pictionary.
ИИ Gemini от Google побеждает Pokémon Blue с помощью
Веха в развитии искусственного интеллекта от Google: Покорение классического приключения покемоновСамая продвинутая модель искусственного интеллекта Google, похоже, достигла значительного игрового про
Дебаты по сравнению с ИИ достигли покемонов
Даже любимый мир покемонов не застрахован от драмы, окружающей тесты ИИ. Недавний вирусный пост на X разжигал настоящий гул, утверждая, что последняя модель Gemini Google опередила ведущую модель Claude Antropic в классической трилогии видеоигр Pokémon. Согласно сообщению, Близнецы
Выпущена версия Claude Opus 4.7, в которой надежность ценится выше интеллекта
В этом году компания Anthropic сохраняет высокие темпы развития, выпуская новые функции почти каждый день. Долгожданная версия Claude Opus 4.7 только что была официально выпущена, и что интересно, в с
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂











