Anthropic은 Pokémon을 사용하여 최신 AI 모델을 벤치마킹했습니다

집

뉴스

2025년 4월 10일

AvaHill

313

# pokemon

놀라운 움직임으로, Anthropic은 최신 AI 모델인 Claude 3.7 Sonnet을 클래식 Game Boy 게임 Pokémon Red로 테스트하기로 결정했습니다. 월요일에 공개된 블로그 포스트에 따르면, 회사는 이 모델에 필수 요소를 장착했습니다: 메모리, 화면 픽셀을 읽는 능력, 버튼을 누르고 게임 화면을 이동하는 능력. 이 설정으로 Claude 3.7 Sonnet은 Pokémon의 세계에 뛰어들어 계속 플레이할 수 있었습니다.

Claude 3.7 Sonnet을 돋보이게 하는 것은 "확장된 사고" 능력입니다. OpenAI의 o3-mini와 DeepSeek의 R1 같은 다른 모델과 유사하게, 이 모델은 컴퓨팅 파워를 높이고 충분한 시간을 들여 문제를 해결할 수 있습니다.

이 기능은 Pokémon Red에서 게임 체인저로 입증되었습니다. 이전 Claude 3.0 Sonnet은 Pallet Town의 시작 지역을 벗어나지 못했지만, Claude 3.7 Sonnet은 세 명의 체육관 리더를 물리치고 그들의 배지를 획득했습니다.

Anthropic Pokémon Red

이미지 제공: Anthropic

이제 Anthropic은 Claude 3.7 Sonnet이 이 이정표에 도달하는 데 필요한 컴퓨팅 파워의 양이나 걸린 시간을 구체적으로 밝히지 않았습니다. 그들은 단지 이 모델이 마지막 체육관 리더인 Surge와 대결하기 위해 무려 35,000개의 액션을 수행했다고 언급했습니다.

지난주, 한 연구원이 Claude 3.7 Sonnet의 초기 미리보기를 시험해 보았습니다.
결과는 놀라웠습니다. 몇 시간 만에 Claude는 Brock을 물리쳤습니다. 며칠 후에는 Misty를 완파했습니다. 이전 모델들이 거의 달성할 가능성이 없었던 진행이었습니다.
확장된 사고가 매우 효과적임이 밝혀졌습니다. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 2025년 2월 25일

곧 어떤 영리한 개발자가 세부 사항을 알아낼 것입니다.

Pokémon Red가 약간 재미있는 테스트처럼 보일 수 있지만, 게임은 실제로 오랫동안 AI 벤치마킹에 사용되어 왔습니다. 지난 몇 달 동안, Street Fighter부터 Pictionary까지 AI 모델이 얼마나 잘 플레이할 수 있는지 테스트하기 위해 수많은 새로운 앱과 플랫폼이 등장했습니다.

관련 특별 주제 추천

사업

최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구

xix.ai

사업

최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구

xix.ai

생산력

AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구

xix.ai

챗봇

최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구

xix.ai

교육 및 학습

최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구

xix.ai

챗봇

최고의 AI 유혹 및 대화 트레이너: 실시간으로 사회적 매력과 자신감을 높여보세요

XIX.AI에서 2026년 최고의 AI 플러팅 및 대화 트레이너를 만나보세요. 엄선된 최고 평점의 제품들을 통해 실시간으로 사회적 매력과 자신감을 키울 수 있습니다. 무료와 유료 버전을 비교하고 매주 업데이트되는 순위를 확인하며, 꼭 사용해봐야 할 획기적인 도구들을 탐색해 보세요. 지금 바로 여러분의 사회적 경쟁력을 한 단계 높여보세요.

10 도구

xix.ai

의견 (19)

0/500

먼저 로그인하십시오

GaryWilson

2025년 10월 30일 오전 3시 31분 10초 GMT+09:00

와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?

BillyAdams

2025년 8월 27일 오후 9시 59분 25초 GMT+09:00

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎

FrankSanchez

2025년 8월 12일 오전 2시 1분 2초 GMT+09:00

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄

PaulSanchez

2025년 7월 23일 오후 1시 59분 29초 GMT+09:00

Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️

LawrenceLopez

2025년 4월 22일 오후 1시 33분 7초 GMT+09:00

Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂

JeffreyRamirez

2025년 4월 20일 오후 5시 47분 48초 GMT+09:00

Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다

더