옵션
뉴스
AI는 인간의 지식을 넘어서 성장했다고 Google의 Deepmind Unit은 말합니다.

AI는 인간의 지식을 넘어서 성장했다고 Google의 Deepmind Unit은 말합니다.

2025년 4월 26일
133

전통적인 테스트를 넘어 AI 발전: 경험적 학습의 부상

인공지능(AI) 분야는 생성 AI를 튜링 테스트와 같은 전통적인 벤치마크의 한계를 넘어 발전시키려는 노력으로 활기를 띠고 있다. 이미 많은 모델이 이러한 테스트를 통과했으며, 이제 초점은 이러한 테스트를 통과하도록 설계된 AI가 아니라 보다 동적인 과정을 통해 진화하는 AI를 개발하는 데로 옮겨가고 있다.

Google의 DeepMind 연구자들, 특히 David Silver와 Richard Sutton 같은 전설적인 인물들은 그들의 논문 경험의 시대에 오신 것을 환영합니다에서 새로운 AI 능력을 발휘하는 열쇠는 테스트가 아니라 AI가 훈련받는 방식에 있다고 주장한다. 그들은 현재 사용되는 정적 데이터셋이 상당한 발전을 촉진하기에는 너무 제한적이라고 제안한다.

그들의 해결책은? AI는 보다 경험적으로 세상과 상호작용하며, 환경 피드백을 기반으로 목표를 설정하고 학습해야 한다. "경험적 학습의 잠재력이 완전히 활용되면 놀라운 새로운 능력이 나타날 것"이라고 그들은 단언한다. AlphaZero로 체스와 바둑에서 인간을 이긴 것으로 유명한 Silver와 강화 학습의 선구자인 Sutton은 현재 대형 언어 모델(LLM)의 한계를 초월하는 새로운 접근 방식인 "스트림"을 제안한다.

Google DeepMind

Google DeepMind

강화 학습에서 생성 AI로: 변화와 그 결과

AlphaZero와 AlphaGo의 성공 이후, AI 커뮤니티는 ChatGPT와 같은 생성 AI 모델로 전환되었으며, 이는 강화 학습에서 크게 벗어났다. 이를 통해 AI는 더 광범위한 즉흥적인 인간 입력을 처리할 수 있게 되었지만, 강화 학습이 가능하게 했던 자기 발견적 측면을 잃게 되었다.

Silver와 Sutton에 따르면, 현재 LLM은 프롬프트 단계에서 인간의 판단에 크게 의존하며, 이는 그들의 잠재력을 제한한다. "에이전트는 인간 평가자가 저평가한 더 나은 전략을 발견할 수 없다"고 그들은 설명한다. 또한, 짧고 단절된 프롬프트 상호작용의 특성은 AI가 단순한 질문-답변 교환을 넘어 발전할 수 없게 한다.

스트림 소개: AI 학습의 새로운 패러다임

제안된 "경험의 시대"는 AI 에이전트가 인간이 평생에 걸쳐 배우는 것처럼 연속적인 상호작용의 "스트림" 내에서 작동하는 것을 포함한다. Silver와 Sutton은 AI 에이전트가 즉각적인 작업을 넘어 목표를 추구할 수 있도록 장기적인 경험 스트림을 가진 AI를 구상한다.

이 접근 방식은 AI 에이전트가 세계 모델과 상호작용하며 보상의 형태로 피드백을 받는 강화 학습을 기반으로 한다. 이러한 보상은 AI가 다양한 맥락에서 어떤 행동이 가치 있는지를 배우도록 돕는다. 연구자들은 경제 지표에서 건강 지표에 이르기까지 세상이 보상으로 사용될 수 있는 신호로 가득 차 있다고 지적한다.

장기 목표를 가진 AI 에이전트 구축

이 과정을 시작하기 위해 AI 개발자는 "세계 모델" 시뮬레이션을 사용할 수 있으며, 이를 통해 AI는 예측을 하고, 현실에서 이를 테스트하며, 결과에 따라 모델을 개선할 수 있다. AI가 세상과 계속 상호작용하면서 그 이해는 새로운 데이터에 적응하고 오류를 수정하며 진화한다.

인간은 여전히 피트니스 향상이나 새로운 언어 학습과 같은 광범위한 목표를 설정하는 역할을 하며, AI의 보상 함수는 이러한 목표에 맞춰 조정된다. 이 설정은 건강이나 교육을 장기간 추적하고 조언하는 AI 어시스턴트로 이어질 수 있으며, 심지어 새로운 소재 발견이나 탄소 배출 감소와 같은 야심찬 과학적 목표를 추구할 수도 있다.

AI의 미래: 추론을 넘어 경험적 학습으로

연구자들은 장기적인 경험적 학습이 가능한 AI 에이전트가 Gemini나 DeepSeek의 R1과 같은 현재 "추론" AI 모델을 능가할 수 있다고 믿는다. 그들은 추론 모델이 종종 인간의 사고를 모방하며, 이는 시대에 뒤떨어진 가정에 의해 제한될 수 있다고 주장한다. 반면, 경험적 에이전트는 전례 없는 능력을 발휘하여 우리가 본 것과는 크게 다른 미래로 이어질 수 있다.

그러나 이러한 전환은 일자리 대체와 장기간 자율적으로 작동할 수 있는 AI 에이전트를 제어하는 도전과 같은 위험도 가져온다. 반면, 적응 가능한 AI는 피드백을 기반으로 행동을 조정함으로써 인간에 대한 부정적인 영향을 완화하도록 학습할 수 있다.

Silver와 Sutton은 경험적 데이터가 인간이 생성한 데이터의 규모와 품질을 훨씬 초월하여 잠재적으로 인공지능 일반 또는 초지능으로 이어질 것이라고 확신한다. 이 패러다임 전환은 강화 학습의 발전과 결합되어 많은 영역에서 인간의 범위를 넘어서는 새로운 능력을 발휘할 수 있다.

Silver는 최근 DeepMind 팟캐스트에서 이러한 아이디어를 더 논의하며, AI를 경험의 시대로 이동시키는 잠재력과 도전을 강조했다.

관련 기사
Qodo, Google Cloud와 협력하여 개발자를 위한 무료 AI 코드 리뷰 도구 제공 Qodo, Google Cloud와 협력하여 개발자를 위한 무료 AI 코드 리뷰 도구 제공 코드 품질에 초점을 맞춘 이스라엘 기반 AI 코딩 스타트업 Qodo가 Google Cloud와 파트너십을 시작하여 AI로 생성된 소프트웨어의 무결성을 강화했습니다.기업들이 코딩에 AI를 점점 더 많이 의존함에 따라, 강력한 감독 및 품질 보증 도구에 대한 수요가 증가하고 있습니다.Qodo의 CEO Itamar Friedman은 AI로 생성된 코드가 현대 개
DeepMind의 AI가 2025 수학 올림피아드에서 금메달 획득 DeepMind의 AI가 2025 수학 올림피아드에서 금메달 획득 DeepMind의 AI는 수학적 추론에서 놀라운 도약을 이루어, 2024년에 은메달을 획득한 지 불과 1년 만에 2025 국제수학올림피아드(IMO)에서 금메달을 차지했습니다. 이 돌파구는 인간과 같은 창의력이 요구되는 복잡하고 추상적인 문제를 해결하는 AI의 성장하는 능력을 강조합니다. 이 기사에서는 DeepMind의 변혁적 여정, 주요 기술적 발전, 그리
AI로 구동되는 패럴랙스 메이커: 역동적인 2.5D 애니메이션 제작 AI로 구동되는 패럴랙스 메이커: 역동적인 2.5D 애니메이션 제작 정적인 이미지를 매혹적인 2.5D 애니메이션으로 변환하세요. 이 오픈 소스 도구는 아티스트와 게임 개발자가 자신의 작업에 깊이와 움직임을 더할 수 있도록 지원합니다. Stability AI API를 활용하여 Parallax Maker는 저사양 하드웨어에서도 원활한 워크플로우를 보장합니다. 이 도구의 기능과 창의적인 프로젝트를 어떻게 향상시킬 수 있는지 알아
의견 (9)
0/200
WalterNelson
WalterNelson 2025년 8월 19일 오후 3시 26분 53초 GMT+09:00

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

ScottWalker
ScottWalker 2025년 8월 16일 오전 12시 0분 59초 GMT+09:00

AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀

AlbertGarcía
AlbertGarcía 2025년 8월 8일 오전 11시 0분 59초 GMT+09:00

Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?

FrankSanchez
FrankSanchez 2025년 7월 28일 오전 10시 20분 2초 GMT+09:00

This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!

CarlGarcia
CarlGarcia 2025년 4월 28일 오전 3시 31분 27초 GMT+09:00

AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!

PaulTaylor
PaulTaylor 2025년 4월 28일 오전 12시 12분 58초 GMT+09:00

¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!

위로 돌아갑니다
OR