AI는 인간의 지식을 넘어서 성장했다고 Google의 Deepmind Unit은 말합니다.
전통적인 테스트를 넘어 AI 발전: 경험적 학습의 부상
인공지능(AI) 분야는 생성 AI를 튜링 테스트와 같은 전통적인 벤치마크의 한계를 넘어 발전시키려는 노력으로 활기를 띠고 있다. 이미 많은 모델이 이러한 테스트를 통과했으며, 이제 초점은 이러한 테스트를 통과하도록 설계된 AI가 아니라 보다 동적인 과정을 통해 진화하는 AI를 개발하는 데로 옮겨가고 있다.
Google의 DeepMind 연구자들, 특히 David Silver와 Richard Sutton 같은 전설적인 인물들은 그들의 논문 경험의 시대에 오신 것을 환영합니다에서 새로운 AI 능력을 발휘하는 열쇠는 테스트가 아니라 AI가 훈련받는 방식에 있다고 주장한다. 그들은 현재 사용되는 정적 데이터셋이 상당한 발전을 촉진하기에는 너무 제한적이라고 제안한다.
그들의 해결책은? AI는 보다 경험적으로 세상과 상호작용하며, 환경 피드백을 기반으로 목표를 설정하고 학습해야 한다. "경험적 학습의 잠재력이 완전히 활용되면 놀라운 새로운 능력이 나타날 것"이라고 그들은 단언한다. AlphaZero로 체스와 바둑에서 인간을 이긴 것으로 유명한 Silver와 강화 학습의 선구자인 Sutton은 현재 대형 언어 모델(LLM)의 한계를 초월하는 새로운 접근 방식인 "스트림"을 제안한다.

Google DeepMind 강화 학습에서 생성 AI로: 변화와 그 결과
AlphaZero와 AlphaGo의 성공 이후, AI 커뮤니티는 ChatGPT와 같은 생성 AI 모델로 전환되었으며, 이는 강화 학습에서 크게 벗어났다. 이를 통해 AI는 더 광범위한 즉흥적인 인간 입력을 처리할 수 있게 되었지만, 강화 학습이 가능하게 했던 자기 발견적 측면을 잃게 되었다.
Silver와 Sutton에 따르면, 현재 LLM은 프롬프트 단계에서 인간의 판단에 크게 의존하며, 이는 그들의 잠재력을 제한한다. "에이전트는 인간 평가자가 저평가한 더 나은 전략을 발견할 수 없다"고 그들은 설명한다. 또한, 짧고 단절된 프롬프트 상호작용의 특성은 AI가 단순한 질문-답변 교환을 넘어 발전할 수 없게 한다.
스트림 소개: AI 학습의 새로운 패러다임
제안된 "경험의 시대"는 AI 에이전트가 인간이 평생에 걸쳐 배우는 것처럼 연속적인 상호작용의 "스트림" 내에서 작동하는 것을 포함한다. Silver와 Sutton은 AI 에이전트가 즉각적인 작업을 넘어 목표를 추구할 수 있도록 장기적인 경험 스트림을 가진 AI를 구상한다.
이 접근 방식은 AI 에이전트가 세계 모델과 상호작용하며 보상의 형태로 피드백을 받는 강화 학습을 기반으로 한다. 이러한 보상은 AI가 다양한 맥락에서 어떤 행동이 가치 있는지를 배우도록 돕는다. 연구자들은 경제 지표에서 건강 지표에 이르기까지 세상이 보상으로 사용될 수 있는 신호로 가득 차 있다고 지적한다.
장기 목표를 가진 AI 에이전트 구축
이 과정을 시작하기 위해 AI 개발자는 "세계 모델" 시뮬레이션을 사용할 수 있으며, 이를 통해 AI는 예측을 하고, 현실에서 이를 테스트하며, 결과에 따라 모델을 개선할 수 있다. AI가 세상과 계속 상호작용하면서 그 이해는 새로운 데이터에 적응하고 오류를 수정하며 진화한다.
인간은 여전히 피트니스 향상이나 새로운 언어 학습과 같은 광범위한 목표를 설정하는 역할을 하며, AI의 보상 함수는 이러한 목표에 맞춰 조정된다. 이 설정은 건강이나 교육을 장기간 추적하고 조언하는 AI 어시스턴트로 이어질 수 있으며, 심지어 새로운 소재 발견이나 탄소 배출 감소와 같은 야심찬 과학적 목표를 추구할 수도 있다.
AI의 미래: 추론을 넘어 경험적 학습으로
연구자들은 장기적인 경험적 학습이 가능한 AI 에이전트가 Gemini나 DeepSeek의 R1과 같은 현재 "추론" AI 모델을 능가할 수 있다고 믿는다. 그들은 추론 모델이 종종 인간의 사고를 모방하며, 이는 시대에 뒤떨어진 가정에 의해 제한될 수 있다고 주장한다. 반면, 경험적 에이전트는 전례 없는 능력을 발휘하여 우리가 본 것과는 크게 다른 미래로 이어질 수 있다.
그러나 이러한 전환은 일자리 대체와 장기간 자율적으로 작동할 수 있는 AI 에이전트를 제어하는 도전과 같은 위험도 가져온다. 반면, 적응 가능한 AI는 피드백을 기반으로 행동을 조정함으로써 인간에 대한 부정적인 영향을 완화하도록 학습할 수 있다.
Silver와 Sutton은 경험적 데이터가 인간이 생성한 데이터의 규모와 품질을 훨씬 초월하여 잠재적으로 인공지능 일반 또는 초지능으로 이어질 것이라고 확신한다. 이 패러다임 전환은 강화 학습의 발전과 결합되어 많은 영역에서 인간의 범위를 넘어서는 새로운 능력을 발휘할 수 있다.
Silver는 최근 DeepMind 팟캐스트에서 이러한 아이디어를 더 논의하며, AI를 경험의 시대로 이동시키는 잠재력과 도전을 강조했다.
관련 기사
교육용 인포그래픽 제작을 위한 최고의 AI 도구 - 디자인 팁 및 기술
오늘날의 디지털 중심 교육 환경에서 인포그래픽은 복잡한 정보를 시각적으로 매력적이고 이해하기 쉬운 형식으로 변환하는 혁신적인 커뮤니케이션 매체로 부상했습니다. AI 기술은 교육자가 이러한 시각적 학습 보조 자료를 제작하는 방식을 혁신하여 누구나 전문가 수준의 디자인을 이용할 수 있게 하는 동시에 제작 시간을 획기적으로 단축하고 있습니다. 이 탐구에서는 간소
토파즈 디노이즈 AI: 2025년 최고의 노이즈 감소 도구 - 전체 가이드
경쟁이 치열한 디지털 사진의 세계에서 이미지 선명도는 여전히 가장 중요한 요소입니다. 모든 수준의 사진가들은 뛰어난 사진을 손상시키는 디지털 노이즈와 싸우고 있습니다. 토파즈 디노이즈 AI는 인공 지능을 활용하여 중요한 디테일을 보존하면서 노이즈 감소 문제를 해결하는 최첨단 솔루션으로 떠오르고 있습니다. 이 심층 리뷰에서는 이 혁신적인 소프트웨어가 2025
마스터 에메랄드 카이조 누즐로크: 궁극의 생존 & 전략 가이드
에메랄드 카이조는 지금까지 고안된 가장 강력한 포켓몬 ROM 해킹 중 하나입니다. 누즈락을 시도하면 난이도가 기하급수적으로 증가하지만, 세심한 계획과 전략적인 실행을 통해 승리를 거둘 수 있습니다. 이 최종 가이드는 하드코어 누즐로크 규칙에 따라 에메랄드 카이조를 정복하기 위한 필수 도구, 실전 테스트를 거친 전술, 심층적인 AI 분석을 제공합니다. 포켓몬
의견 (10)
0/200
SophiaCampbell
2025년 8월 26일 오후 2시 59분 22초 GMT+09:00
It's wild how AI is outpacing human knowledge! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see where this takes us, but I hope they keep ethics in check! 😎
0
WalterNelson
2025년 8월 19일 오후 3시 26분 53초 GMT+09:00
AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀
0
ScottWalker
2025년 8월 16일 오전 12시 0분 59초 GMT+09:00
AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀
0
AlbertGarcía
2025년 8월 8일 오전 11시 0분 59초 GMT+09:00
Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?
0
FrankSanchez
2025년 7월 28일 오전 10시 20분 2초 GMT+09:00
This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!
0
CarlGarcia
2025년 4월 28일 오전 3시 31분 27초 GMT+09:00
AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!
0
전통적인 테스트를 넘어 AI 발전: 경험적 학습의 부상
인공지능(AI) 분야는 생성 AI를 튜링 테스트와 같은 전통적인 벤치마크의 한계를 넘어 발전시키려는 노력으로 활기를 띠고 있다. 이미 많은 모델이 이러한 테스트를 통과했으며, 이제 초점은 이러한 테스트를 통과하도록 설계된 AI가 아니라 보다 동적인 과정을 통해 진화하는 AI를 개발하는 데로 옮겨가고 있다.
Google의 DeepMind 연구자들, 특히 David Silver와 Richard Sutton 같은 전설적인 인물들은 그들의 논문 경험의 시대에 오신 것을 환영합니다에서 새로운 AI 능력을 발휘하는 열쇠는 테스트가 아니라 AI가 훈련받는 방식에 있다고 주장한다. 그들은 현재 사용되는 정적 데이터셋이 상당한 발전을 촉진하기에는 너무 제한적이라고 제안한다.
그들의 해결책은? AI는 보다 경험적으로 세상과 상호작용하며, 환경 피드백을 기반으로 목표를 설정하고 학습해야 한다. "경험적 학습의 잠재력이 완전히 활용되면 놀라운 새로운 능력이 나타날 것"이라고 그들은 단언한다. AlphaZero로 체스와 바둑에서 인간을 이긴 것으로 유명한 Silver와 강화 학습의 선구자인 Sutton은 현재 대형 언어 모델(LLM)의 한계를 초월하는 새로운 접근 방식인 "스트림"을 제안한다.
강화 학습에서 생성 AI로: 변화와 그 결과
AlphaZero와 AlphaGo의 성공 이후, AI 커뮤니티는 ChatGPT와 같은 생성 AI 모델로 전환되었으며, 이는 강화 학습에서 크게 벗어났다. 이를 통해 AI는 더 광범위한 즉흥적인 인간 입력을 처리할 수 있게 되었지만, 강화 학습이 가능하게 했던 자기 발견적 측면을 잃게 되었다.
Silver와 Sutton에 따르면, 현재 LLM은 프롬프트 단계에서 인간의 판단에 크게 의존하며, 이는 그들의 잠재력을 제한한다. "에이전트는 인간 평가자가 저평가한 더 나은 전략을 발견할 수 없다"고 그들은 설명한다. 또한, 짧고 단절된 프롬프트 상호작용의 특성은 AI가 단순한 질문-답변 교환을 넘어 발전할 수 없게 한다.
스트림 소개: AI 학습의 새로운 패러다임
제안된 "경험의 시대"는 AI 에이전트가 인간이 평생에 걸쳐 배우는 것처럼 연속적인 상호작용의 "스트림" 내에서 작동하는 것을 포함한다. Silver와 Sutton은 AI 에이전트가 즉각적인 작업을 넘어 목표를 추구할 수 있도록 장기적인 경험 스트림을 가진 AI를 구상한다.
이 접근 방식은 AI 에이전트가 세계 모델과 상호작용하며 보상의 형태로 피드백을 받는 강화 학습을 기반으로 한다. 이러한 보상은 AI가 다양한 맥락에서 어떤 행동이 가치 있는지를 배우도록 돕는다. 연구자들은 경제 지표에서 건강 지표에 이르기까지 세상이 보상으로 사용될 수 있는 신호로 가득 차 있다고 지적한다.
장기 목표를 가진 AI 에이전트 구축
이 과정을 시작하기 위해 AI 개발자는 "세계 모델" 시뮬레이션을 사용할 수 있으며, 이를 통해 AI는 예측을 하고, 현실에서 이를 테스트하며, 결과에 따라 모델을 개선할 수 있다. AI가 세상과 계속 상호작용하면서 그 이해는 새로운 데이터에 적응하고 오류를 수정하며 진화한다.
인간은 여전히 피트니스 향상이나 새로운 언어 학습과 같은 광범위한 목표를 설정하는 역할을 하며, AI의 보상 함수는 이러한 목표에 맞춰 조정된다. 이 설정은 건강이나 교육을 장기간 추적하고 조언하는 AI 어시스턴트로 이어질 수 있으며, 심지어 새로운 소재 발견이나 탄소 배출 감소와 같은 야심찬 과학적 목표를 추구할 수도 있다.
AI의 미래: 추론을 넘어 경험적 학습으로
연구자들은 장기적인 경험적 학습이 가능한 AI 에이전트가 Gemini나 DeepSeek의 R1과 같은 현재 "추론" AI 모델을 능가할 수 있다고 믿는다. 그들은 추론 모델이 종종 인간의 사고를 모방하며, 이는 시대에 뒤떨어진 가정에 의해 제한될 수 있다고 주장한다. 반면, 경험적 에이전트는 전례 없는 능력을 발휘하여 우리가 본 것과는 크게 다른 미래로 이어질 수 있다.
그러나 이러한 전환은 일자리 대체와 장기간 자율적으로 작동할 수 있는 AI 에이전트를 제어하는 도전과 같은 위험도 가져온다. 반면, 적응 가능한 AI는 피드백을 기반으로 행동을 조정함으로써 인간에 대한 부정적인 영향을 완화하도록 학습할 수 있다.
Silver와 Sutton은 경험적 데이터가 인간이 생성한 데이터의 규모와 품질을 훨씬 초월하여 잠재적으로 인공지능 일반 또는 초지능으로 이어질 것이라고 확신한다. 이 패러다임 전환은 강화 학습의 발전과 결합되어 많은 영역에서 인간의 범위를 넘어서는 새로운 능력을 발휘할 수 있다.
Silver는 최근 DeepMind 팟캐스트에서 이러한 아이디어를 더 논의하며, AI를 경험의 시대로 이동시키는 잠재력과 도전을 강조했다.




It's wild how AI is outpacing human knowledge! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see where this takes us, but I hope they keep ethics in check! 😎




AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀




AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀




Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?




This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!




AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!












