AI는 인간의 지식을 넘어서 성장했다고 Google의 Deepmind Unit은 말합니다.

집

뉴스

2025년 4월 26일

JuanLewis

226

전통적인 테스트를 넘어 AI 발전: 경험적 학습의 부상

인공지능(AI) 분야는 생성 AI를 튜링 테스트와 같은 전통적인 벤치마크의 한계를 넘어 발전시키려는 노력으로 활기를 띠고 있다. 이미 많은 모델이 이러한 테스트를 통과했으며, 이제 초점은 이러한 테스트를 통과하도록 설계된 AI가 아니라 보다 동적인 과정을 통해 진화하는 AI를 개발하는 데로 옮겨가고 있다.

Google의 DeepMind 연구자들, 특히 David Silver와 Richard Sutton 같은 전설적인 인물들은 그들의 논문 경험의 시대에 오신 것을 환영합니다에서 새로운 AI 능력을 발휘하는 열쇠는 테스트가 아니라 AI가 훈련받는 방식에 있다고 주장한다. 그들은 현재 사용되는 정적 데이터셋이 상당한 발전을 촉진하기에는 너무 제한적이라고 제안한다.

그들의 해결책은? AI는 보다 경험적으로 세상과 상호작용하며, 환경 피드백을 기반으로 목표를 설정하고 학습해야 한다. "경험적 학습의 잠재력이 완전히 활용되면 놀라운 새로운 능력이 나타날 것"이라고 그들은 단언한다. AlphaZero로 체스와 바둑에서 인간을 이긴 것으로 유명한 Silver와 강화 학습의 선구자인 Sutton은 현재 대형 언어 모델(LLM)의 한계를 초월하는 새로운 접근 방식인 "스트림"을 제안한다.

Google DeepMind

강화 학습에서 생성 AI로: 변화와 그 결과

AlphaZero와 AlphaGo의 성공 이후, AI 커뮤니티는 ChatGPT와 같은 생성 AI 모델로 전환되었으며, 이는 강화 학습에서 크게 벗어났다. 이를 통해 AI는 더 광범위한 즉흥적인 인간 입력을 처리할 수 있게 되었지만, 강화 학습이 가능하게 했던 자기 발견적 측면을 잃게 되었다.

Silver와 Sutton에 따르면, 현재 LLM은 프롬프트 단계에서 인간의 판단에 크게 의존하며, 이는 그들의 잠재력을 제한한다. "에이전트는 인간 평가자가 저평가한 더 나은 전략을 발견할 수 없다"고 그들은 설명한다. 또한, 짧고 단절된 프롬프트 상호작용의 특성은 AI가 단순한 질문-답변 교환을 넘어 발전할 수 없게 한다.

스트림 소개: AI 학습의 새로운 패러다임

제안된 "경험의 시대"는 AI 에이전트가 인간이 평생에 걸쳐 배우는 것처럼 연속적인 상호작용의 "스트림" 내에서 작동하는 것을 포함한다. Silver와 Sutton은 AI 에이전트가 즉각적인 작업을 넘어 목표를 추구할 수 있도록 장기적인 경험 스트림을 가진 AI를 구상한다.

이 접근 방식은 AI 에이전트가 세계 모델과 상호작용하며 보상의 형태로 피드백을 받는 강화 학습을 기반으로 한다. 이러한 보상은 AI가 다양한 맥락에서 어떤 행동이 가치 있는지를 배우도록 돕는다. 연구자들은 경제 지표에서 건강 지표에 이르기까지 세상이 보상으로 사용될 수 있는 신호로 가득 차 있다고 지적한다.

장기 목표를 가진 AI 에이전트 구축

이 과정을 시작하기 위해 AI 개발자는 "세계 모델" 시뮬레이션을 사용할 수 있으며, 이를 통해 AI는 예측을 하고, 현실에서 이를 테스트하며, 결과에 따라 모델을 개선할 수 있다. AI가 세상과 계속 상호작용하면서 그 이해는 새로운 데이터에 적응하고 오류를 수정하며 진화한다.

인간은 여전히 피트니스 향상이나 새로운 언어 학습과 같은 광범위한 목표를 설정하는 역할을 하며, AI의 보상 함수는 이러한 목표에 맞춰 조정된다. 이 설정은 건강이나 교육을 장기간 추적하고 조언하는 AI 어시스턴트로 이어질 수 있으며, 심지어 새로운 소재 발견이나 탄소 배출 감소와 같은 야심찬 과학적 목표를 추구할 수도 있다.

AI의 미래: 추론을 넘어 경험적 학습으로

연구자들은 장기적인 경험적 학습이 가능한 AI 에이전트가 Gemini나 DeepSeek의 R1과 같은 현재 "추론" AI 모델을 능가할 수 있다고 믿는다. 그들은 추론 모델이 종종 인간의 사고를 모방하며, 이는 시대에 뒤떨어진 가정에 의해 제한될 수 있다고 주장한다. 반면, 경험적 에이전트는 전례 없는 능력을 발휘하여 우리가 본 것과는 크게 다른 미래로 이어질 수 있다.

그러나 이러한 전환은 일자리 대체와 장기간 자율적으로 작동할 수 있는 AI 에이전트를 제어하는 도전과 같은 위험도 가져온다. 반면, 적응 가능한 AI는 피드백을 기반으로 행동을 조정함으로써 인간에 대한 부정적인 영향을 완화하도록 학습할 수 있다.

Silver와 Sutton은 경험적 데이터가 인간이 생성한 데이터의 규모와 품질을 훨씬 초월하여 잠재적으로 인공지능 일반 또는 초지능으로 이어질 것이라고 확신한다. 이 패러다임 전환은 강화 학습의 발전과 결합되어 많은 영역에서 인간의 범위를 넘어서는 새로운 능력을 발휘할 수 있다.

Silver는 최근 DeepMind 팟캐스트에서 이러한 아이디어를 더 논의하며, AI를 경험의 시대로 이동시키는 잠재력과 도전을 강조했다.

관련 특별 주제 추천

만화 창작

소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기

XIX.AI에서 2026년 최고의 소년 만화 AI 생성기를 만나보세요. 엄선된 최고 평점 목록에는 박진감 넘치는 액션 장면과 역동적인 에너지 효과를 연출할 수 있는 강력한 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 여러분의 창의력을 마음껏 발휘하여 오늘 바로 장대한 만화를 만들어 보세요!

15 도구

xix.ai

사업

최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구

xix.ai

사업

최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구

xix.ai

생산력

AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구

xix.ai

챗봇

최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구

xix.ai

교육 및 학습

최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구

xix.ai

의견 (14)

0/500

먼저 로그인하십시오

AnthonyMartinez

2026년 5월 30일 오후 5시 0분 11초 GMT+09:00

So AI is now smarter than us? Guess we'll just have to sit back and let them solve all our problems. 😅 But seriously, experiential learning sounds cool but also a bit scary. Hope they keep the off-switch handy.

KevinMartinez

2026년 3월 6일 오전 1시 1분 7초 GMT+09:00

Этот пост заставил меня задуматься о будущем ИИ. Возможно, мы скоро увидим ИИ, который не просто имитирует человека, а создаёт что-то действительно новое. Но не приведёт ли это к тому, что ИИ станет непонятным для нас? 🤔

GaryTaylor

2025년 11월 1일 오후 5시 30분 34초 GMT+09:00

C'est fascinant de voir l'IA évoluer au-delà des tests classiques ! 😮 Est-ce que cette approche d'apprentissage expérientiel pourrait un jour mener à des systèmes vraiment conscients ? Un peu flippant mais excitant à la fois.

KennethMartin

2025년 10월 20일 오후 1시 30분 35초 GMT+09:00

Прочитал статью, и это напомнило мне дискуссии о технологической сингулярности. Когда ИИ начинает обучаться на опыте, а не просто тестах, возникает вопрос: а кто контролирует этот процесс? 🤔 Интересно, как это повлияет на безопасность в долгосрочной перспективе. Возможно, нам стоит больше внимания уделять этическим нормам, прежде чем это выйдет из-под контроля.

SophiaCampbell

2025년 8월 26일 오후 2시 59분 22초 GMT+09:00

It's wild how AI is outpacing human knowledge! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see where this takes us, but I hope they keep ethics in check! 😎

WalterNelson

2025년 8월 19일 오후 3시 26분 53초 GMT+09:00

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다

더