AIは人間の知識を超えて成長しました、とGoogleのDeepmindユニットは言います
伝統的なテストを超えたAIの進化:経験学習の台頭
人工知能(AI)の分野では、生成AIを従来のベンチマーク、例えば多くのモデルがすでに超えているチューリングテストの枠を超えて推進しようとする動きが活発化しています。今、焦点はこれらのテストで高得点を出すために設計されたAIではなく、より動的なプロセスを通じて進化するAIの開発に移っています。
GoogleのDeepMindの研究者たち、例えばDavid SilverやRichard Suttonといった著名な人物は、彼らの論文経験の時代へようこその中で、新しいAIの能力を引き出す鍵はテストそのものではなく、AIの訓練方法にあると主張しています。彼らは、現在の静的なデータセットは大きな進歩を促すにはあまりにも限定的だと指摘しています。
彼らの解決策は? AIはより経験的に世界と関わり、相互作用から学び、環境からのフィードバックに基づいて目標を設定する必要があります。「経験学習の完全な可能性が活用されれば、驚くべき新しい能力が生まれるでしょう」と彼らは断言します。AlphaZeroでチェスや囲碁で人間を打ち負かしたことで知られるSilverと、強化学習の先駆者であるSuttonは、現在の大規模言語モデル(LLM)の限界を超えるための新しいアプローチ「ストリーム」を提案しています。

Google DeepMind 強化学習から生成AIへ:その変化とその結果
AlphaZeroやAlphaGoの成功後、AIコミュニティはChatGPTのような生成AIモデルへとシフトし、強化学習から大きく離れました。これによりAIは幅広い自発的な人間の入力を処理できるようになりましたが、強化学習がもたらしていた自己発見の側面を失いました。
SilverとSuttonによると、現在のLLMはプロンプト段階で人間の判断に大きく依存しており、その可能性を制限しています。「エージェントは人間の評価者が過小評価しているより良い戦略を発見することはできません」と彼らは説明します。さらに、プロンプトの短く断片的なやり取りでは、AIが単純な質疑応答を超えて発展することができません。
ストリームの導入:AI学習の新しいパラダイム
提案された「経験の時代」では、AIエージェントが人間が生涯を通じて学ぶように、連続的な相互作用の「ストリーム」の中で動作します。SilverとSuttonは、AIエージェントが長期的な経験のストリームを持ち、即時のタスクを超えた目標を追求できるようにすることを構想しています。
このアプローチは強化学習に基づいており、AIエージェントは世界のモデルと相互作用し、報酬の形でフィードバックを受け取ります。これらの報酬は、AIが異なるコンテキストでどの行動が価値あるかを学ぶのに役立ちます。研究者たちは、世界には経済指標から健康メトリクスまで、報酬として機能する豊富なシグナルがあると指摘しています。
長期目標を持つAIエージェントの構築
このプロセスを開始するために、AI開発者は「世界モデル」シミュレーションを使用し、AIが予測を行い、現実でテストし、結果に基づいてモデルを改良できるようにすることができます。AIが世界と継続的に相互作用するにつれて、その理解は進化し、新しいデータに適応し、エラーを修正します。
人間は、フィットネスの向上や新しい言語の学習など、広範な目標を設定する役割を依然として果たします。AIの報酬関数はこれらの目標に合わせて調整されます。この設定により、AIアシスタントは健康や教育を長期間にわたって追跡・助言したり、新しい素材の発見や二酸化炭素排出量の削減といった野心的な科学的目標を追求したりできるようになります。
AIの未来:推論を超えて経験学習へ
研究者たちは、長期的な経験学習が可能なAIエージェントは、GeminiやDeepSeekのR1のような現在の「推論」AIモデルを超える可能性があると信じています。彼らは、推論モデルはしばしば時代遅れの前提に縛られた人間の思考を模倣すると主張します。対照的に、経験エージェントは前例のない能力を引き出し、これまでに見たことのない未来をもたらす可能性があります。
しかし、このシフトには、雇用の喪失や長期間自律的に動作するAIエージェントを制御する課題などのリスクも伴います。一方で、適応性のあるAIは、フィードバックに基づいて行動を調整することで、人間への悪影響を軽減するよう学ぶことができます。
SilverとSuttonは、経験データが人間が生成したデータの規模と質をはるかに超え、人工汎用知能や超知能につながる可能性があると確信しています。このパラダイムシフトは、強化学習の進歩と結びつき、多くの領域で人間の能力を超える新しい能力を引き出す可能性があります。
Silverは最近のDeepMindポッドキャストでこれらのアイデアをさらに議論し、AIを経験の時代に移行させる可能性と課題を強調しました。
関連記事
QodoがGoogle Cloudと提携し、開発者向け無料AIコードレビューを提供
Qodo、イスラエル拠点のAIコーディングスタートアップは、コード品質に焦点を当て、Google Cloudと提携し、AI生成ソフトウェアの完全性を強化。企業がコーディングにAIをますます活用する中、堅牢な監視と品質保証ツールの需要が増加。QodoのCEOイタマール・フリードマンは、AI生成コードが現代の開発の中心であると指摘。「AIがすべてのコードを書く未来を想像してください。人間がすべてをレビ
DeepMindのAIが2025年数学オリンピックで金メダルを獲得
DeepMindのAIは、数学的推論において驚くべき飛躍を遂げ、2024年に銀メダルを獲得したわずか1年後の2025年国際数学オリンピック(IMO)で金メダルを獲得しました。このブレークスルーは、AIが人間のような創造性を必要とする複雑で抽象的な問題を解く能力の向上を強調しています。この記事では、DeepMindの変革的な軌跡、主要な技術的進歩、そしてこのマイルストーンの広範な影響を探ります。IM
AI駆動のパララックスメーカー:ダイナミックな2.5Dアニメーションを作成
静止画を魅力的な2.5Dアニメーションに変換するParallax Maker。このオープンソースツールは、アーティストやゲーム開発者が作品に奥行きと動きを加えることを可能にします。Stability AI APIを活用することで、Parallax Makerは控えめなハードウェアでもスムーズなワークフローを保証します。このツールの機能と、それがあなたのクリエイティブなプロジェクトをどのように向上さ
コメント (9)
0/200
WalterNelson
2025年8月19日 15:26:53 JST
AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀
0
ScottWalker
2025年8月16日 0:00:59 JST
AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀
0
AlbertGarcía
2025年8月8日 11:00:59 JST
Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?
0
FrankSanchez
2025年7月28日 10:20:02 JST
This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!
0
CarlGarcia
2025年4月28日 3:31:27 JST
AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!
0
PaulTaylor
2025年4月28日 0:12:58 JST
¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!
0
伝統的なテストを超えたAIの進化:経験学習の台頭
人工知能(AI)の分野では、生成AIを従来のベンチマーク、例えば多くのモデルがすでに超えているチューリングテストの枠を超えて推進しようとする動きが活発化しています。今、焦点はこれらのテストで高得点を出すために設計されたAIではなく、より動的なプロセスを通じて進化するAIの開発に移っています。
GoogleのDeepMindの研究者たち、例えばDavid SilverやRichard Suttonといった著名な人物は、彼らの論文経験の時代へようこその中で、新しいAIの能力を引き出す鍵はテストそのものではなく、AIの訓練方法にあると主張しています。彼らは、現在の静的なデータセットは大きな進歩を促すにはあまりにも限定的だと指摘しています。
彼らの解決策は? AIはより経験的に世界と関わり、相互作用から学び、環境からのフィードバックに基づいて目標を設定する必要があります。「経験学習の完全な可能性が活用されれば、驚くべき新しい能力が生まれるでしょう」と彼らは断言します。AlphaZeroでチェスや囲碁で人間を打ち負かしたことで知られるSilverと、強化学習の先駆者であるSuttonは、現在の大規模言語モデル(LLM)の限界を超えるための新しいアプローチ「ストリーム」を提案しています。
強化学習から生成AIへ:その変化とその結果
AlphaZeroやAlphaGoの成功後、AIコミュニティはChatGPTのような生成AIモデルへとシフトし、強化学習から大きく離れました。これによりAIは幅広い自発的な人間の入力を処理できるようになりましたが、強化学習がもたらしていた自己発見の側面を失いました。
SilverとSuttonによると、現在のLLMはプロンプト段階で人間の判断に大きく依存しており、その可能性を制限しています。「エージェントは人間の評価者が過小評価しているより良い戦略を発見することはできません」と彼らは説明します。さらに、プロンプトの短く断片的なやり取りでは、AIが単純な質疑応答を超えて発展することができません。
ストリームの導入:AI学習の新しいパラダイム
提案された「経験の時代」では、AIエージェントが人間が生涯を通じて学ぶように、連続的な相互作用の「ストリーム」の中で動作します。SilverとSuttonは、AIエージェントが長期的な経験のストリームを持ち、即時のタスクを超えた目標を追求できるようにすることを構想しています。
このアプローチは強化学習に基づいており、AIエージェントは世界のモデルと相互作用し、報酬の形でフィードバックを受け取ります。これらの報酬は、AIが異なるコンテキストでどの行動が価値あるかを学ぶのに役立ちます。研究者たちは、世界には経済指標から健康メトリクスまで、報酬として機能する豊富なシグナルがあると指摘しています。
長期目標を持つAIエージェントの構築
このプロセスを開始するために、AI開発者は「世界モデル」シミュレーションを使用し、AIが予測を行い、現実でテストし、結果に基づいてモデルを改良できるようにすることができます。AIが世界と継続的に相互作用するにつれて、その理解は進化し、新しいデータに適応し、エラーを修正します。
人間は、フィットネスの向上や新しい言語の学習など、広範な目標を設定する役割を依然として果たします。AIの報酬関数はこれらの目標に合わせて調整されます。この設定により、AIアシスタントは健康や教育を長期間にわたって追跡・助言したり、新しい素材の発見や二酸化炭素排出量の削減といった野心的な科学的目標を追求したりできるようになります。
AIの未来:推論を超えて経験学習へ
研究者たちは、長期的な経験学習が可能なAIエージェントは、GeminiやDeepSeekのR1のような現在の「推論」AIモデルを超える可能性があると信じています。彼らは、推論モデルはしばしば時代遅れの前提に縛られた人間の思考を模倣すると主張します。対照的に、経験エージェントは前例のない能力を引き出し、これまでに見たことのない未来をもたらす可能性があります。
しかし、このシフトには、雇用の喪失や長期間自律的に動作するAIエージェントを制御する課題などのリスクも伴います。一方で、適応性のあるAIは、フィードバックに基づいて行動を調整することで、人間への悪影響を軽減するよう学ぶことができます。
SilverとSuttonは、経験データが人間が生成したデータの規模と質をはるかに超え、人工汎用知能や超知能につながる可能性があると確信しています。このパラダイムシフトは、強化学習の進歩と結びつき、多くの領域で人間の能力を超える新しい能力を引き出す可能性があります。
Silverは最近のDeepMindポッドキャストでこれらのアイデアをさらに議論し、AIを経験の時代に移行させる可能性と課題を強調しました。



AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀




AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀




Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?




This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!




AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!




¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!












