Google的DeepMind單位說,AI超出了人類知識的發展
推進AI超越傳統測試:體驗學習的興起
人工智慧(AI)領域正充滿活力,致力於將生成式AI推向超越傳統基準的境界,例如圖靈測試,許多模型已成功通過此測試。如今的重點轉向開發不僅僅是為了通過這些測試,而是通過更動態的過程進化的AI。
Google DeepMind的研究人員,包括David Silver和Richard Sutton等傳奇人物,在其論文歡迎來到體驗時代中主張,解鎖新AI能力的關鍵不在於測試,而在於AI的訓練方式。他們認為,目前使用的靜態數據集過於有限,無法促進顯著的進展。
他們的解決方案?AI需要以更具體驗性的方式與世界互動,從互動中學習並根據環境反饋設定目標。他們斷言:「一旦充分發揮體驗學習的潛力,將湧現令人難以置信的新能力。」以AlphaZero聞名的Silver在國際象棋和圍棋上擊敗人類,而強化學習先驅Sutton則提出了一種稱為「streams」的新方法,以超越當前大型語言模型(LLMs)的限制。

Google DeepMind 從強化學習到生成式AI:轉變及其後果
在AlphaZero和AlphaGo的成功後,AI社群轉向生成式AI模型,如ChatGPT,這些模型大多放棄了強化學習。雖然這使AI能夠處理更廣泛的自發性人類輸入,但也意味著失去了強化學習所啟用的自我發現面向。
根據Silver和Sutton的說法,當前的大型語言模型在提示階段過於依賴人類判斷,這限制了它們的潛力。他們解釋說:「代理無法發現人類評估者未充分重視的更好策略。」此外,提示互動的短促、零散性質,使AI無法發展超越簡單問答交流的層次。
引入Streams:AI學習的新範式
所提出的「體驗時代」涉及AI代理在連續互動的「streams」中運作,類似於人類在一生中學習的方式。Silver和Sutton設想AI代理擁有自己的長期體驗流,使其能夠追求超越即時任務的目標。
這種方法建立在強化學習的基礎上,AI代理與世界模型互動,以獎勵的形式接收反饋。這些獎勵幫助AI學習在不同情境下哪些行動是有價值的。研究人員指出,世界充滿了可作為獎勵的信號,從經濟指標到健康數據。
打造具有長期目標的AI代理
為了啟動這一過程,AI開發者可以使用「世界模型」模擬,讓AI進行預測、在現實中測試並根據結果完善其模型。隨著AI持續與世界互動,其理解會不斷進化,適應新數據並糾正錯誤。
人類仍將在設定廣泛目標方面發揮作用,例如改善健康或學習新語言,AI的獎勵函數將與這些目標保持一致。這種設置可能促成AI助手,長期追蹤並建議健康或教育相關事宜,甚至追求發現新材料或減少碳排放等雄心勃勃的科學目標。
AI的未來:超越推理到體驗學習
研究人員相信,能夠進行長期體驗學習的AI代理,可能超越當前的「推理」AI模型,如Gemini和DeepSeek的R1。他們認為,推理模型常常模仿人類思維,可能受到過時假設的限制。相比之下,體驗式代理可能解鎖前所未有的能力,引領與我們所見截然不同的未來。
然而,這種轉變也帶來風險,例如工作崗位流失以及控制長期自主運作的AI代理的挑戰。另一方面,適應性強的AI可以通過根據反饋調整行為,來學習減輕對人類的負面影響。
Silver和Sutton相信,體驗數據的規模和質量將遠超人類生成的數據,可能引領人工通用智慧或超智慧的實現。這種範式轉變,結合強化學習的進展,可能在許多領域解鎖超越人類能力的潛力。
Silver在最近的DeepMind播客中進一步討論了這些想法,強調了將AI推向體驗時代的潛力和挑戰。
相關文章
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具
Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
DeepMind的AI在2025年數學奧林匹克奪金
DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。國際數學奧林匹克的重要性自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽
AI驅動的視差製作工具:打造動態2.5D動畫
將靜態圖像轉化為引人入勝的2.5D動畫,使用Parallax Maker。此開源工具賦予藝術家和遊戲開發者為其作品注入深度與動態的能力。透過利用Stability AI API,Parallax Maker確保即使在普通硬體上也能實現流暢的工作流程。探索此工具的功能以及如何提升您的創意項目。主要亮點Parallax Maker是一個用於製作2.5D動畫的開源解決方案。它將圖像轉化為與Blender
評論 (9)
0/200
WalterNelson
2025-08-19 14:26:53
AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀
0
ScottWalker
2025-08-15 23:00:59
AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀
0
AlbertGarcía
2025-08-08 10:00:59
Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?
0
FrankSanchez
2025-07-28 09:20:02
This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!
0
CarlGarcia
2025-04-28 02:31:27
AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!
0
PaulTaylor
2025-04-27 23:12:58
¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!
0
推進AI超越傳統測試:體驗學習的興起
人工智慧(AI)領域正充滿活力,致力於將生成式AI推向超越傳統基準的境界,例如圖靈測試,許多模型已成功通過此測試。如今的重點轉向開發不僅僅是為了通過這些測試,而是通過更動態的過程進化的AI。
Google DeepMind的研究人員,包括David Silver和Richard Sutton等傳奇人物,在其論文歡迎來到體驗時代中主張,解鎖新AI能力的關鍵不在於測試,而在於AI的訓練方式。他們認為,目前使用的靜態數據集過於有限,無法促進顯著的進展。
他們的解決方案?AI需要以更具體驗性的方式與世界互動,從互動中學習並根據環境反饋設定目標。他們斷言:「一旦充分發揮體驗學習的潛力,將湧現令人難以置信的新能力。」以AlphaZero聞名的Silver在國際象棋和圍棋上擊敗人類,而強化學習先驅Sutton則提出了一種稱為「streams」的新方法,以超越當前大型語言模型(LLMs)的限制。
從強化學習到生成式AI:轉變及其後果
在AlphaZero和AlphaGo的成功後,AI社群轉向生成式AI模型,如ChatGPT,這些模型大多放棄了強化學習。雖然這使AI能夠處理更廣泛的自發性人類輸入,但也意味著失去了強化學習所啟用的自我發現面向。
根據Silver和Sutton的說法,當前的大型語言模型在提示階段過於依賴人類判斷,這限制了它們的潛力。他們解釋說:「代理無法發現人類評估者未充分重視的更好策略。」此外,提示互動的短促、零散性質,使AI無法發展超越簡單問答交流的層次。
引入Streams:AI學習的新範式
所提出的「體驗時代」涉及AI代理在連續互動的「streams」中運作,類似於人類在一生中學習的方式。Silver和Sutton設想AI代理擁有自己的長期體驗流,使其能夠追求超越即時任務的目標。
這種方法建立在強化學習的基礎上,AI代理與世界模型互動,以獎勵的形式接收反饋。這些獎勵幫助AI學習在不同情境下哪些行動是有價值的。研究人員指出,世界充滿了可作為獎勵的信號,從經濟指標到健康數據。
打造具有長期目標的AI代理
為了啟動這一過程,AI開發者可以使用「世界模型」模擬,讓AI進行預測、在現實中測試並根據結果完善其模型。隨著AI持續與世界互動,其理解會不斷進化,適應新數據並糾正錯誤。
人類仍將在設定廣泛目標方面發揮作用,例如改善健康或學習新語言,AI的獎勵函數將與這些目標保持一致。這種設置可能促成AI助手,長期追蹤並建議健康或教育相關事宜,甚至追求發現新材料或減少碳排放等雄心勃勃的科學目標。
AI的未來:超越推理到體驗學習
研究人員相信,能夠進行長期體驗學習的AI代理,可能超越當前的「推理」AI模型,如Gemini和DeepSeek的R1。他們認為,推理模型常常模仿人類思維,可能受到過時假設的限制。相比之下,體驗式代理可能解鎖前所未有的能力,引領與我們所見截然不同的未來。
然而,這種轉變也帶來風險,例如工作崗位流失以及控制長期自主運作的AI代理的挑戰。另一方面,適應性強的AI可以通過根據反饋調整行為,來學習減輕對人類的負面影響。
Silver和Sutton相信,體驗數據的規模和質量將遠超人類生成的數據,可能引領人工通用智慧或超智慧的實現。這種範式轉變,結合強化學習的進展,可能在許多領域解鎖超越人類能力的潛力。
Silver在最近的DeepMind播客中進一步討論了這些想法,強調了將AI推向體驗時代的潛力和挑戰。



AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀




AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀




Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?




This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!




AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!




¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!












