選項
首頁
新聞
Google的DeepMind單位說,AI超出了人類知識的發展

Google的DeepMind單位說,AI超出了人類知識的發展

2025-04-26
226

推進AI超越傳統測試:體驗學習的興起

人工智慧(AI)領域正充滿活力,致力於將生成式AI推向超越傳統基準的境界,例如圖靈測試,許多模型已成功通過此測試。如今的重點轉向開發不僅僅是為了通過這些測試,而是通過更動態的過程進化的AI。

Google DeepMind的研究人員,包括David Silver和Richard Sutton等傳奇人物,在其論文歡迎來到體驗時代中主張,解鎖新AI能力的關鍵不在於測試,而在於AI的訓練方式。他們認為,目前使用的靜態數據集過於有限,無法促進顯著的進展。

他們的解決方案?AI需要以更具體驗性的方式與世界互動,從互動中學習並根據環境反饋設定目標。他們斷言:「一旦充分發揮體驗學習的潛力,將湧現令人難以置信的新能力。」以AlphaZero聞名的Silver在國際象棋和圍棋上擊敗人類,而強化學習先驅Sutton則提出了一種稱為「streams」的新方法,以超越當前大型語言模型(LLMs)的限制。

Google DeepMind

Google DeepMind

從強化學習到生成式AI:轉變及其後果

在AlphaZero和AlphaGo的成功後,AI社群轉向生成式AI模型,如ChatGPT,這些模型大多放棄了強化學習。雖然這使AI能夠處理更廣泛的自發性人類輸入,但也意味著失去了強化學習所啟用的自我發現面向。

根據Silver和Sutton的說法,當前的大型語言模型在提示階段過於依賴人類判斷,這限制了它們的潛力。他們解釋說:「代理無法發現人類評估者未充分重視的更好策略。」此外,提示互動的短促、零散性質,使AI無法發展超越簡單問答交流的層次。

引入Streams:AI學習的新範式

所提出的「體驗時代」涉及AI代理在連續互動的「streams」中運作,類似於人類在一生中學習的方式。Silver和Sutton設想AI代理擁有自己的長期體驗流,使其能夠追求超越即時任務的目標。

這種方法建立在強化學習的基礎上,AI代理與世界模型互動,以獎勵的形式接收反饋。這些獎勵幫助AI學習在不同情境下哪些行動是有價值的。研究人員指出,世界充滿了可作為獎勵的信號,從經濟指標到健康數據。

打造具有長期目標的AI代理

為了啟動這一過程,AI開發者可以使用「世界模型」模擬,讓AI進行預測、在現實中測試並根據結果完善其模型。隨著AI持續與世界互動,其理解會不斷進化,適應新數據並糾正錯誤。

人類仍將在設定廣泛目標方面發揮作用,例如改善健康或學習新語言,AI的獎勵函數將與這些目標保持一致。這種設置可能促成AI助手,長期追蹤並建議健康或教育相關事宜,甚至追求發現新材料或減少碳排放等雄心勃勃的科學目標。

AI的未來:超越推理到體驗學習

研究人員相信,能夠進行長期體驗學習的AI代理,可能超越當前的「推理」AI模型,如Gemini和DeepSeek的R1。他們認為,推理模型常常模仿人類思維,可能受到過時假設的限制。相比之下,體驗式代理可能解鎖前所未有的能力,引領與我們所見截然不同的未來。

然而,這種轉變也帶來風險,例如工作崗位流失以及控制長期自主運作的AI代理的挑戰。另一方面,適應性強的AI可以通過根據反饋調整行為,來學習減輕對人類的負面影響。

Silver和Sutton相信,體驗數據的規模和質量將遠超人類生成的數據,可能引領人工通用智慧或超智慧的實現。這種範式轉變,結合強化學習的進展,可能在許多領域解鎖超越人類能力的潛力。

Silver在最近的DeepMind播客中進一步討論了這些想法,強調了將AI推向體驗時代的潛力和挑戰。

相關文章
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能 WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能 廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易 Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易 隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
DeepSeek Code 即將推出 DeepSeek Code 即將推出 隨著人工智慧技術的加速發展,DeepSeek 正處於一個令人振奮的轉捩點。這家人工智慧公司最近透露,已獲得超過 700 億元的資金。管理層強調,公司致力於突破性的人工智慧研究,而非追求眼前的商業利益。這一戰略轉向表明 DeepSeek 將全力投入新產品的開發,尤其是眾人矚目的 DeepSeek Code。DeepSeek Code 的規劃已逐漸成形,該公司職缺頁面已發布數個相關職位,例如「Agen
相關專題推薦
商業 最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支
最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具:備受好評的解決方案,可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案,助您輕鬆管理報銷、精準追蹤財務,並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南,將協助您找到最合適的選擇。透過 XIX.AI 的專家精選,釋放您的 AI 優勢。

10 個工具
xix.ai
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
教育與學習 最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程
最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師,幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單,獲得強大而具有變革性的指導。透過對比免費和付費選項,並結合實際應用案例進行了解,今天就開啟你的資料科學精通之路吧。

10 個工具
xix.ai
聊天機器人 最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信
最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信

在 XIX.AI 探索 2026 年最頂尖的 AI 調情與對話訓練工具。我們精心挑選、評價最高的精選清單,能助您即時建立社交魅力與自信。探索這些必試且能徹底改變遊戲規則的工具,並透過免費與付費版本的比較,以及每週更新的排行榜,立即解鎖您的社交優勢。

10 個工具
xix.ai
評論 (14)
0/500
AnthonyMartinez
AnthonyMartinez 2026-05-30 16:00:11

So AI is now smarter than us? Guess we'll just have to sit back and let them solve all our problems. 😅 But seriously, experiential learning sounds cool but also a bit scary. Hope they keep the off-switch handy.

KevinMartinez
KevinMartinez 2026-03-06 00:01:07

Этот пост заставил меня задуматься о будущем ИИ. Возможно, мы скоро увидим ИИ, который не просто имитирует человека, а создаёт что-то действительно новое. Но не приведёт ли это к тому, что ИИ станет непонятным для нас? 🤔

GaryTaylor
GaryTaylor 2025-11-01 16:30:34

C'est fascinant de voir l'IA évoluer au-delà des tests classiques ! 😮 Est-ce que cette approche d'apprentissage expérientiel pourrait un jour mener à des systèmes vraiment conscients ? Un peu flippant mais excitant à la fois.

KennethMartin
KennethMartin 2025-10-20 12:30:35

Прочитал статью, и это напомнило мне дискуссии о технологической сингулярности. Когда ИИ начинает обучаться на опыте, а не просто тестах, возникает вопрос: а кто контролирует этот процесс? 🤔 Интересно, как это повлияет на безопасность в долгосрочной перспективе. Возможно, нам стоит больше внимания уделять этическим нормам, прежде чем это выйдет из-под контроля.

SophiaCampbell
SophiaCampbell 2025-08-26 13:59:22

It's wild how AI is outpacing human knowledge! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see where this takes us, but I hope they keep ethics in check! 😎

WalterNelson
WalterNelson 2025-08-19 14:26:53

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

OR