AI 蠕蟲利用強化學習、神經網路發生新的威脅

首頁

新聞

2025-12-24

JimmyMoore

人工智慧領域發展迅速，新穎的應用不斷出現。本文將探討一個引人入勝的實驗：利用強化學習和神經網路來訓練虛擬蠕蟲在環境中移動並收集物件。我們將探討基本概念、訓練過程以及令人印象深刻的結果，展現人工智慧在意想不到領域的潛力。

重點

使用虛擬模擬進行 AI 訓練的介紹。

實施強化學習來控制移動。

利用神經網路引導蠕蟲運動。

循序漸進的訓練方法來提升 AI 能力。

人工智能中的生物模仿，從大腦結構中汲取靈感。

分析蠕蟲的速度和獎勵機制。

參考 Skillshare 作為學習 AI 和創意技能的平台。

瞭解 AI 訓練實驗室

歡迎來到 AI 訓練實驗室

AI 訓練實驗室是一個實驗中心，展示如何在模擬環境中開發與訓練 AI 代理。這些數位舞台可讓演算法和模型進行安全且經濟實惠的測試，不受現實世界的限制。過去的專案包括訓練拳擊 AI 和跑得比尤塞恩-博爾特 (Usain Bolt) 還要快的人類，突顯了此類系統的彈性和前景。

虛擬環境的設計是為了挑戰 AI 代理，迫使它們在重複嘗試中學習和適應。這個方法讓我們親身體驗人工智慧如何處理複雜的任務，例如移動和物件互動。

目前的專案將重點轉移到創造 AI 控制的蠕蟲。在神經網路的引導下，我們的目標是看看它是否能夠導航到一個區塊並將其擷取！

從拳擊 AI 到虛擬蠕蟲：重點轉移

本實驗室早期的工作以拳擊、類人運動和跑酷為中心，教導 AI 代理掌握類似人類的能力。這種演進突顯出人工智能可以解決的問題種類繁多。

改用虛擬蠕蟲作為 AI 代理是朝向獨特挑戰的有意之舉。相較於兩足或類人的形態，蠕蟲的移動涉及到獨特的協調與控制問題。這種改變提供了有用的洞察力，讓我們了解人工智能演算法的適應性與多樣性。

透過研究具有根本不同的身體規劃的生物，實驗室可以擴展其對人工智能如何建立智慧型、適應性系統的認識。基本上，這隻蠕蟲使用人工大腦移動和行動！

解剖神經網路

什麼是神經網路？

神經網路是一種計算模型，靈感來自於人腦的結構和運作。

它是由相互連結的節點或神經元所構成，並分層排列。這些層會處理和傳遞資訊，讓網路能從資料中學習，並做出決策。

神經網路模仿已知最複雜的物件：人腦。這是嘗試模擬某些東西如何解決問題並獲得意識，類似於大腦。我們的目標是在人工智能中複製這個過程！

神經網路透過反覆訓練來學習。輸入資料，並根據結果修改神經元之間的連接。這種反覆調整的方式可以讓網路隨著時間的推移提升效能，學習辨識模式、做出選擇，以及解決複雜的問題。

影片中的蠕蟲從單細胞生物開始，逐步接受神經網路的訓練。每一帧都记录了蠕虫的速度，并将其与目标速度进行比较；蠕虫的速度越接近，奖励就越大。

神經網路的內部運作

為了訓練神經網路，我們會餵它輸入資料，然後它會處理資料以產生輸出。中間部分或隱藏層負責處理這些輸入；網路越大，代表人工智慧的「智商」越高，可以執行更複雜的任務。

視訊賦予 AI 基本的自我意識。這是透過擷取每個身體區塊的位置、旋轉和速度，將這些資料組織成向量，並輸入神經網路來實現的。這讓 AI 對自己的身體有了意識，這是人類與生俱來的特質。

連線及其指定的權重對於網路的智慧非常重要。

更多的連線和精心調校的權重可以讓網路做出更細微、更精準的回應。訓練包括改進這些權重，讓網路從經驗中學習和改進。

神經網路類比：從單細胞生物到小鼠

視訊採用類比的方式來說明神經網路的規模與複雜性，將神經網路比作從單細胞生物（如副蟲）到小鼠的大腦。神經網路的任務是訓練蠕蟲成為「智慧」的蠕蟲！一開始，蠕蟲會隨意移動，只知道自己的身體部分和方向。

改進 AI 蠕蟲的步驟

使用可旋轉的關節

為了幫助蠕蟲移動，蠕蟲內建了七個可旋轉的關節，每個關節都由神經網路控制。這些關節對於促進和鼓勵運動非常重要。

強化學習獎勵蠕蟲

由於我們使用的是強化學習演算法，因此必須定義獎勵函數。這可讓我們獎勵蠕蟲的動作，並鼓勵理想的行為。每一格都會記錄蠕蟲身體的速度。這個速度會與目標速度比較；比較越接近，給予的獎勵就越高。

調整參數

為了優化運動性能，我們需要調整關鍵參數。藉由啟用關節阻尼和增加反應時間，我們可以讓演算法有顯著的優勢！

此外，提高 AI 的處理能力也很重要，以確保它能發揮最佳效能。

利用 Skillshare 的多元化學習平台釋放創意潛能

創意學習者免費試用優惠

文章指出，前 500 位使用說明中連結的使用者將可獲得 Skillshare 一個月的免費試用。這可讓您存取豐富的創意課程資料庫。

AI 藝術世代：穩定擴散 VS 中途轉換

優點

Stable Diffusion 提供完全的創作自由，沒有內容限制。

它可在您自己的硬體上進行本機私人操作。

擁有必要技術能力的使用者可免費使用。

缺點

AI 藝術創作的自由性並非人人都能享有。

它可能需要比您目前擁有的更強大的硬體。

Skillshare 的學習平台

AI 藝術創作課程

Skillshare 是提升 AI 美術製作技能的重要資源。它提供數以千計由業界專業人士教授的課程。該平台還提供精心設計的學習路徑，這些路徑是一連串的課程，旨在循序漸進地培養技能。

Skillshare 上的創意學習路徑

Skillshare 的無限可能

Skillshare 是絕佳的資源，因為無論您的興趣是電影、插畫、設計，甚至是 AI 與創新，都有適合每個人的相關內容。

常見問題

什麼是強化學習？

強化學習 (Reinforcement Learning) 是一種機器學習方法，其中代理程式透過與環境互動來學習如何做出決策。它會因其行為而獲得獎勵或懲罰，並改進其策略，以隨著時間的推移使總獎勵最大化。

神經網路如何用於 AI 訓練？

神經網路處理並傳輸資訊，讓 AI 代理能夠從資料中學習並進行預測。在這個專案中，神經網路控制虛擬蠕蟲的動作，讓它能夠導航和收集物件。

為什麼他們選擇研究蠕蟲？

與雙足或仿人機器人不同，蠕蟲的運動在協調和控制方面提出了獨特的挑戰。這種轉變為人工智能演算法的適應性和多樣性提供了寶貴的啟示。

為什麼他們要從免費的穩定擴散平台轉移到付費平台？

他們並沒有過渡到付費平台！Stable Diffusion 和 Midjourney 只是被比較而已，Midjourney 是一個封閉式的平台。Stable Diffusion 提供完全的創作自由，沒有嚴格的規則，而且可以在您的本地機器上執行！

當你給一個非常大的生物一個非常小的大腦時會發生什麼？

這正是我們的目標！透過這個訓練，我們想觀察當一個更複雜的實體的處理能力有限時會發生什麼。我們會看到有趣、不協調的動作，還是乾脆的失敗？

相關問題

模擬環境在 AI 訓練中扮演什麼角色？

模擬環境對於 AI 訓練非常重要。模擬環境提供了一個安全、受控且符合成本效益的實驗空間，讓研究人員可以在沒有現實世界風險與限制的情況下測試與改善演算法。模擬環境提供的主要優點如下受控條件：模擬可精確控制環境變數，有助於隔離和研究這些變數對 AI 行為的影響。可擴展性：模擬可輕鬆擴充，以創造複雜多變的訓練情境。安全性：模擬消除了與真實世界訓練相關的風險，例如設備損壞。資料產生：模擬可以產生大量訓練機器學習模型所需的標記資料。這些優勢讓模擬成為加速許多領域的 AI 發展不可或缺的工具。

AI 藝術創作有哪些道德考量？

AI 藝術創作涉及數項倫理考量，包括版權與所有權：決定誰擁有 AI 生成藝術的版權是一件複雜的事情，涉及到作者權和智慧財產權的問題。偏見與代表性：AI 模型會從現有資料中學習，這些資料可能包含社會偏見。這可能會導致藝術強化刻板印象或排斥某些族群。工作職缺：AI 藝術的成長會讓人擔心人類藝術家與設計師可能會失去工作。真實性與原創性：有些人認為 AI 產生的藝術缺乏人類創作的真實性與原創性。要解決這些問題，就必須仔細思考 AI 產生的藝術在法律、社會與經濟上的影響。

個人如何參與 AI 開發與訓練？

個人可以透過下列幾種途徑參與人工智慧的開發與訓練：線上課程與教學：Coursera、edX 和 Skillshare 等平台提供許多關於 AI 和機器學習的課程。開放原始碼專案：為開放原始碼 AI 專案貢獻心力是獲得實務經驗與合作的絕佳方式。Hackathons 與競賽：參加 AI hackathons 與競賽可讓您測試自己的技能，並從同儕身上學習。研究與學術界：攻讀電腦科學或相關領域的學位可為您打開人工智慧研究的大門。產業工作機會：許多公司正積極聘請 AI 開發人員和工程師，這是非常值得推薦的出路。

海爾推出全球最輕的 AI 運動外骨骼機器人，重量僅 1.75 公斤海爾集團推出全球最輕量的運動用人工智慧外骨骼機器人——海爾外骨骼機器人 W3。此次發布創下業界最輕量的新紀錄，標誌著在輕量化設計與智能人體動作增強領域取得重大突破。頂級材質成就超輕量設計W3採用創新的一體成型製造工藝，結合全碳纖維與鈦合金。這種航空級材質組合將總重量控制在僅1.75公斤，實現了輕量化與強度兼備的極致機械性能。為提升舒適度，機器人內置非牛頓流體材質，接觸皮膚時觸感柔軟，但在劇烈運動時

耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線，主演均由AI選角今日，耀科傳媒的AIGC奇幻懸疑短劇《秦嶺青銅秘事》正式上線。本劇由該公司首批簽約的兩位AI演員秦凌月與林西妍主演，故事背景設定在神秘莫測的秦嶺礦區。劇情追隨退休情報官秦月帶領團隊深入該區域，揭開一樁塵封已久的礦難，以及跨越兩代人的血祭真相——這份真相就隱藏在受限的地下區域，正是科學探索與古代巫術交匯之處。作為中國最早完全由AI數位人支持的電影之一，該劇在籌備階段便引發了業界熱烈討論，而關於其A

薩提亞·納德拉準備利用與OpenAI的新合作關係週三，一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉，修訂後的OpenAI合作關係將如何影響公司的財務狀況。納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係，並確保它能夠實現雙贏。只有這樣，雙方才能保持良好的合作伙伴關係。” 他強調，微軟仍然可以使用OpenAI的智慧財產權，包括其模型和智慧體產品，但不再需要為此向OpenAI支付費用。談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術，納德拉表示：“

相關專題推薦

商業

最佳 AI 支出追蹤工具：掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具：備受好評的解決方案，可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案，助您輕鬆管理報銷、精準追蹤財務，並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南，將協助您找到最合適的選擇。透過 XIX.AI 的專家精選，釋放您的 AI 優勢。

10 個工具

xix.ai

商業

最佳 AI 招聘工具：篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案，可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜，比較免費與付費選項。立即找到最適合您的招聘助手，並優化您的招聘流程！

10 個工具

xix.ai

生產率

AI 個人健康與專注力教練：管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具，助您管理倦怠感並提升精神能量。透過實際使用心得，比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具

xix.ai

聊天機器人

最受好評的 AI 浪漫聊天機器人：透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人，助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較，以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶，並開始建立這段關係吧。

10 個工具

xix.ai

教育與學習

最佳AI資料科學導師：精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師，幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單，獲得強大而具有變革性的指導。透過對比免費和付費選項，並結合實際應用案例進行了解，今天就開啟你的資料科學精通之路吧。

10 個工具

xix.ai

聊天機器人

最佳 AI 調情與對話訓練工具：即時提升社交魅力與自信

在 XIX.AI 探索 2026 年最頂尖的 AI 調情與對話訓練工具。我們精心挑選、評價最高的精選清單，能助您即時建立社交魅力與自信。探索這些必試且能徹底改變遊戲規則的工具，並透過免費與付費版本的比較，以及每週更新的排行榜，立即解鎖您的社交優勢。

10 個工具

xix.ai

評論 (1)

0/500

請登錄後再操作

PaulGonzalez

2026-03-10 00:01:19

Wow, das mit dem 'Wurm' finde ich gruselig und faszinierend zugleich! 🐛 Ich frage mich, ob solche KI-Agenten irgendwann zu wirklich bösartigen Cyber-Schädlingen weiterentwickelt werden könnten. Was meint ihr, wie könnte man gegensteuern? Die Sicherheit scheint immer einen Schritt hinterherzuhinken.

頭號新聞

AI Builder和Power Automate革新文件摘要 AI寄主Notebooklm播客現已上中國發布國家級人形機器人與具身智能標準 Ramp 數據顯示，企業對 AI 的採納已進入停滯期 Bing圖像創作者教程：AI藝術生成指南學習使用您的聲音創建AI音樂：逐步Suno教程 iMyFone MagicMic：實時AI變聲器評測與教程 2025頂級AI影片生成器：Pika Labs與其他對比 DeepSeek V4 崛起為多模態人工智慧的變革者 Embodied Intelligence 公布首項業界標準，以遏止無序擴張

精選