選項
首頁
新聞
研究主管呼籲科技界追蹤人工智慧推理過程

研究主管呼籲科技界追蹤人工智慧推理過程

2025-11-17
53

研究主管呼籲科技界追蹤人工智慧推理過程

來自 OpenAI、Google DeepMind、Anthropic 以及眾多公司和非營利組織的 AI 研究人員,在週二發表的一份立場書中,主張深入探索監控 AI 推理模型的所謂思考過程。

人工智能推理模型(如 OpenAI 的 o3 和 DeepSeek 的 R1)的一個特點是使用思維鏈(或稱 CoT),這是一個外部化過程,人工智能模型在此過程中系統性地解決問題,就像人類使用刮紙解決複雜的數學方程式一樣。推理模型是驅動 AI 代理的基本要素,本文作者認為,監控 CoT 可能會成為一種重要的方法,讓能力越來越強、範圍越來越廣的 AI 代理受到控制。

"研究人員在論文中指出:「CoT 監控為尖端 AI 的安全規範提供了寶貴的強化,提供了一扇獨特的窗戶,讓人得以瞭解 AI 代理如何做出決策。"然而,我們無法確定這種能見度是否會持續下去。我們敦促研究界和前沿 AI 開發人員最大限度地發揮 CoT 可監控性的優勢,並研究如何保護它。"

這份立場書敦促領先的 AI 開發人員調查是什麼讓 CoT 具備「可監控性」--具體來說,是哪些因素增強或減弱了 AI 模型如何真正產生答案的透明度。作者指出,雖然 CoT 監控是了解 AI 推理模型的一個很有前途的方法,但它仍然很脆弱,他們提醒不要做任何可能降低其透明度或可靠性的改變。

此外,作者還呼籲 AI 開發人員持續追蹤 CoT 可監控性,並探討如何最終將此方法實作為安全措施。

這份論文的主要簽署人包括 OpenAI 的首席研究官 Mark Chen、Safe Superintelligence 執行長 Ilya Sutskever、諾貝爾獎得主 Geoffrey Hinton、Google DeepMind 共同創辦人 Shane Legg、xAI 安全顧問 Dan Hendrycks,以及 Thinking Machines 共同創辦人 John Schulman。主要作者包括來自英國人工智慧安全研究所 (UK AI Security Institute) 和阿波羅研究中心 (Apollo Research) 的代表,以及來自 METR、亞馬遜 (Amazon)、Meta 和加州大學柏克萊分校 (UC Berkeley) 的其他署名者。

這份論文代表許多人工智慧產業的頂尖領導者為加速人工智慧安全研究的共同努力。目前科技公司之間競爭激烈,促使 Meta 以數百萬美元的條件,從 OpenAI、Google DeepMind 和 Anthropic 招募頂尖研究人員。其中最炙手可熱的研究人員是那些專門研究 AI 代理和推理模型的研究人員。

Techcrunch 活動

現在直播!TechCrunch 所有階段

更聰明地建立。擴充更快。更深入地聯繫。與來自 Precursor Ventures、NEA、Index Ventures、Underscore VC 等的創新者一起,參與充滿實用策略、沉浸式研討會和有意義的人際網路的一天。

TechCrunch All Stage 入場證可節省 450 美元

更聰明地建立。更快擴張。深入聯繫。與來自 Precursor Ventures、NEA、Index Ventures、Underscore VC 等公司的創新者一起,參與充滿實用策略、沉浸式研討會和有意義的人際網路的一天。

馬薩諸塞州波士頓7月15日立即報名

"我們正處於一個關鍵時刻,我們擁有這種新的連鎖思考能力。它看起來非常有用,但如果不受到重點關注,它可能在幾年內就會消失,」參與論文的 OpenAI 研究員 Bowen Baker 在接受 TechCrunch 訪問時表示。「在我看来,发布这样一份立场文件是一种在为时已晚之前推动更多研究和关注这一主题的方式。」

OpenAI 在 2024 年 9 月首次發布了其初始 AI 推理模型 o1 的預覽。在之後的幾個月中,科技產業迅速推出了具有類似能力的競爭模型,其中一些來自 Google DeepMind、xAI 和 Anthropic 的模型展示了更先進的基準性能。

儘管如此,人們對於 AI 推理模型如何運作的瞭解仍然有限。雖然 AI 實驗室過去一年來在提升 AI 效能方面已取得重大進展,但這不一定會讓人們對其決策過程有更清楚的了解。

Anthropic 一直是瞭解 AI 模型如何運作的先驅 - 這個領域被稱為可解讀性(interpretability)。今年年初,首席執行官 Dario Amodei 承諾在 2027 年前揭開 AI 模型的「黑箱」,並增加對可解釋性的投資。他還鼓勵 OpenAI 和 Google DeepMind 進一步研究這個領域。

Anthropic 的早期研究顯示,CoTs 可能並非這些模型如何產生答案的完全可靠指標。與此同時,OpenAI 的研究人員也表示,CoT 監控最終可能成為追蹤 AI 模型一致性與安全性的可靠方法。

像這樣的立場書,目的在於提高人們對 CoT 監控等新興研究領域的認知,並吸引更多人的注意。OpenAI、Google DeepMind 和 Anthropic 等公司已經在這個領域進行研究,但這份出版物可能有助於刺激更多的資金和調查。

相關文章
OpenAI 收購人工智慧個人理財新創公司 Hiro OpenAI 收購人工智慧個人理財新創公司 Hiro OpenAI 已收購個人理財新創公司 Hiro Finance,創辦人伊森·布洛克(Ethan Bloch)於週一宣布此消息,OpenAI 也向 TechCrunch 證實了這筆交易。這家新創公司曾獲得頂尖金融科技創投公司 Ribbit,以及 General Catalyst 和 Restive 的投資。收購條款未予披露,且 Hiro 從未透露其募資金額。鑑於 Hiro 已宣布將於 4 月 20
薩提亞·納德拉準備利用與OpenAI的新合作關係 薩提亞·納德拉準備利用與OpenAI的新合作關係 週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖 OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖 當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
相關專題推薦
聊天機器人 利用這些角色扮演工具,打造屬於你的 AI 愛情故事
利用這些角色扮演工具,打造屬於你的 AI 愛情故事

探索 2026 年最新、評價最高的 AI 角色扮演工具,打造身臨其境的敘事體驗。XIX.AI 精心整理的清單收錄了多款功能強大、能徹底改變遊戲規則的助手,助您釋放創意敘事潛能並增添情感深度。透過實際測試,比較免費與付費選項的差異。立即展開您的獨特旅程。

10 個工具
xix.ai
文字轉語音 獨立遊戲開發者必備的頂尖 AI 配音工具:為 RPG 與視覺小說節省配音時間
獨立遊戲開發者必備的頂尖 AI 配音工具:為 RPG 與視覺小說節省配音時間

探索 2026 年最適合遊戲開發者的 AI 配音工具!XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲開發模式的解決方案,助您在角色扮演遊戲(RPG)和視覺小說(Visual Novel)的配音製作上節省時間與成本。探索免費與付費版本的比較、實際測試結果,以及每週更新的排行榜。立即找到最適合您的配音工具!

10 個工具
xix.ai
教育與學習 最佳人工智慧間隔重複學習工具:幫助醫學生和法律專業學生最佳化學習計劃
最佳人工智慧間隔重複學習工具:幫助醫學生和法律專業學生最佳化學習計劃

探索由 XIX.AI 精心挑選的 2026 年最佳 AI 間隔重複學習工具。我們推薦的這些極具創新性的工具能幫助醫學和法律專業的學生最佳化學習計劃,從而提高知識記憶效果。透過真實案例測試和每週更新的排名資訊,你可以瞭解免費選項與付費選項之間的差異。現在就開啟你的學習優勢吧!

10 個工具
xix.ai
視頻創作 最適合劇本創作與視覺敘事的 AI 文字轉影片平台
最適合劇本創作與視覺敘事的 AI 文字轉影片平台

2026 年最新最佳 AI 文字轉影片平台:頂級劇本撰寫與視覺敘事工具。探索強大且顛覆傳統的解決方案,將您的文字轉化為引人入勝的影片。透過我們每週更新的排行榜與實際測試,比較免費與付費選項。找到最適合您的平台,提升創造力與生產力。立即探索 XIX.AI 精選推薦。

10 個工具
xix.ai
聊天機器人 AI多智慧體編排器:透過自然語言設計複雜的自動化工作流程
AI多智慧體編排器:透過自然語言設計複雜的自動化工作流程

2026最新資訊:探索最優秀的人工智慧多智慧體協調工具,透過自然語言設計複雜的自動化工作流程。我們精心挑選的列表中包含了評分最高、功能強大的平臺,這些平臺能夠實現無縫的任務自動化和智慧化的流程管理。對比免費與付費選項,並瞭解實際應用中的效果。藉助XIX.AI每週更新的專家排名,讓你在人工智慧領域取得領先優勢。

10 個工具
xix.ai
圖像編輯 最佳AI降噪軟體:消除低光夜間攝影中的顆粒感和偽影
最佳AI降噪軟體:消除低光夜間攝影中的顆粒感和偽影

探索2026年最適合低光夜間攝影的AI降噪軟體。我們精心挑選了最受歡迎的免費及付費工具,透過實際測試並每週更新排名來進行對比。輕鬆去除影象中的顆粒感與瑕疵,在XIX.AI上釋放你的AI潛力。

10 個工具
xix.ai
評論 (1)
0/500
KevinPerez
KevinPerez 2026-02-28 10:00:44

Interesting! Making AI's 'thoughts' transparent could help build trust, but who gets to decide what's considered a 'reasonable' reasoning process? Feels like a crucial step, though the implementation details will be the real challenge. Hope it leads to practical tools, not just more guidelines. 🤔

OR