Google 在 Gemini 2.5 Flash 中啟用使用者控制 AI 推理功能

首頁

新聞

2025-12-30

JoeLewis

# ai # Google

Google 已為其 Gemini 2.5 Flash 模型實作 AI 推理控制功能，讓開發人員有能力設定系統用於解決問題的處理能力上限。

這項「思考預算」於 4 月 17 日推出，可解決日益嚴重的產業問題：精密的 AI 模型經常會過度思考簡單的問題，造成計算資源浪費，並增加營運與環境費用。

儘管這項發展並非突破性，但它標誌著解決效率問題的實際行動，而這些問題是隨著推理功能成為商用 AI 系統的標準而出現的。

新的控制功能可讓開發人員在模型回應之前精確調整處理資源，有可能改變組織如何處理 AI 使用對財務與環境的影響。

"Gemini 產品管理總監 Tulsee Doshi 承認：「模型思考過度。「對於基本的提示，模型思考得比必要的還要多」。

這一承認突顯了先進推理模型所面臨的困境 - 實際上是用大錘來敲碎螺帽。

邁向推理能力的進程帶來了意想不到的缺點。傳統的大型語言模型大多數依賴訓練資料中的匹配模式，而較新的版本則嘗試有條理地解決問題。這種循序漸進的邏輯方法可以為複雜的任務帶來更好的結果，但對於較簡單的請求則會造成嚴重的低效率。

平衡成本與效能

不受控制的 AI 推理所造成的財務影響相當大。Google 的技術說明指出，當啟用完整推理時，產生輸出的成本會比標準處理高出約六倍。成本的增加創造了精確控制的強大動機。

Nathan Habib 是 Hugging Face 研究推理模型的工程師，他稱這是一個普遍的產業問題。"他對《麻省理工科技評論》說：「在展示更聰明人工智能的競賽中，公司把推理模型當成萬能工具來使用，即使它們是不必要的。

這種浪費不只是假設性的。Habib 展示了一個頂級推理模型在嘗試解決有機化學問題時，如何陷入重複循環，說了幾百次「等等，但是...」--基本上是在消耗處理能力的同時，遭遇計算崩潰。

在 DeepMind 評估 Gemini 模型的 Kate Olszewska 證實，Google 的系統有時也會面臨類似的問題，陷入使用運算資源卻無法改善答案品質的循環。

細緻的控制機制

Google 的 AI 推理控制為開發人員提供了精確的調整能力。該系統提供了一個靈活的規模，從零（最小推理）到 24,576 代幣的「思考預算」- 代表模型內部處理的計算單位。這種詳細的方法可以根據特定需求進行客製化執行。

DeepMind 的首席研究科學家 Jack Rae 指出，要確定理想的推理程度仍然很困難：「要為任何特定任務定義完美的思考量，真的很有挑戰性」。

開發理念的轉變

人工智能推理控制的引入可能预示着人工智能进步方式的改变。自 2019 年以來，各家公司都是通過創建擁有更多參數和訓練數據的大型模型來追求改進。谷歌的策略表明了一個不同的方向，即效率優先於純粹的規模。

Habib 認為，「規模擴展定律正在被取代，」這表明未來的進步可能來自於完善推理過程，而不是無止境地擴大模型規模。

環境後果同樣重要。隨著推理模型越來越普遍，其能源使用量也相對增加。研究顯示，推理-產生 AI 回應-現在對技術碳足跡的貢獻比初始訓練階段更大。Google 的推理控制為這個令人憂慮的趨勢提供了可能的解決方案。

競爭動力

Google 並非在真空中工作。今年初出現的「開放權重」DeepSeek R1 模型，以潛在的較低成本展現出強大的推理能力，引起市場不穩定，據說導致近萬億美元的股市波動。

與 Google 的專屬方法不同，DeepSeek 公開其內部配置，供開發人員在本機執行。

儘管有競爭，Google DeepMind 的首席技術長 Koray Kavukcuoglu 認為，在需要極高準確度的專業領域，專屬模型仍將保持優勢：「編碼、數學和金融等領域，都希望模型能夠高度準確、精準，並能理解非常複雜的情境。」

產業成熟跡象

AI 推理控制的創造反映出產業目前面臨超越技術測量的實際限制。在各家公司不斷推進推理能力的同時，Google 的做法也意識到了一個重要的現實：在商業應用中，效率與原始性能同樣重要。

這項功能也突顯出技術進步與永續性考量之間的緊張關係。推理模型的效能追蹤顯示，個別任務的完成成本可能超過 200 美元，這引起了人們對於在現實世界環境中大規模實施此類功能的疑慮。

Google 讓開發人員能夠根據實際需求調整推理等級，從而解決人工智能部署的經濟與環境問題。

"推理是建立智慧的基本能力，」Kavukcuoglu 表示。「當模型開始思考的那一刻，它的機構就出現了」。這句話同時捕捉到推理模型的潛力與難度--它們的獨立性既創造了可能性，也帶來了資源管理上的挑戰。

對於實施 AI 解決方案的組織而言，微調推理預算的能力可讓進階功能更容易使用，同時維持營運效率。

Google 表示，Gemini 2.5 Flash 可達到「與其他領先模型相媲美的效能，但成本和大小卻只是其一小部分」- 這項價值主張可藉由針對特定用途最佳化推理資源的能力而提升。

實際意義

AI 推理控制功能具有直接的實際用途。建立商業應用程式的開發人員，現在可以有意識地在處理深度與作業費用之間做出選擇。

對於簡單的應用程式 (例如基本的客戶查詢)，最小推理設定可節省資源，同時仍可發揮模型的功能。對於需要深入理解的複雜分析，則仍可使用完整的推理能力。

Google 的推理「刻度盤」提供了一種方法，可在維持效能標準的同時，達到成本的可預測性。

另請參閱：Gemini 2.5：Google 打造迄今「最智慧」的 AI 模型

想要向業界領導者瞭解更多關於 AI 和大資料的資訊嗎？看看在阿姆斯特丹、加州和倫敦舉行的 AI & Big Data Expo。該綜合活動與其他領先活動同地舉行，包括智慧自動化會議 (Intelligent Automation Conference)、BlockX、數位轉型週 (Digital Transformation Week)，以及網路安全與雲端博覽會 (Cyber Security & Cloud Expo)。

在此探索 TechForge 提供的其他即將舉行的企業技術活動和網路研討會。

WordPress.com 現已允許 AI 代理程式撰寫並發布文章，還有更多功能廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布，將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容，同時也能管理留言、更新與修正元資料，並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制，網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能，網站幾乎可以完全由人工指導的 AI 代理

Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖 Kakao Mobility 計畫內部開發第 4 級自動駕駛技術，作為其實體人工智慧策略的一環。在首爾COEX舉行的2026年世界資訊科技展（World IT Show）會議上，Kakao Mobility副總裁兼實體AI部門負責人金鎮奎（Kim Jin-kyu）發表了該發展藍圖。他的演講聚焦於實體AI時代以移動平台為核心的自動駕駛服務。據韓聯社報導，這場名為「超越構想，付諸行動：AI 推動現

Google 在印度的 Chrome 瀏覽器中推出 Gemini 週三，Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區，包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini，藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊，以及比較不同分頁的內容。隨著此次擴展，Gemini 除英語及近期新增的 Chrome 支援語言外，亦將

相關專題推薦

漫畫創作