選項
首頁
新聞
Anthropic 推出具備專門模型角色的 AI 顧問工具

Anthropic 推出具備專門模型角色的 AI 顧問工具

2026-04-27
57

Anthropic 已正式在 Claude 平台 API 中推出「顧問工具」(Advisor Tool),向開發者介紹一種嶄新的混合智能模型。在此架構下,一個成本更低且運算速度更快的模型負責處理大部分工作負載,僅在面臨複雜決策時,才會自動諮詢最強大的模型以獲取策略建議。此設計從根本上重新思考了傳統代理(Agent)開發中「大模型規劃、小模型執行」的模式,提供了一種真正兼具成本效益與性能的解決方案。

創新機制:小模型執行,大模型諮詢

此新功能將Claude Sonnet 或 Haiku定位為「執行者」,負責呼叫工具、處理任務及整合結果。執行者僅在遇到無法獨立解決的難題時,才會將當前語境傳遞給Claude Opus以獲取建議。

Opus 會提供高階解決方案、方向修正或策略指引,隨後立即將控制權交還給執行者。關鍵在於,Opus不會直接呼叫工具或向使用者輸出最終結果,而是扮演一個隱形的「策略家」。這種倒置設計確保了絕大部分的代幣消耗發生在成本較低的模型上,並將高端運算能力保留給關鍵時刻。

image.png

效能與成本:測試中的雙贏局面

官方測試數據顯示顯著效益:

Sonnet 搭配 Opus Advisor的組合,在多語言 SWE-bench 測試中較單獨使用 Sonnet提升了 2.7 個百分點,同時每項任務的整體成本降低了11.9%。

Haiku 搭配 Opus Advisor的組合則展現出更為驚人的成果。其在 BrowseComp 測試中的得分從 19.7% 躍升至41.2%,效能實質上翻了一倍。雖然其表現仍比 Sonnet 單獨運作時低約 29%,但成本僅為 Sonnet 的15%,使其成為高並發、批次處理且對錯誤容忍度較高的情境下的理想選擇。

這些結果證明,透過智慧導向關鍵決策,開發人員得以擺脫「Opus 成本過高,不適合全時使用」與「單獨使用 Sonnet 效能不足」之間的兩難抉擇。

操作簡便:僅需一行設定即可啟用

開發人員只需在 Messages API 的 tools 陣列中新增類型為advisor_20260301的工具定義,即可啟用此功能。模型切換與上下文傳遞等複雜操作,皆會於單一 API 請求中自動處理,無需手動協調多次呼叫或管理額外上下文。

透過max_uses參數,可靈活控制每次請求中顧問諮詢的最大次數。在計費方面,執行器與顧問的代幣使用量將分別計費,確保透明度與控制權。目前此功能處於Beta 階段,使用時需在請求標頭中加入 `anthropic-beta: advisor-tool-2026-03-01`。

產業影響:為經濟高效的代理程式開發開啟新大門

Advisor Tool 的推出標誌著 AI 代理開發範式的重大演進。它讓開發者能在約 95% 的任務中享受 Sonnet 的執行效率與近似 Sonnet 的定價,同時在 5% 的關鍵決策點獲得 Opus 級別的判斷能力。這種「執行器 + 顧問」的混合策略,不僅大幅削減了大規模部署的成本,更顯著提升了小型模型在複雜工作流程中的可行性。

無論是開發程式碼生成代理程式、瀏覽器自動化工具,還是高吞吐量資料處理系統,「顧問工具」皆提供高效、靈活且經濟實惠的解決方案。Anthropic 再次證明,模型能力的突破不僅源於參數規模,更來自架構與使用模式的創新。

隨著 Beta 階段持續推進,這項功能勢必將迅速成為開發者打造高效能且兼顧成本效益的 AI 代理程式之標準工具。其後續更新與進一步的基準測試表現,絕對值得密切關注。

相關文章
Gmail 推出個人化 AI 收件匣、搜尋中的 AI 摘要等功能 Gmail 推出個人化 AI 收件匣、搜尋中的 AI 摘要等功能 Google 為 Gmail 推出了一款由 AI 驅動的新收件匣,能為您提供任務的個人化概覽,並讓您隨時掌握重要更新。此外,Gmail 還將在搜尋功能中推出 AI 概覽,並推出一款類似 Grammarly 的校對工具。先前僅限付費訂閱者使用的多項 AI 功能,現已開放給所有使用者使用。新的 AI 收件匣分頁包含兩個區塊:「建議待辦事項」與「待追蹤主題」。 第一個區塊會顯示需要採取行動的高優先級電子
首個山東百度AI漫畫劇集創作基地在淄博正式啟動 首個山東百度AI漫畫劇集創作基地在淄博正式啟動 4月27日,山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」,標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章,旨在透過AI技術與文化創作教育的深度融合,探索培育數位文化創作人才的創新模式。在揭牌儀式上,校方代表強調,該基地將作為創新人才培育及深化政校企合作的重要平台。 展望未來,該校計劃將真實的專案案例引入課堂,擺脫傳統教學方法,建立一個完整的專案式教學循
桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元 桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元 隨著市場對能大規模提供 AI 運算能力的資料中心需求激增,由 Nvidia 支持的英國 AI 基礎設施公司 Nscale 估值已達 146 億美元。這使該公司與 Helsing 及 Mistral AI 並列,成為歐洲最新的「獨角獸」企業之一。Nscale 的策略核心在於垂直整合,涵蓋能源、資料中心、運算及調度軟體等領域。 此次估值是基於一輪20億美元的C輪融資,該公司稱此為「歐洲史上最大規模」,
相關專題推薦
漫畫創作 AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料
AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料

2026年最新最佳AI角色建立工具:發現那些備受好評的工具,它們能夠幫助你為漫畫角色生成詳細的背景故事和視覺素材。我們精心整理的這份每週更新的列表會根據實際測試結果,對比免費與付費選項的優劣。找到這些強大且能改變創作流程的工具,幫助你塑造引人入勝的角色,提升創作效率。立即訪問XIX.AI檢視排名,找到最適合你的故事創作助手吧。

10 個工具
xix.ai
健康與養生 AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫
AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具,為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦,包含免費與付費方案的比較,以及實用經驗分享。透過 XIX.AI 的專家指南,開啟您最健康的孕期旅程。立即探索。

10 個工具
xix.ai
寫作 最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文
最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI,探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單,能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜,比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具
xix.ai
圖像編輯 用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計
用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計

2026最新推薦:探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具,幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項,檢視實際測試結果,從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析,讓您立即開始將故事視覺化呈現吧!

10 個工具
xix.ai
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
評論 (0)
0/500
OR