Anthropic 推出具備專門模型角色的 AI 顧問工具
Anthropic 已正式在 Claude 平台 API 中推出「顧問工具」(Advisor Tool),向開發者介紹一種嶄新的混合智能模型。在此架構下,一個成本更低且運算速度更快的模型負責處理大部分工作負載,僅在面臨複雜決策時,才會自動諮詢最強大的模型以獲取策略建議。此設計從根本上重新思考了傳統代理(Agent)開發中「大模型規劃、小模型執行」的模式,提供了一種真正兼具成本效益與性能的解決方案。
創新機制:小模型執行,大模型諮詢
此新功能將Claude Sonnet 或 Haiku定位為「執行者」,負責呼叫工具、處理任務及整合結果。執行者僅在遇到無法獨立解決的難題時,才會將當前語境傳遞給Claude Opus以獲取建議。
Opus 會提供高階解決方案、方向修正或策略指引,隨後立即將控制權交還給執行者。關鍵在於,Opus不會直接呼叫工具或向使用者輸出最終結果,而是扮演一個隱形的「策略家」。這種倒置設計確保了絕大部分的代幣消耗發生在成本較低的模型上,並將高端運算能力保留給關鍵時刻。

效能與成本:測試中的雙贏局面
官方測試數據顯示顯著效益:
Sonnet 搭配 Opus Advisor的組合,在多語言 SWE-bench 測試中較單獨使用 Sonnet提升了 2.7 個百分點,同時每項任務的整體成本降低了11.9%。
Haiku 搭配 Opus Advisor的組合則展現出更為驚人的成果。其在 BrowseComp 測試中的得分從 19.7% 躍升至41.2%,效能實質上翻了一倍。雖然其表現仍比 Sonnet 單獨運作時低約 29%,但成本僅為 Sonnet 的15%,使其成為高並發、批次處理且對錯誤容忍度較高的情境下的理想選擇。
這些結果證明,透過智慧導向關鍵決策,開發人員得以擺脫「Opus 成本過高,不適合全時使用」與「單獨使用 Sonnet 效能不足」之間的兩難抉擇。
操作簡便:僅需一行設定即可啟用
開發人員只需在 Messages API 的 tools 陣列中新增類型為advisor_20260301的工具定義,即可啟用此功能。模型切換與上下文傳遞等複雜操作,皆會於單一 API 請求中自動處理,無需手動協調多次呼叫或管理額外上下文。
透過max_uses參數,可靈活控制每次請求中顧問諮詢的最大次數。在計費方面,執行器與顧問的代幣使用量將分別計費,確保透明度與控制權。目前此功能處於Beta 階段,使用時需在請求標頭中加入 `anthropic-beta: advisor-tool-2026-03-01`。
產業影響:為經濟高效的代理程式開發開啟新大門
Advisor Tool 的推出標誌著 AI 代理開發範式的重大演進。它讓開發者能在約 95% 的任務中享受 Sonnet 的執行效率與近似 Sonnet 的定價,同時在 5% 的關鍵決策點獲得 Opus 級別的判斷能力。這種「執行器 + 顧問」的混合策略,不僅大幅削減了大規模部署的成本,更顯著提升了小型模型在複雜工作流程中的可行性。
無論是開發程式碼生成代理程式、瀏覽器自動化工具,還是高吞吐量資料處理系統,「顧問工具」皆提供高效、靈活且經濟實惠的解決方案。Anthropic 再次證明,模型能力的突破不僅源於參數規模,更來自架構與使用模式的創新。
隨著 Beta 階段持續推進,這項功能勢必將迅速成為開發者打造高效能且兼顧成本效益的 AI 代理程式之標準工具。其後續更新與進一步的基準測試表現,絕對值得密切關注。
相關文章
Gmail 推出個人化 AI 收件匣、搜尋中的 AI 摘要等功能
Google 為 Gmail 推出了一款由 AI 驅動的新收件匣,能為您提供任務的個人化概覽,並讓您隨時掌握重要更新。此外,Gmail 還將在搜尋功能中推出 AI 概覽,並推出一款類似 Grammarly 的校對工具。先前僅限付費訂閱者使用的多項 AI 功能,現已開放給所有使用者使用。新的 AI 收件匣分頁包含兩個區塊:「建議待辦事項」與「待追蹤主題」。 第一個區塊會顯示需要採取行動的高優先級電子
首個山東百度AI漫畫劇集創作基地在淄博正式啟動
4月27日,山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」,標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章,旨在透過AI技術與文化創作教育的深度融合,探索培育數位文化創作人才的創新模式。在揭牌儀式上,校方代表強調,該基地將作為創新人才培育及深化政校企合作的重要平台。 展望未來,該校計劃將真實的專案案例引入課堂,擺脫傳統教學方法,建立一個完整的專案式教學循
桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元
隨著市場對能大規模提供 AI 運算能力的資料中心需求激增,由 Nvidia 支持的英國 AI 基礎設施公司 Nscale 估值已達 146 億美元。這使該公司與 Helsing 及 Mistral AI 並列,成為歐洲最新的「獨角獸」企業之一。Nscale 的策略核心在於垂直整合,涵蓋能源、資料中心、運算及調度軟體等領域。 此次估值是基於一輪20億美元的C輪融資,該公司稱此為「歐洲史上最大規模」,
相關專題推薦
評論 (0)
0/500
Anthropic 已正式在 Claude 平台 API 中推出「顧問工具」(Advisor Tool),向開發者介紹一種嶄新的混合智能模型。在此架構下,一個成本更低且運算速度更快的模型負責處理大部分工作負載,僅在面臨複雜決策時,才會自動諮詢最強大的模型以獲取策略建議。此設計從根本上重新思考了傳統代理(Agent)開發中「大模型規劃、小模型執行」的模式,提供了一種真正兼具成本效益與性能的解決方案。
創新機制:小模型執行,大模型諮詢
此新功能將Claude Sonnet 或 Haiku定位為「執行者」,負責呼叫工具、處理任務及整合結果。執行者僅在遇到無法獨立解決的難題時,才會將當前語境傳遞給Claude Opus以獲取建議。
Opus 會提供高階解決方案、方向修正或策略指引,隨後立即將控制權交還給執行者。關鍵在於,Opus不會直接呼叫工具或向使用者輸出最終結果,而是扮演一個隱形的「策略家」。這種倒置設計確保了絕大部分的代幣消耗發生在成本較低的模型上,並將高端運算能力保留給關鍵時刻。

效能與成本:測試中的雙贏局面
官方測試數據顯示顯著效益:
Sonnet 搭配 Opus Advisor的組合,在多語言 SWE-bench 測試中較單獨使用 Sonnet提升了 2.7 個百分點,同時每項任務的整體成本降低了11.9%。
Haiku 搭配 Opus Advisor的組合則展現出更為驚人的成果。其在 BrowseComp 測試中的得分從 19.7% 躍升至41.2%,效能實質上翻了一倍。雖然其表現仍比 Sonnet 單獨運作時低約 29%,但成本僅為 Sonnet 的15%,使其成為高並發、批次處理且對錯誤容忍度較高的情境下的理想選擇。
這些結果證明,透過智慧導向關鍵決策,開發人員得以擺脫「Opus 成本過高,不適合全時使用」與「單獨使用 Sonnet 效能不足」之間的兩難抉擇。
操作簡便:僅需一行設定即可啟用
開發人員只需在 Messages API 的 tools 陣列中新增類型為advisor_20260301的工具定義,即可啟用此功能。模型切換與上下文傳遞等複雜操作,皆會於單一 API 請求中自動處理,無需手動協調多次呼叫或管理額外上下文。
透過max_uses參數,可靈活控制每次請求中顧問諮詢的最大次數。在計費方面,執行器與顧問的代幣使用量將分別計費,確保透明度與控制權。目前此功能處於Beta 階段,使用時需在請求標頭中加入 `anthropic-beta: advisor-tool-2026-03-01`。
產業影響:為經濟高效的代理程式開發開啟新大門
Advisor Tool 的推出標誌著 AI 代理開發範式的重大演進。它讓開發者能在約 95% 的任務中享受 Sonnet 的執行效率與近似 Sonnet 的定價,同時在 5% 的關鍵決策點獲得 Opus 級別的判斷能力。這種「執行器 + 顧問」的混合策略,不僅大幅削減了大規模部署的成本,更顯著提升了小型模型在複雜工作流程中的可行性。
無論是開發程式碼生成代理程式、瀏覽器自動化工具,還是高吞吐量資料處理系統,「顧問工具」皆提供高效、靈活且經濟實惠的解決方案。Anthropic 再次證明,模型能力的突破不僅源於參數規模,更來自架構與使用模式的創新。
隨著 Beta 階段持續推進,這項功能勢必將迅速成為開發者打造高效能且兼顧成本效益的 AI 代理程式之標準工具。其後續更新與進一步的基準測試表現,絕對值得密切關注。
Gmail 推出個人化 AI 收件匣、搜尋中的 AI 摘要等功能
Google 為 Gmail 推出了一款由 AI 驅動的新收件匣,能為您提供任務的個人化概覽,並讓您隨時掌握重要更新。此外,Gmail 還將在搜尋功能中推出 AI 概覽,並推出一款類似 Grammarly 的校對工具。先前僅限付費訂閱者使用的多項 AI 功能,現已開放給所有使用者使用。新的 AI 收件匣分頁包含兩個區塊:「建議待辦事項」與「待追蹤主題」。 第一個區塊會顯示需要採取行動的高優先級電子
首個山東百度AI漫畫劇集創作基地在淄博正式啟動
4月27日,山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」,標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章,旨在透過AI技術與文化創作教育的深度融合,探索培育數位文化創作人才的創新模式。在揭牌儀式上,校方代表強調,該基地將作為創新人才培育及深化政校企合作的重要平台。 展望未來,該校計劃將真實的專案案例引入課堂,擺脫傳統教學方法,建立一個完整的專案式教學循
桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元
隨著市場對能大規模提供 AI 運算能力的資料中心需求激增,由 Nvidia 支持的英國 AI 基礎設施公司 Nscale 估值已達 146 億美元。這使該公司與 Helsing 及 Mistral AI 並列,成為歐洲最新的「獨角獸」企業之一。Nscale 的策略核心在於垂直整合,涵蓋能源、資料中心、運算及調度軟體等領域。 此次估值是基於一輪20億美元的C輪融資,該公司稱此為「歐洲史上最大規模」,





首頁






