选项
首页
新闻
Anthropic 推出配备专业模型角色的 AI 顾问工具

Anthropic 推出配备专业模型角色的 AI 顾问工具

2026-04-27
57

Anthropic 已正式在 Claude 平台 API 中推出“顾问工具”Advisor Tool),向开发者展示了一种新型的混合智能模型。在此架构中,一个成本更低、速度更快的模型负责处理大部分工作负载,仅在面临复杂决策时,才会自动向最强大的模型寻求战略建议。这种设计从根本上重新构思了传统智能体开发中“大模型规划、小模型执行”的模式,提供了真正兼顾成本与性能的优化解决方案。

创新机制:小模型执行,大模型顾问

此新功能将Claude Sonnet 或 Haiku定位为“执行者”,负责调用工具、处理任务及整合结果。当执行者遇到无法独立解决的难题时,才会将当前上下文传递给Claude Opus以获取建议。

Opus 提供高层次的解决方案、路径修正或战略指导,随后立即将控制权交还给执行者。关键在于,Opus不会直接调用工具或向用户输出最终结果,而是作为一位隐形的“战略家”发挥作用。这种倒置的设计确保了绝大多数令牌消耗发生在低成本模型上,并将高端计算能力保留给关键节点。

image.png

性能与成本:测试中的双赢局面

官方测试数据揭示了显著优势:

Sonnet 与 Opus Advisor的组合在多语言 SWE-bench 测试中,相较于单独使用 Sonnet 提升了2.7 个百分点,同时每项任务的总体成本降低了11.9%。

Haiku 与 Opus Advisor的组合表现更为惊人。其在 BrowseComp 测试中的得分从 19.7% 跃升至41.2%,性能几乎翻倍。尽管其性能仍比 Sonnet 单独运行时低约 29%,但成本仅为 Sonnet 的15%,因此非常适合对错误容忍度较高的高并发、批处理场景。

这些结果表明,通过智能路由关键决策,开发人员可以摆脱“Opus 成本过高,无法长期使用”与“仅使用 Sonnet 性能不足”之间的两难选择。

使用简便:仅需一行配置即可启用

开发者只需在 Messages API 的 tools 数组中添加类型为advisor_20260301的工具定义,即可激活此功能。模型切换和上下文传递等复杂操作会在单次 API 请求内自动完成,无需手动协调多次调用或管理额外上下文。

通过max_uses参数,可灵活控制每次请求中顾问咨询的最大次数。在计费方面,执行器和顾问的代币使用量将分别计费,确保透明度和可控性。该功能目前处于Beta 阶段,使用时需在请求头中添加 `anthropic-beta: advisor-tool-2026-03-01`。

行业影响:为经济高效的智能体开发开启新篇章

Advisor Tool 的推出标志着 AI 代理开发范式的重大演进。它使开发者在约 95% 的任务中既能享受 Sonnet 的执行效率和接近 Sonnet 的定价,又能在 5% 的关键决策点获得 Opus 级别的判断能力。这种“执行器 + 顾问”的混合策略不仅大幅降低了大规模部署的成本,还显著提升了小型模型在复杂工作流中的可行性。

无论是构建编程代理、浏览器自动化工具还是海量数据处理系统,Advisor Tool 都提供了一种高效、灵活且经济的解决方案。Anthropic 再次证明,模型能力的突破不仅源于参数规模,更源于架构和使用模式的创新。

随着 Beta 阶段的持续推进,该功能有望迅速成为开发者构建高性能、注重成本的 AI 代理的标准工具。其后续更新及进一步的基准测试表现无疑值得密切关注。

相关文章
OpenAI 停用 o3 和 GPT-4.5 大型模型 OpenAI 停用 o3 和 GPT-4.5 大型模型 作为人工智能领域的领军企业,OpenAI的每一步技术举措都会在业界引发巨大反响。近日,该公司发布了一项重大公告:将从其ChatGPT平台退役两个经典模型——o3和GPT-4.5。 常被称为“人文天才”的 GPT-4.5 将于 6 月 27 日下线,而以硬核推理能力著称的 o3 则将于 8 月 26 日跟进。经典模型的退役引发怀旧之情这一突如其来的消息让许多付费老用户难以接受,社交社区和讨论区很快充
AIGCPanel 2.0.0 重大更新:工作流引擎开启自动化数字人创作的新纪元 AIGCPanel 2.0.0 重大更新:工作流引擎开启自动化数字人创作的新纪元 AIGCPanel 作为一款强大的本地数字人创作工具,刚刚发布了 2.0.0 版本——被誉为“迄今为止最重大的更新”。 此次核心升级通过工作流引擎和CLI命令行工具,将数字人合成、语音克隆及音视频处理功能有机整合,从而解决了当前AI创作工具分散的问题,实现了从手动组装到自动化生产的转变。1. 核心升级:定义逻辑流程,一键输出AIGCPanel 2.0.0 的突出新功能是工作流引擎:基于节点的组合:
BuzzFeed 推出专注于垃圾应用的 AI 子公司 BuzzFeed 推出专注于垃圾应用的 AI 子公司 在面临重大经营危机的背景下,曾经的数字媒体巨头BuzzFeed正启动一项由人工智能驱动的雄心勃勃的自救实验。 在最近举行的SXSW大会上,联合创始人兼首席执行官乔纳·佩雷蒂宣布成立一家名为Branch Office的子公司,旨在通过一系列由人工智能驱动的消费者应用程序,重新定义“软件即内容”的商业模式。核心产品组合:融合网络梗与社交媒体Branch Office 推出了三款核心应用,每款都旨在捕捉
相关专题推荐
图像编辑 用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计
用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计

2026最新推荐:探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具,帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项,查看实际测试结果,从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析,让您立即开始将故事可视化呈现吧!

10 个工具
xix.ai
写作 最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告
最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告

在XIX.AI上,发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能,帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名,您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧!

10 个工具
xix.ai
商业 最佳 AI 合同审查软件:即时发现法律漏洞与合规风险
最佳 AI 合同审查软件:即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具,能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名,对比免费与付费选项。找到能彻底改变游戏规则的解决方案,实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具
xix.ai
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
写作 顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷
顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷

探索2026年最优秀的AI人物设定生成工具,助您塑造鲜活立体的角色。XIX.AI精心筛选的这份清单汇集了广受好评、颠覆传统的工具,能够生成具有内在逻辑的动机和致命缺陷。通过实际测试对比免费与付费选项。立即释放您的叙事潜能。

10 个工具
xix.ai
评论 (0)
0/500
OR