Anthropic 推出配备专业模型角色的 AI 顾问工具
Anthropic 已正式在 Claude 平台 API 中推出“顾问工具”(Advisor Tool),向开发者展示了一种新型的混合智能模型。在此架构中,一个成本更低、速度更快的模型负责处理大部分工作负载,仅在面临复杂决策时,才会自动向最强大的模型寻求战略建议。这种设计从根本上重新构思了传统智能体开发中“大模型规划、小模型执行”的模式,提供了真正兼顾成本与性能的优化解决方案。
创新机制:小模型执行,大模型顾问
此新功能将Claude Sonnet 或 Haiku定位为“执行者”,负责调用工具、处理任务及整合结果。当执行者遇到无法独立解决的难题时,才会将当前上下文传递给Claude Opus以获取建议。
Opus 提供高层次的解决方案、路径修正或战略指导,随后立即将控制权交还给执行者。关键在于,Opus不会直接调用工具或向用户输出最终结果,而是作为一位隐形的“战略家”发挥作用。这种倒置的设计确保了绝大多数令牌消耗发生在低成本模型上,并将高端计算能力保留给关键节点。

性能与成本:测试中的双赢局面
官方测试数据揭示了显著优势:
Sonnet 与 Opus Advisor的组合在多语言 SWE-bench 测试中,相较于单独使用 Sonnet 提升了2.7 个百分点,同时每项任务的总体成本降低了11.9%。
Haiku 与 Opus Advisor的组合表现更为惊人。其在 BrowseComp 测试中的得分从 19.7% 跃升至41.2%,性能几乎翻倍。尽管其性能仍比 Sonnet 单独运行时低约 29%,但成本仅为 Sonnet 的15%,因此非常适合对错误容忍度较高的高并发、批处理场景。
这些结果表明,通过智能路由关键决策,开发人员可以摆脱“Opus 成本过高,无法长期使用”与“仅使用 Sonnet 性能不足”之间的两难选择。
使用简便:仅需一行配置即可启用
开发者只需在 Messages API 的 tools 数组中添加类型为advisor_20260301的工具定义,即可激活此功能。模型切换和上下文传递等复杂操作会在单次 API 请求内自动完成,无需手动协调多次调用或管理额外上下文。
通过max_uses参数,可灵活控制每次请求中顾问咨询的最大次数。在计费方面,执行器和顾问的代币使用量将分别计费,确保透明度和可控性。该功能目前处于Beta 阶段,使用时需在请求头中添加 `anthropic-beta: advisor-tool-2026-03-01`。
行业影响:为经济高效的智能体开发开启新篇章
Advisor Tool 的推出标志着 AI 代理开发范式的重大演进。它使开发者在约 95% 的任务中既能享受 Sonnet 的执行效率和接近 Sonnet 的定价,又能在 5% 的关键决策点获得 Opus 级别的判断能力。这种“执行器 + 顾问”的混合策略不仅大幅降低了大规模部署的成本,还显著提升了小型模型在复杂工作流中的可行性。
无论是构建编程代理、浏览器自动化工具还是海量数据处理系统,Advisor Tool 都提供了一种高效、灵活且经济的解决方案。Anthropic 再次证明,模型能力的突破不仅源于参数规模,更源于架构和使用模式的创新。
随着 Beta 阶段的持续推进,该功能有望迅速成为开发者构建高性能、注重成本的 AI 代理的标准工具。其后续更新及进一步的基准测试表现无疑值得密切关注。
相关文章
OpenAI 停用 o3 和 GPT-4.5 大型模型
作为人工智能领域的领军企业,OpenAI的每一步技术举措都会在业界引发巨大反响。近日,该公司发布了一项重大公告:将从其ChatGPT平台退役两个经典模型——o3和GPT-4.5。 常被称为“人文天才”的 GPT-4.5 将于 6 月 27 日下线,而以硬核推理能力著称的 o3 则将于 8 月 26 日跟进。经典模型的退役引发怀旧之情这一突如其来的消息让许多付费老用户难以接受,社交社区和讨论区很快充
AIGCPanel 2.0.0 重大更新:工作流引擎开启自动化数字人创作的新纪元
AIGCPanel 作为一款强大的本地数字人创作工具,刚刚发布了 2.0.0 版本——被誉为“迄今为止最重大的更新”。 此次核心升级通过工作流引擎和CLI命令行工具,将数字人合成、语音克隆及音视频处理功能有机整合,从而解决了当前AI创作工具分散的问题,实现了从手动组装到自动化生产的转变。1. 核心升级:定义逻辑流程,一键输出AIGCPanel 2.0.0 的突出新功能是工作流引擎:基于节点的组合:
BuzzFeed 推出专注于垃圾应用的 AI 子公司
在面临重大经营危机的背景下,曾经的数字媒体巨头BuzzFeed正启动一项由人工智能驱动的雄心勃勃的自救实验。 在最近举行的SXSW大会上,联合创始人兼首席执行官乔纳·佩雷蒂宣布成立一家名为Branch Office的子公司,旨在通过一系列由人工智能驱动的消费者应用程序,重新定义“软件即内容”的商业模式。核心产品组合:融合网络梗与社交媒体Branch Office 推出了三款核心应用,每款都旨在捕捉
相关专题推荐
评论 (0)
0/500
Anthropic 已正式在 Claude 平台 API 中推出“顾问工具”(Advisor Tool),向开发者展示了一种新型的混合智能模型。在此架构中,一个成本更低、速度更快的模型负责处理大部分工作负载,仅在面临复杂决策时,才会自动向最强大的模型寻求战略建议。这种设计从根本上重新构思了传统智能体开发中“大模型规划、小模型执行”的模式,提供了真正兼顾成本与性能的优化解决方案。
创新机制:小模型执行,大模型顾问
此新功能将Claude Sonnet 或 Haiku定位为“执行者”,负责调用工具、处理任务及整合结果。当执行者遇到无法独立解决的难题时,才会将当前上下文传递给Claude Opus以获取建议。
Opus 提供高层次的解决方案、路径修正或战略指导,随后立即将控制权交还给执行者。关键在于,Opus不会直接调用工具或向用户输出最终结果,而是作为一位隐形的“战略家”发挥作用。这种倒置的设计确保了绝大多数令牌消耗发生在低成本模型上,并将高端计算能力保留给关键节点。

性能与成本:测试中的双赢局面
官方测试数据揭示了显著优势:
Sonnet 与 Opus Advisor的组合在多语言 SWE-bench 测试中,相较于单独使用 Sonnet 提升了2.7 个百分点,同时每项任务的总体成本降低了11.9%。
Haiku 与 Opus Advisor的组合表现更为惊人。其在 BrowseComp 测试中的得分从 19.7% 跃升至41.2%,性能几乎翻倍。尽管其性能仍比 Sonnet 单独运行时低约 29%,但成本仅为 Sonnet 的15%,因此非常适合对错误容忍度较高的高并发、批处理场景。
这些结果表明,通过智能路由关键决策,开发人员可以摆脱“Opus 成本过高,无法长期使用”与“仅使用 Sonnet 性能不足”之间的两难选择。
使用简便:仅需一行配置即可启用
开发者只需在 Messages API 的 tools 数组中添加类型为advisor_20260301的工具定义,即可激活此功能。模型切换和上下文传递等复杂操作会在单次 API 请求内自动完成,无需手动协调多次调用或管理额外上下文。
通过max_uses参数,可灵活控制每次请求中顾问咨询的最大次数。在计费方面,执行器和顾问的代币使用量将分别计费,确保透明度和可控性。该功能目前处于Beta 阶段,使用时需在请求头中添加 `anthropic-beta: advisor-tool-2026-03-01`。
行业影响:为经济高效的智能体开发开启新篇章
Advisor Tool 的推出标志着 AI 代理开发范式的重大演进。它使开发者在约 95% 的任务中既能享受 Sonnet 的执行效率和接近 Sonnet 的定价,又能在 5% 的关键决策点获得 Opus 级别的判断能力。这种“执行器 + 顾问”的混合策略不仅大幅降低了大规模部署的成本,还显著提升了小型模型在复杂工作流中的可行性。
无论是构建编程代理、浏览器自动化工具还是海量数据处理系统,Advisor Tool 都提供了一种高效、灵活且经济的解决方案。Anthropic 再次证明,模型能力的突破不仅源于参数规模,更源于架构和使用模式的创新。
随着 Beta 阶段的持续推进,该功能有望迅速成为开发者构建高性能、注重成本的 AI 代理的标准工具。其后续更新及进一步的基准测试表现无疑值得密切关注。
OpenAI 停用 o3 和 GPT-4.5 大型模型
作为人工智能领域的领军企业,OpenAI的每一步技术举措都会在业界引发巨大反响。近日,该公司发布了一项重大公告:将从其ChatGPT平台退役两个经典模型——o3和GPT-4.5。 常被称为“人文天才”的 GPT-4.5 将于 6 月 27 日下线,而以硬核推理能力著称的 o3 则将于 8 月 26 日跟进。经典模型的退役引发怀旧之情这一突如其来的消息让许多付费老用户难以接受,社交社区和讨论区很快充
AIGCPanel 2.0.0 重大更新:工作流引擎开启自动化数字人创作的新纪元
AIGCPanel 作为一款强大的本地数字人创作工具,刚刚发布了 2.0.0 版本——被誉为“迄今为止最重大的更新”。 此次核心升级通过工作流引擎和CLI命令行工具,将数字人合成、语音克隆及音视频处理功能有机整合,从而解决了当前AI创作工具分散的问题,实现了从手动组装到自动化生产的转变。1. 核心升级:定义逻辑流程,一键输出AIGCPanel 2.0.0 的突出新功能是工作流引擎:基于节点的组合:
BuzzFeed 推出专注于垃圾应用的 AI 子公司
在面临重大经营危机的背景下,曾经的数字媒体巨头BuzzFeed正启动一项由人工智能驱动的雄心勃勃的自救实验。 在最近举行的SXSW大会上,联合创始人兼首席执行官乔纳·佩雷蒂宣布成立一家名为Branch Office的子公司,旨在通过一系列由人工智能驱动的消费者应用程序,重新定义“软件即内容”的商业模式。核心产品组合:融合网络梗与社交媒体Branch Office 推出了三款核心应用,每款都旨在捕捉





首页






