拟人化的AI模型具有可自定义的思维持续时间
Anthropic的最新AI模型Claude 3.7 Sonnet正在AI领域掀起波澜。被称为业界首个“混合AI推理模型”,它旨在根据您的需求提供快速回答和更深思熟虑的响应。您甚至可以选择让Claude“思考”您的问题的时间长短——很酷,对吧?
Claude 3.7 Sonnet的设计理念是让AI使用更加简单。Anthropic希望一个模型就能处理所有任务,而不是让用户从众多不同模型中选择。从周一开始,每个人都可以体验Claude 3.7 Sonnet,但如果您想使用其高级推理功能,需要订阅Anthropic的优质计划。免费用户仍然可以使用一个强大的模型版本,Anthropic表示这比之前的Claude 3.5 Sonnet更出色。
现在来说说费用——Claude 3.7 Sonnet的定价为每百万输入令牌3美元,每百万输出令牌15美元。这比其他一些模型(如OpenAI的o3-mini和DeepSeek的R1)稍贵,但请记住,那些只是推理模型,而不是像Claude这样的混合模型。

Anthropic的新思考模式 图片来源:Anthropic Claude 3.7 Sonnet是Anthropic首个具备“推理”能力的模型,这在AI领域意义重大。推理模型需要更多时间和计算能力来回答问题,会将问题分解为更小的步骤以获得更准确的答案。它并不完全等同于人类推理,但以此为模型。Anthropic对Claude有宏大的计划。他们希望Claude最终能自行判断问题需要“思考”多长时间,而无需用户设置。Anthropic的产品与研究负责人Dianne Penn在接受TechCrunch采访时表示,他们认为推理只是前沿模型应具备的众多功能之一,全部整合在一个模型中。
使用Claude 3.7 Sonnet,您甚至可以通过“可见草稿板”看到它如何规划答案。大多数时候,您可以看到整个过程,但出于安全原因,Anthropic可能会对某些部分进行编辑。

Claude在claude应用中的思考过程 图片来源:Anthropic Anthropic表示,他们已针对现实世界的任务(如复杂的编码问题或需要一定自主性的任务)优化了Claude的思考模式。如果您是使用Anthropic API的开发者,您甚至可以控制Claude的“思考”程度,在速度、成本和答案质量之间找到平衡。在一些测试中,Claude 3.7 Sonnet表现出色。在SWE-Bench(一项针对现实世界编码任务的测试)中,它得分62.3%,超过了OpenAI的o3-mini(49.3%)。在TAU-Bench(衡量AI在零售环境中与模拟用户和外部API交互能力的测试)中,Claude 3.7 Sonnet得分81.2%,而OpenAI的o1模型得分为73.5%。
Anthropic还表示,Claude 3.7 Sonnet拒绝回答问题的可能性更低,能更细致地区分有害和无害的提示。与Claude 3.5 Sonnet相比,其不必要的拒绝率降低了45%。
与Claude 3.7 Sonnet一起,Anthropic还推出了一款名为Claude Code的新工具。这是一个研究预览版,允许开发者直接从终端通过Claude运行特定任务。在演示中,Anthropic展示了Claude Code如何通过简单的命令(如“解释这个项目结构”)分析编码项目。您甚至可以用普通英语修改代码库,Claude Code会在修改时描述其编辑内容,测试错误,并将项目推送到GitHub仓库。
Claude Code将以“先到先得”的方式向有限数量的用户开放。
Anthropic在AI实验室不断推出新模型的时刻发布了Claude 3.7 Sonnet。虽然Anthropic通常采取更为谨慎、以安全为重点的策略,但这次他们希望引领潮流。但他们能领先多久无人知晓——尤其是OpenAI的CEO Sam Altman表示,他们自己的混合AI模型将在“几个月”内推出。
相关文章
Anthropic 与 Google 和 Broadrom 扩大计算合作
人工智能研究实验室Anthropic周一宣布,已与谷歌和博通达成一项新协议,旨在大幅提升其Claude AI模型背后的处理和计算能力。随着对其AI产品需求的持续快速增长,该公司对其计算合作伙伴关系进行了此次调整。这些协议将扩大Anthropic对谷歌云张量处理单元(TPUs)——即谷歌专用的AI芯片——的使用范围,并进一步拓展了双方于2025年10月达成的、涉及超过1吉瓦计算容量的合作协议。Ant
随着用户迁移,Claude在ChatGPT面前逐渐占据上风
随着ChatGPT及其母公司OpenAI卷入一系列争议,越来越多的用户正转向Claude。转折点出现在Claude的开发者Anthropic拒绝了美国国防部关于将其AI模型用于大规模国内监控或全自主武器的请求之后。作为报复,特朗普总统下令所有联邦机构停止使用Anthropic的产品,国防部长皮特·赫格塞斯则采取行动,将该公司列为供应链威胁。不久之后,OpenAI披露了其与五角大楼的合作关系,并声称
Anthropic与五角大楼的对峙对国家安全意味着什么
过去两周,Anthropic首席执行官达里奥·阿莫迪与国防部长皮特·赫格塞斯之间围绕军方应用人工智能技术问题展开的公开对峙成为舆论焦点。Anthropic已制定政策,禁止其人工智能模型被用于对美国公民进行大规模监控,或用于未经人类批准即可发起攻击的完全自主武器系统。相比之下,赫格塞斯部长则主张国防部不应受供应商规则的约束,并呼吁允许将该技术用于任何“合法用途”。周四,阿莫迪公开表示,尽管面临可能被
相关专题推荐
评论 (54)
0/500
This hybrid AI model sounds like a game-changer! Being able to tweak how long Claude thinks is super cool, like choosing between a quick coffee chat or a deep dive convo. Excited to see how this stacks up against other AI out there! 😎
Claude 3.7 Sonnet a l'air incroyable ! Pouvoir choisir la durée de réflexion, c'est comme demander à un chef de cuisiner vite ou de prendre son temps pour un plat parfait. J'ai hâte de voir comment ça marche en pratique ! 😄
Claude's customizable thinking duration sounds like a game-changer! I wonder how it balances speed and depth in real-world tasks. Excited to try it out! 😄
Wow, Claude 3.7 sounds like a game-changer! Being able to tweak how long it thinks is such a cool feature. I’m curious how this will stack up against other AI models in real-world tasks. Anyone tried it yet? 😄
O Claude 3.7 Sonnet é incrível! Adoro poder escolher a duração do pensamento. Às vezes preciso de respostas rápidas, outras vezes quero respostas mais pensadas. É como ter um amigo AI personalizável! Só desejo que fosse um pouco mais rápido às vezes. 😎
Anthropic的最新AI模型Claude 3.7 Sonnet正在AI领域掀起波澜。被称为业界首个“混合AI推理模型”,它旨在根据您的需求提供快速回答和更深思熟虑的响应。您甚至可以选择让Claude“思考”您的问题的时间长短——很酷,对吧?
Claude 3.7 Sonnet的设计理念是让AI使用更加简单。Anthropic希望一个模型就能处理所有任务,而不是让用户从众多不同模型中选择。从周一开始,每个人都可以体验Claude 3.7 Sonnet,但如果您想使用其高级推理功能,需要订阅Anthropic的优质计划。免费用户仍然可以使用一个强大的模型版本,Anthropic表示这比之前的Claude 3.5 Sonnet更出色。
现在来说说费用——Claude 3.7 Sonnet的定价为每百万输入令牌3美元,每百万输出令牌15美元。这比其他一些模型(如OpenAI的o3-mini和DeepSeek的R1)稍贵,但请记住,那些只是推理模型,而不是像Claude这样的混合模型。

Anthropic对Claude有宏大的计划。他们希望Claude最终能自行判断问题需要“思考”多长时间,而无需用户设置。Anthropic的产品与研究负责人Dianne Penn在接受TechCrunch采访时表示,他们认为推理只是前沿模型应具备的众多功能之一,全部整合在一个模型中。
使用Claude 3.7 Sonnet,您甚至可以通过“可见草稿板”看到它如何规划答案。大多数时候,您可以看到整个过程,但出于安全原因,Anthropic可能会对某些部分进行编辑。

在一些测试中,Claude 3.7 Sonnet表现出色。在SWE-Bench(一项针对现实世界编码任务的测试)中,它得分62.3%,超过了OpenAI的o3-mini(49.3%)。在TAU-Bench(衡量AI在零售环境中与模拟用户和外部API交互能力的测试)中,Claude 3.7 Sonnet得分81.2%,而OpenAI的o1模型得分为73.5%。
Anthropic还表示,Claude 3.7 Sonnet拒绝回答问题的可能性更低,能更细致地区分有害和无害的提示。与Claude 3.5 Sonnet相比,其不必要的拒绝率降低了45%。
与Claude 3.7 Sonnet一起,Anthropic还推出了一款名为Claude Code的新工具。这是一个研究预览版,允许开发者直接从终端通过Claude运行特定任务。在演示中,Anthropic展示了Claude Code如何通过简单的命令(如“解释这个项目结构”)分析编码项目。您甚至可以用普通英语修改代码库,Claude Code会在修改时描述其编辑内容,测试错误,并将项目推送到GitHub仓库。
Claude Code将以“先到先得”的方式向有限数量的用户开放。
Anthropic在AI实验室不断推出新模型的时刻发布了Claude 3.7 Sonnet。虽然Anthropic通常采取更为谨慎、以安全为重点的策略,但这次他们希望引领潮流。但他们能领先多久无人知晓——尤其是OpenAI的CEO Sam Altman表示,他们自己的混合AI模型将在“几个月”内推出。
Anthropic 与 Google 和 Broadrom 扩大计算合作
人工智能研究实验室Anthropic周一宣布,已与谷歌和博通达成一项新协议,旨在大幅提升其Claude AI模型背后的处理和计算能力。随着对其AI产品需求的持续快速增长,该公司对其计算合作伙伴关系进行了此次调整。这些协议将扩大Anthropic对谷歌云张量处理单元(TPUs)——即谷歌专用的AI芯片——的使用范围,并进一步拓展了双方于2025年10月达成的、涉及超过1吉瓦计算容量的合作协议。Ant
随着用户迁移,Claude在ChatGPT面前逐渐占据上风
随着ChatGPT及其母公司OpenAI卷入一系列争议,越来越多的用户正转向Claude。转折点出现在Claude的开发者Anthropic拒绝了美国国防部关于将其AI模型用于大规模国内监控或全自主武器的请求之后。作为报复,特朗普总统下令所有联邦机构停止使用Anthropic的产品,国防部长皮特·赫格塞斯则采取行动,将该公司列为供应链威胁。不久之后,OpenAI披露了其与五角大楼的合作关系,并声称
Anthropic与五角大楼的对峙对国家安全意味着什么
过去两周,Anthropic首席执行官达里奥·阿莫迪与国防部长皮特·赫格塞斯之间围绕军方应用人工智能技术问题展开的公开对峙成为舆论焦点。Anthropic已制定政策,禁止其人工智能模型被用于对美国公民进行大规模监控,或用于未经人类批准即可发起攻击的完全自主武器系统。相比之下,赫格塞斯部长则主张国防部不应受供应商规则的约束,并呼吁允许将该技术用于任何“合法用途”。周四,阿莫迪公开表示,尽管面临可能被
This hybrid AI model sounds like a game-changer! Being able to tweak how long Claude thinks is super cool, like choosing between a quick coffee chat or a deep dive convo. Excited to see how this stacks up against other AI out there! 😎
Claude 3.7 Sonnet a l'air incroyable ! Pouvoir choisir la durée de réflexion, c'est comme demander à un chef de cuisiner vite ou de prendre son temps pour un plat parfait. J'ai hâte de voir comment ça marche en pratique ! 😄
Claude's customizable thinking duration sounds like a game-changer! I wonder how it balances speed and depth in real-world tasks. Excited to try it out! 😄
Wow, Claude 3.7 sounds like a game-changer! Being able to tweak how long it thinks is such a cool feature. I’m curious how this will stack up against other AI models in real-world tasks. Anyone tried it yet? 😄
O Claude 3.7 Sonnet é incrível! Adoro poder escolher a duração do pensamento. Às vezes preciso de respostas rápidas, outras vezes quero respostas mais pensadas. É como ter um amigo AI personalizável! Só desejo que fosse um pouco mais rápido às vezes. 😎





首页






