选项
首页
新闻
拟人化的AI模型具有可自定义的思维持续时间

拟人化的AI模型具有可自定义的思维持续时间

2025-04-10
173

Anthropic的最新AI模型Claude 3.7 Sonnet正在AI领域掀起波澜。被称为业界首个“混合AI推理模型”,它旨在根据您的需求提供快速回答和更深思熟虑的响应。您甚至可以选择让Claude“思考”您的问题的时间长短——很酷,对吧?

Claude 3.7 Sonnet的设计理念是让AI使用更加简单。Anthropic希望一个模型就能处理所有任务,而不是让用户从众多不同模型中选择。从周一开始,每个人都可以体验Claude 3.7 Sonnet,但如果您想使用其高级推理功能,需要订阅Anthropic的优质计划。免费用户仍然可以使用一个强大的模型版本,Anthropic表示这比之前的Claude 3.5 Sonnet更出色。

现在来说说费用——Claude 3.7 Sonnet的定价为每百万输入令牌3美元,每百万输出令牌15美元。这比其他一些模型(如OpenAI的o3-mini和DeepSeek的R1)稍贵,但请记住,那些只是推理模型,而不是像Claude这样的混合模型。

Anthropic的新思考模式 图片来源:Anthropic
Claude 3.7 Sonnet是Anthropic首个具备“推理”能力的模型,这在AI领域意义重大。推理模型需要更多时间和计算能力来回答问题,会将问题分解为更小的步骤以获得更准确的答案。它并不完全等同于人类推理,但以此为模型。

Anthropic对Claude有宏大的计划。他们希望Claude最终能自行判断问题需要“思考”多长时间,而无需用户设置。Anthropic的产品与研究负责人Dianne Penn在接受TechCrunch采访时表示,他们认为推理只是前沿模型应具备的众多功能之一,全部整合在一个模型中。

使用Claude 3.7 Sonnet,您甚至可以通过“可见草稿板”看到它如何规划答案。大多数时候,您可以看到整个过程,但出于安全原因,Anthropic可能会对某些部分进行编辑。

Claude在claude应用中的思考过程 图片来源:Anthropic
Anthropic表示,他们已针对现实世界的任务(如复杂的编码问题或需要一定自主性的任务)优化了Claude的思考模式。如果您是使用Anthropic API的开发者,您甚至可以控制Claude的“思考”程度,在速度、成本和答案质量之间找到平衡。

在一些测试中,Claude 3.7 Sonnet表现出色。在SWE-Bench(一项针对现实世界编码任务的测试)中,它得分62.3%,超过了OpenAI的o3-mini(49.3%)。在TAU-Bench(衡量AI在零售环境中与模拟用户和外部API交互能力的测试)中,Claude 3.7 Sonnet得分81.2%,而OpenAI的o1模型得分为73.5%。

Anthropic还表示,Claude 3.7 Sonnet拒绝回答问题的可能性更低,能更细致地区分有害和无害的提示。与Claude 3.5 Sonnet相比,其不必要的拒绝率降低了45%。

与Claude 3.7 Sonnet一起,Anthropic还推出了一款名为Claude Code的新工具。这是一个研究预览版,允许开发者直接从终端通过Claude运行特定任务。在演示中,Anthropic展示了Claude Code如何通过简单的命令(如“解释这个项目结构”)分析编码项目。您甚至可以用普通英语修改代码库,Claude Code会在修改时描述其编辑内容,测试错误,并将项目推送到GitHub仓库。

Claude Code将以“先到先得”的方式向有限数量的用户开放。

Anthropic在AI实验室不断推出新模型的时刻发布了Claude 3.7 Sonnet。虽然Anthropic通常采取更为谨慎、以安全为重点的策略,但这次他们希望引领潮流。但他们能领先多久无人知晓——尤其是OpenAI的CEO Sam Altman表示,他们自己的混合AI模型将在“几个月”内推出。

相关文章
AI驱动的零售实验在Anthropic惨败 AI驱动的零售实验在Anthropic惨败 想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:
Anthropic增强Claude的无缝工具集成和高级研究 Anthropic增强Claude的无缝工具集成和高级研究 Anthropic为Claude推出了全新的“集成”功能,使AI能够直接与您首选的工作工具连接。公司还引入了升级的“高级研究”功能,以提供更深入的见解。集成功能简化了Anthropic去年推出的技术标准——模型上下文协议(MCP),使其更加用户友好。之前复杂且局限于本地,现在允许开发者为Claude创建与网页或桌面应用的 secure 连接。对于Claude用户来说,这意味着与流行工作软件的无缝集
人类学家律师在克劳德幻觉引用法律条文后道歉 人类学家律师在克劳德幻觉引用法律条文后道歉 近日,代表 Anthropic 的一名律师承认,在其与音乐出版商的法律纠纷中,使用了该公司旗下克劳德(Claude)聊天机器人生成的一个错误引用。这一承认是通过周四在加州北部法院提交的一份法庭文件作出的。根据彭博社的首次报道,Anthropic 在文件中表示,克劳德生成的引用不仅标题错误,作者信息也有误。公司律师承认,他们常规的引用检查未能发现这一错误,以及
评论 (53)
0/200
ChristopherDavis
ChristopherDavis 2025-08-06 03:00:59

Claude 3.7 Sonnet a l'air incroyable ! Pouvoir choisir la durée de réflexion, c'est comme demander à un chef de cuisiner vite ou de prendre son temps pour un plat parfait. J'ai hâte de voir comment ça marche en pratique ! 😄

WillieAdams
WillieAdams 2025-08-01 14:08:50

Claude's customizable thinking duration sounds like a game-changer! I wonder how it balances speed and depth in real-world tasks. Excited to try it out! 😄

ScarlettWhite
ScarlettWhite 2025-07-23 12:59:47

Wow, Claude 3.7 sounds like a game-changer! Being able to tweak how long it thinks is such a cool feature. I’m curious how this will stack up against other AI models in real-world tasks. Anyone tried it yet? 😄

CharlesRoberts
CharlesRoberts 2025-04-23 22:11:54

O Claude 3.7 Sonnet é incrível! Adoro poder escolher a duração do pensamento. Às vezes preciso de respostas rápidas, outras vezes quero respostas mais pensadas. É como ter um amigo AI personalizável! Só desejo que fosse um pouco mais rápido às vezes. 😎

RyanAnderson
RyanAnderson 2025-04-22 22:04:41

Claude 3.7 Sonnet is a game-changer! I love how I can choose the thinking duration. Sometimes I need quick answers, and other times I want a more thoughtful response. It's like having a customizable AI buddy! Only wish it was a bit faster at times. 🤓

GeorgeJones
GeorgeJones 2025-04-20 22:55:00

클로드 3.7 소넷 정말 멋지네요! 생각하는 시간을 직접 설정할 수 있다니, 너무 편리해요. 급할 때도, 천천히 생각해줬으면 할 때도 잘 맞춰줘서 좋습니다. 다만, 최대思考時間으로 설정하면 조금 느려지는 게 단점이네요. 그래도 유용한 도구입니다! 😄

返回顶部
OR