Anthropic的最新Claude模型成为潜在的AI领导者:这是如何测试它的方法
Anthropic的最新AI模型,Claude 3.7 Sonnet,以其更长时间、更深入的“思考”能力掀起波澜,为用户提供更细致入微的查询处理方式。此模型不仅是升级,而是AI世界的变革者,融合即时响应与扩展思考能力,满足广泛需求。
Claude 3.7 Sonnet引入混合推理模型,可在普通模式下提供快速简洁的回答,在扩展模式下进行更深入的分析。这种灵活性使其适用于从日常问题到复杂数学和编码挑战的各种场景。若你正在进行编码项目或需解决棘手的数学问题,切换到扩展模式可提供详细解决方案,包含逐步说明。
成本与可访问性
Claude 3.7 Sonnet的基础功能对所有用户开放,但使用扩展模式需订阅Pro或Team计划。这是一项投资,但对于需要额外处理能力的用户来说,值得一试。你可通过Claude网站或开发者API访问此模式,适用于个人和专业用途。
性能与测试
在早期测试中,Claude 3.7 Sonnet表现出显著改进,尤其在处理复杂代码库和高级工具方面。用户成功使用它从零开始构建复杂的Web应用和仪表板,这些任务之前曾难倒其他模型。新模型生成更少错误的量产代码,证明了其增强能力。
在与OpenAI的o1等竞争对手的测试中,Claude 3.7 Sonnet在涉及代理工具和软件工程的测试中脱颖而出。Anthropic将推理能力整合到单一模型而非分散到不同模型的做法,使Claude与众不同,创造更无缝的用户体验。
如何使用Claude 3.7 Sonnet
若你是Pro或Team订阅者,可通过访问网站,从模型下拉菜单选择Claude 3.7 Sonnet,并将思考模式切换到扩展模式,体验Claude的扩展模式。无论你要求Claude创建比较不同AI模型的网页还是解决复杂数学问题,你都能看到过程的每一步。请注意,Claude的知识仅更新至2024年10月,之后实时事件无法知晓。
对于不太复杂的任务,使用普通模式可获得更快、更简洁的回答。关键是选择适合任务的工具。
开发者Claude Code
开发者可使用Claude Code这一命令行工具进行代理编码,目前为有限研究预览版。Claude Code允许开发者直接从终端分配复杂工程任务。它可搜索和读取代码、编辑文件、运行测试,甚至将代码提交并推送至GitHub。早期测试显示,Claude Code能一次性完成原本需超过45分钟手动劳动的任务。
未来几周,Anthropic计划增加功能,如提升工具调用可靠性、支持长时间运行命令、改进应用内渲染。想尝试Claude Code的开发者可在Overview网站加入候补名单,其反馈将帮助塑造工具的未来发展。

Lance Whitney/ZDNET截图
相关文章
英国各政府部门就人工智能数据中心的能源需求问题发生争执
英国政府正面临一项重大挑战:在推动清洁能源发展的同时,力争成为人工智能领域的全球领导者。然而,负责实现这些目标的各部门之间却存在严重分歧。 科学、创新与技术部(DSIT)与能源安全与净零部(DESNZ)对人工智能数据中心的未来电力需求做出了截然不同的预测。DSIT预测,到2030年,人工智能数据中心将需要6吉瓦的电力,而DESNZ的估计则不到这一数字的十分之一。 这一差距引起了非营利组织Foxgl
中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注
中国国家互联网信息办公室出台了一项全面计划,旨在规范短视频内容标注,要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题,监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上,现已将内容标注作为短视频发布流程中的强制性环节。 发布者必须从六种选项中选择其一:“虚构演绎”、“AI生成”、“含营销信息”
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech
相关专题推荐
评论 (2)
0/500
Interesting! The 'extended thinking' feature sounds like it could really help with complex tasks, but I wonder how it impacts response time in real-time applications. The AI race is getting wild – feels like every month there's a new 'game-changer' 😅 Still, keen to see how this stacks up against GPT-4o for my coding projects.
Anthropic的最新AI模型,Claude 3.7 Sonnet,以其更长时间、更深入的“思考”能力掀起波澜,为用户提供更细致入微的查询处理方式。此模型不仅是升级,而是AI世界的变革者,融合即时响应与扩展思考能力,满足广泛需求。
Claude 3.7 Sonnet引入混合推理模型,可在普通模式下提供快速简洁的回答,在扩展模式下进行更深入的分析。这种灵活性使其适用于从日常问题到复杂数学和编码挑战的各种场景。若你正在进行编码项目或需解决棘手的数学问题,切换到扩展模式可提供详细解决方案,包含逐步说明。
成本与可访问性
Claude 3.7 Sonnet的基础功能对所有用户开放,但使用扩展模式需订阅Pro或Team计划。这是一项投资,但对于需要额外处理能力的用户来说,值得一试。你可通过Claude网站或开发者API访问此模式,适用于个人和专业用途。
性能与测试
在早期测试中,Claude 3.7 Sonnet表现出显著改进,尤其在处理复杂代码库和高级工具方面。用户成功使用它从零开始构建复杂的Web应用和仪表板,这些任务之前曾难倒其他模型。新模型生成更少错误的量产代码,证明了其增强能力。
在与OpenAI的o1等竞争对手的测试中,Claude 3.7 Sonnet在涉及代理工具和软件工程的测试中脱颖而出。Anthropic将推理能力整合到单一模型而非分散到不同模型的做法,使Claude与众不同,创造更无缝的用户体验。
如何使用Claude 3.7 Sonnet
若你是Pro或Team订阅者,可通过访问网站,从模型下拉菜单选择Claude 3.7 Sonnet,并将思考模式切换到扩展模式,体验Claude的扩展模式。无论你要求Claude创建比较不同AI模型的网页还是解决复杂数学问题,你都能看到过程的每一步。请注意,Claude的知识仅更新至2024年10月,之后实时事件无法知晓。
对于不太复杂的任务,使用普通模式可获得更快、更简洁的回答。关键是选择适合任务的工具。
开发者Claude Code
开发者可使用Claude Code这一命令行工具进行代理编码,目前为有限研究预览版。Claude Code允许开发者直接从终端分配复杂工程任务。它可搜索和读取代码、编辑文件、运行测试,甚至将代码提交并推送至GitHub。早期测试显示,Claude Code能一次性完成原本需超过45分钟手动劳动的任务。
未来几周,Anthropic计划增加功能,如提升工具调用可靠性、支持长时间运行命令、改进应用内渲染。想尝试Claude Code的开发者可在Overview网站加入候补名单,其反馈将帮助塑造工具的未来发展。
英国各政府部门就人工智能数据中心的能源需求问题发生争执
英国政府正面临一项重大挑战:在推动清洁能源发展的同时,力争成为人工智能领域的全球领导者。然而,负责实现这些目标的各部门之间却存在严重分歧。 科学、创新与技术部(DSIT)与能源安全与净零部(DESNZ)对人工智能数据中心的未来电力需求做出了截然不同的预测。DSIT预测,到2030年,人工智能数据中心将需要6吉瓦的电力,而DESNZ的估计则不到这一数字的十分之一。 这一差距引起了非营利组织Foxgl
中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注
中国国家互联网信息办公室出台了一项全面计划,旨在规范短视频内容标注,要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题,监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上,现已将内容标注作为短视频发布流程中的强制性环节。 发布者必须从六种选项中选择其一:“虚构演绎”、“AI生成”、“含营销信息”
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech
Interesting! The 'extended thinking' feature sounds like it could really help with complex tasks, but I wonder how it impacts response time in real-time applications. The AI race is getting wild – feels like every month there's a new 'game-changer' 😅 Still, keen to see how this stacks up against GPT-4o for my coding projects.





首页






