克劳德 4 人工智能在编码和逻辑推理任务中胜过前人
Anthropic 推出了下一代克劳德人工智能模型--克劳德 Opus 4 和克劳德 Sonnet 4--代表了混合推理能力的重大进步,特别是在编程应用和复杂问题解决场景方面。
Claude Opus 4 被定位为 Anthropic 迄今最复杂的人工智能,通过长时间连续执行要求苛刻的任务,展示了前所未有的耐力。在内部评估中,该模型成功地保持了连续七个小时的自主运行--这是一个里程碑,极大地增强了人工智能代理的能力。Anthropic 声称自己在编码能力方面处于领先地位,基准测试结果表明 Opus 4 在编程任务和工具使用(如网络搜索)方面都超过了竞争对手的模型,包括谷歌的 Gemini 2.5 Pro、OpenAI 的 o3 推理系统和 GPT-4.1。
对于优先考虑成本效益的用户,Claude Sonnet 4 提供了一个优化的解决方案,取代了二月份的 3.7 版本。该版本增强了编程和逻辑推理性能,提高了响应精度。这两款新机型在任务执行方法上都有大幅改进--走捷径的可能性降低了 65%,在允许访问文件系统时,通过高级内存保留功能,可更好地进行长时间操作。

*性能指标代表 Anthropic 的内部基准 - 建议进行独立验证*可视化 :AnthropicClaude 4 系列引入了创新的 "思考摘要",将复杂的推理过程提炼为易于理解的见解。实验性的 "扩展思维 "切换允许在分析推理和工具辅助模式之间动态切换,以提高输出质量和精确度。
企业和开发人员可通过Anthropic的API、亚马逊Bedrock和谷歌云Vertex人工智能平台访问这两个模型。Claude 付费计划的用户可以访问包括扩展思维测试版在内的所有功能,而免费用户目前只能访问 Sonnet 4 功能。
作为这些版本的补充,Anthropic 在成功进行测试版测试后,将其 Claude Code agentic 命令行工具推向了全面可用性。该公司表示,随着主要人工智能开发商之间竞争的加剧,公司计划加快更新速度。
相关文章
Duolingo面临新竞争,谷歌将语言学习功能整合至翻译服务
谷歌正将人工智能驱动的语言学习工具直接引入其翻译应用。这项新测试功能可根据用户语言水平和具体目标(如准备国际旅行)定制个性化课程。初期该工具将为英语使用者提供西班牙语和法语学习支持,同时帮助西班牙语、法语及葡萄牙语使用者练习英语。点击应用内新增的"练习"按钮,即可设置技能等级并定义学习目标,还可从职场场景、日常生活、亲友社交等常用情境中选择练习内容。基于您的输入,谷歌Gemini人工智能模型将定制
EcoFlow推出面向美国家庭的插电式太阳能发电系统
美国现正推出EcoFlow的DIY阳台太阳能系统,该产品此前已在欧洲市场亮相。EcoFlow宣称其Stream系列将成为国内首款即插即用的太阳能产品,让业主和租户轻松降低能源账单,同时在电网断电时提供备用电源。不过该系统初期仅在犹他州发售,当地法规现已允许阳台太阳能设备直接连接标准120V插座——无需签订复杂昂贵的电网并网协议。EcoFlow澄清无需等待联邦《国家电气规范》认证或UL产品安全标准认
谷歌为开发者推出Gemini命令行界面
谷歌推出了一款全新的开源AI代理工具,将Gemini的编程、内容生成和研究能力直接引入开发者终端。这款名为Gemini CLI的工具被谷歌称为"命令行体验的根本性升级",开发者可通过简单自然的语言提示进行代码编写和调试。谷歌在公告中强调:"该工具提供轻量级访问Gemini的通道,开辟从提示语到模型最直接的路径。虽然编码能力卓越,但我们设计Gemini CLI的初衷远不止于此——它是一款多功能本地工
相关专题推荐
评论 (3)
0/500
이 글 보고 프로그래머 친구한테 AI 코딩 도구 점점 더 무서워진다며 얘기했어요. 혹시 개발자 일자리에 미치는 영향이 클까? 그리고 Claude가 코딩에서 '성과'를 넘긴다는 건 구체적으로 어떤 테스트 기준에서 그런 거죠? 재미있는 주제지만 좀 두렵네요 ㅜㅜ
Ces avancées en programmation sont impressionnantes, mais je me demande si cette course à l'IA ne va pas créer une bulle technologique ? 🧐 Les modèles deviennent tellement complexes qu'on risque de perdre le contrôle sur leurs décisions...
Anthropic 推出了下一代克劳德人工智能模型--克劳德 Opus 4 和克劳德 Sonnet 4--代表了混合推理能力的重大进步,特别是在编程应用和复杂问题解决场景方面。
Claude Opus 4 被定位为 Anthropic 迄今最复杂的人工智能,通过长时间连续执行要求苛刻的任务,展示了前所未有的耐力。在内部评估中,该模型成功地保持了连续七个小时的自主运行--这是一个里程碑,极大地增强了人工智能代理的能力。Anthropic 声称自己在编码能力方面处于领先地位,基准测试结果表明 Opus 4 在编程任务和工具使用(如网络搜索)方面都超过了竞争对手的模型,包括谷歌的 Gemini 2.5 Pro、OpenAI 的 o3 推理系统和 GPT-4.1。
对于优先考虑成本效益的用户,Claude Sonnet 4 提供了一个优化的解决方案,取代了二月份的 3.7 版本。该版本增强了编程和逻辑推理性能,提高了响应精度。这两款新机型在任务执行方法上都有大幅改进--走捷径的可能性降低了 65%,在允许访问文件系统时,通过高级内存保留功能,可更好地进行长时间操作。

Claude 4 系列引入了创新的 "思考摘要",将复杂的推理过程提炼为易于理解的见解。实验性的 "扩展思维 "切换允许在分析推理和工具辅助模式之间动态切换,以提高输出质量和精确度。
企业和开发人员可通过Anthropic的API、亚马逊Bedrock和谷歌云Vertex人工智能平台访问这两个模型。Claude 付费计划的用户可以访问包括扩展思维测试版在内的所有功能,而免费用户目前只能访问 Sonnet 4 功能。
作为这些版本的补充,Anthropic 在成功进行测试版测试后,将其 Claude Code agentic 命令行工具推向了全面可用性。该公司表示,随着主要人工智能开发商之间竞争的加剧,公司计划加快更新速度。
Duolingo面临新竞争,谷歌将语言学习功能整合至翻译服务
谷歌正将人工智能驱动的语言学习工具直接引入其翻译应用。这项新测试功能可根据用户语言水平和具体目标(如准备国际旅行)定制个性化课程。初期该工具将为英语使用者提供西班牙语和法语学习支持,同时帮助西班牙语、法语及葡萄牙语使用者练习英语。点击应用内新增的"练习"按钮,即可设置技能等级并定义学习目标,还可从职场场景、日常生活、亲友社交等常用情境中选择练习内容。基于您的输入,谷歌Gemini人工智能模型将定制
EcoFlow推出面向美国家庭的插电式太阳能发电系统
美国现正推出EcoFlow的DIY阳台太阳能系统,该产品此前已在欧洲市场亮相。EcoFlow宣称其Stream系列将成为国内首款即插即用的太阳能产品,让业主和租户轻松降低能源账单,同时在电网断电时提供备用电源。不过该系统初期仅在犹他州发售,当地法规现已允许阳台太阳能设备直接连接标准120V插座——无需签订复杂昂贵的电网并网协议。EcoFlow澄清无需等待联邦《国家电气规范》认证或UL产品安全标准认
谷歌为开发者推出Gemini命令行界面
谷歌推出了一款全新的开源AI代理工具,将Gemini的编程、内容生成和研究能力直接引入开发者终端。这款名为Gemini CLI的工具被谷歌称为"命令行体验的根本性升级",开发者可通过简单自然的语言提示进行代码编写和调试。谷歌在公告中强调:"该工具提供轻量级访问Gemini的通道,开辟从提示语到模型最直接的路径。虽然编码能力卓越,但我们设计Gemini CLI的初衷远不止于此——它是一款多功能本地工
이 글 보고 프로그래머 친구한테 AI 코딩 도구 점점 더 무서워진다며 얘기했어요. 혹시 개발자 일자리에 미치는 영향이 클까? 그리고 Claude가 코딩에서 '성과'를 넘긴다는 건 구체적으로 어떤 테스트 기준에서 그런 거죠? 재미있는 주제지만 좀 두렵네요 ㅜㅜ
Ces avancées en programmation sont impressionnantes, mais je me demande si cette course à l'IA ne va pas créer une bulle technologique ? 🧐 Les modèles deviennent tellement complexes qu'on risque de perdre le contrôle sur leurs décisions...





首页






