Claude 4发布:下一代AI模型提升编码和代理性能
Anthropic推出了Claude 4模型系列,为开发人员打造尖端AI助手和编码解决方案带来了重大进步。该系列包括Claude Opus 4,顶级性能模型,以及Claude Sonnet 4,适用于多种应用的通用模型。
Anthropic对其目标充满信心,强调这些模型旨在“全面提升客户的AI策略”。Opus 4定位于“编码、研究、写作和科学探索”的领导者,而Sonnet 4被描述为“从Sonnet 3.7的重大升级”,为日常任务提供“顶级性能”。
Claude Opus 4:顶级编码模型
Anthropic宣称Claude Opus 4是“迄今为止最先进的模型,也是全球领先的编码模型”,其在SWE-bench上获得72.5%的分数,在Terminal-bench上获得43.2%的分数支持了这一说法。
除了速度,Opus 4在持久性方面表现出色,专为“需要专注努力和数千步骤的长时间任务保持一致性能”而设计。想象一个能够“持续工作数小时”的AI——这是Anthropic的承诺。
这比早期的Sonnet模型有了显著飞跃,可能通过应对需要持续努力的挑战重新定义AI代理的范围。
Claude Sonnet 4:日常使用的多功能AI
虽然Opus 4是旗舰产品,但Claude Sonnet 4作为一个动态的通用模型脱颖而出,在广泛的应用中提供了显著的改进。早期用户的初步反馈非常积极。
例如,GitHub指出,“Claude Sonnet 4在代理场景中表现出色”,他们对其印象深刻,计划“将其作为GitHub Copilot中新编码代理的基础”。这是一个强有力的认可。
技术分析师Manus称赞其“增强的遵循复杂指令、提供清晰推理和生成精美输出的能力”。
iGent报告称,Sonnet 4“在自主多功能应用开发中表现出色,问题解决能力显著提高,导航错误从20%降至几乎为零”。这对开发工作流程来说是一个重大胜利。
Sourcegraph认为这是“软件开发的重大进步,能够更长时间保持专注,更深入理解问题,并交付更干净的代码”。
Augment Code强调“更高的成功率、精确的代码编辑以及对复杂任务的细致处理”,使Sonnet 4成为他们的“首选主要模型”。
混合模式和开发者工具
Claude 4系列的一个突出特点是其双模式能力。Opus 4和Sonnet 4均提供快速任务的快速响应和复杂挑战的深入推理模式。
这种高级推理模式包含在Pro、Max、Team和Enterprise Claude计划中。令人兴奋的是,Sonnet 4的增强推理模式也将对免费用户开放,扩大了高质量AI的访问范围。
Anthropic还通过其API引入了强大的开发者工具,以加速高级AI代理的开发:
- 代码执行工具:使模型能够运行代码,为交互式和问题解决应用开启新的可能性。
- MCP连接器:Anthropic的新标准,用于AI助手和软件环境之间的无缝上下文交换。
- Files API:简化直接文件交互,这是实际任务的关键功能。
- 提示缓存:允许开发者缓存提示长达一小时,提升频繁查询的速度和效率。
在现实世界应用中的顶级性能
Anthropic强调,其“Claude 4模型在SWE-bench Verified基准测试中领先,该基准用于现实世界的软件工程任务”。除了编码,它们还在“推理、多模态能力和代理任务”中表现出色。

尽管有这些进步,Anthropic保持了一致的定价。Claude Opus 4的费用为每百万输入令牌15美元,每百万输出令牌75美元。Claude Sonnet 4是更经济实惠的选择,定价为每百万输入令牌3美元,每百万输出令牌15美元,这对现有用户来说是个好消息。
这两种模型均通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI提供,使全球开发者和企业能够无缝整合它们。
Anthropic显然专注于增强AI能力,特别是在复杂编码和自主代理任务方面。凭借这些模型和工具,创新潜力已显著提升。
另见:Jony Ive的OpenAI设备细节浮出水面
在阿姆斯特丹、加利福尼亚和伦敦的AI & Big Data Expo上,从行业专家那里了解更多关于AI和大数据的信息。该活动与Intelligent Automation Conference、BlockX、Digital Transformation Week和Cyber Security & Cloud Expo同期举行。
查看TechForge的其他即将举办的企业技术活动和网络研讨会。
相关文章
Hugging Face推出Reachy Mini桌面机器人预订
Hugging Face邀请开发者探索其最新的机器人创新。该AI平台于周三宣布,现已开始接受Reachy Mini桌面机器人的预订。该公司于5月首次展示了这些设备的原型,同时还有一个更大的类人机器人HopeJR。Hugging Face将提供两种Reachy Mini型号。Reachy Mini Wireless,定价为449美元,基于Raspberry 5迷你计算机运行,无需电缆。Reachy
英伟达的新款AI芯片面对华为在中国市场的崛起
英伟达正准备与华为竞争,以保持其在中国蓬勃发展的AI芯片市场中的地位。英伟达即将推出的中国版AI芯片是一项大胆的战略举措,标志着其第三次努力遵守法规,同时应对激烈的国内竞争。尽管面临美国历届政府的地缘政治挑战,英伟达仍致力于中国市场。公司计划推出基于Blackwell的缩减版处理器,专门满足出口限制要求,并与先进的本地竞争对手,尤其是华为抗衡。出于必要的战略路透社消息来源称,英伟达的新芯片定价在6
人类学》杂志的贾里德-卡普兰探讨人工智能代理的未来
Anthropic 联合创始人兼首席科学官贾里德-卡普兰(Jared Kaplan)与 TechCrunch 高级记者麦克斯韦-泽夫(Maxwell Zeff)在 TechCrunch Sessions:AI 会议上讨论了人工智能界的一个热门话题:代理。卡普兰强调,聊天机器人仅仅是个开始,代理将重新定义人工智能能力的边界。卡普兰还谈到了Anthropic公司最近的发展,包括决定撤销初创公司Wind
评论 (0)
0/200
Anthropic推出了Claude 4模型系列,为开发人员打造尖端AI助手和编码解决方案带来了重大进步。该系列包括Claude Opus 4,顶级性能模型,以及Claude Sonnet 4,适用于多种应用的通用模型。
Anthropic对其目标充满信心,强调这些模型旨在“全面提升客户的AI策略”。Opus 4定位于“编码、研究、写作和科学探索”的领导者,而Sonnet 4被描述为“从Sonnet 3.7的重大升级”,为日常任务提供“顶级性能”。
Claude Opus 4:顶级编码模型
Anthropic宣称Claude Opus 4是“迄今为止最先进的模型,也是全球领先的编码模型”,其在SWE-bench上获得72.5%的分数,在Terminal-bench上获得43.2%的分数支持了这一说法。
除了速度,Opus 4在持久性方面表现出色,专为“需要专注努力和数千步骤的长时间任务保持一致性能”而设计。想象一个能够“持续工作数小时”的AI——这是Anthropic的承诺。
这比早期的Sonnet模型有了显著飞跃,可能通过应对需要持续努力的挑战重新定义AI代理的范围。
Claude Sonnet 4:日常使用的多功能AI
虽然Opus 4是旗舰产品,但Claude Sonnet 4作为一个动态的通用模型脱颖而出,在广泛的应用中提供了显著的改进。早期用户的初步反馈非常积极。
例如,GitHub指出,“Claude Sonnet 4在代理场景中表现出色”,他们对其印象深刻,计划“将其作为GitHub Copilot中新编码代理的基础”。这是一个强有力的认可。
技术分析师Manus称赞其“增强的遵循复杂指令、提供清晰推理和生成精美输出的能力”。
iGent报告称,Sonnet 4“在自主多功能应用开发中表现出色,问题解决能力显著提高,导航错误从20%降至几乎为零”。这对开发工作流程来说是一个重大胜利。
Sourcegraph认为这是“软件开发的重大进步,能够更长时间保持专注,更深入理解问题,并交付更干净的代码”。
Augment Code强调“更高的成功率、精确的代码编辑以及对复杂任务的细致处理”,使Sonnet 4成为他们的“首选主要模型”。
混合模式和开发者工具
Claude 4系列的一个突出特点是其双模式能力。Opus 4和Sonnet 4均提供快速任务的快速响应和复杂挑战的深入推理模式。
这种高级推理模式包含在Pro、Max、Team和Enterprise Claude计划中。令人兴奋的是,Sonnet 4的增强推理模式也将对免费用户开放,扩大了高质量AI的访问范围。
Anthropic还通过其API引入了强大的开发者工具,以加速高级AI代理的开发:
- 代码执行工具:使模型能够运行代码,为交互式和问题解决应用开启新的可能性。
- MCP连接器:Anthropic的新标准,用于AI助手和软件环境之间的无缝上下文交换。
- Files API:简化直接文件交互,这是实际任务的关键功能。
- 提示缓存:允许开发者缓存提示长达一小时,提升频繁查询的速度和效率。
在现实世界应用中的顶级性能
Anthropic强调,其“Claude 4模型在SWE-bench Verified基准测试中领先,该基准用于现实世界的软件工程任务”。除了编码,它们还在“推理、多模态能力和代理任务”中表现出色。

尽管有这些进步,Anthropic保持了一致的定价。Claude Opus 4的费用为每百万输入令牌15美元,每百万输出令牌75美元。Claude Sonnet 4是更经济实惠的选择,定价为每百万输入令牌3美元,每百万输出令牌15美元,这对现有用户来说是个好消息。
这两种模型均通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI提供,使全球开发者和企业能够无缝整合它们。
Anthropic显然专注于增强AI能力,特别是在复杂编码和自主代理任务方面。凭借这些模型和工具,创新潜力已显著提升。
另见:Jony Ive的OpenAI设备细节浮出水面
在阿姆斯特丹、加利福尼亚和伦敦的AI & Big Data Expo上,从行业专家那里了解更多关于AI和大数据的信息。该活动与Intelligent Automation Conference、BlockX、Digital Transformation Week和Cyber Security & Cloud Expo同期举行。
查看TechForge的其他即将举办的企业技术活动和网络研讨会。











