克劳德 4 人工智能在编码和逻辑推理任务中胜过前人
Anthropic 推出了下一代克劳德人工智能模型--克劳德 Opus 4 和克劳德 Sonnet 4--代表了混合推理能力的重大进步,特别是在编程应用和复杂问题解决场景方面。
Claude Opus 4 被定位为 Anthropic 迄今最复杂的人工智能,通过长时间连续执行要求苛刻的任务,展示了前所未有的耐力。在内部评估中,该模型成功地保持了连续七个小时的自主运行--这是一个里程碑,极大地增强了人工智能代理的能力。Anthropic 声称自己在编码能力方面处于领先地位,基准测试结果表明 Opus 4 在编程任务和工具使用(如网络搜索)方面都超过了竞争对手的模型,包括谷歌的 Gemini 2.5 Pro、OpenAI 的 o3 推理系统和 GPT-4.1。
对于优先考虑成本效益的用户,Claude Sonnet 4 提供了一个优化的解决方案,取代了二月份的 3.7 版本。该版本增强了编程和逻辑推理性能,提高了响应精度。这两款新机型在任务执行方法上都有大幅改进--走捷径的可能性降低了 65%,在允许访问文件系统时,通过高级内存保留功能,可更好地进行长时间操作。

*性能指标代表 Anthropic 的内部基准 - 建议进行独立验证*可视化 :AnthropicClaude 4 系列引入了创新的 "思考摘要",将复杂的推理过程提炼为易于理解的见解。实验性的 "扩展思维 "切换允许在分析推理和工具辅助模式之间动态切换,以提高输出质量和精确度。
企业和开发人员可通过Anthropic的API、亚马逊Bedrock和谷歌云Vertex人工智能平台访问这两个模型。Claude 付费计划的用户可以访问包括扩展思维测试版在内的所有功能,而免费用户目前只能访问 Sonnet 4 功能。
作为这些版本的补充,Anthropic 在成功进行测试版测试后,将其 Claude Code agentic 命令行工具推向了全面可用性。该公司表示,随着主要人工智能开发商之间竞争的加剧,公司计划加快更新速度。
相关文章
ChatGPT 添加了 Google Drive 和 Dropbox 集成,用于文件访问
ChatGPT 通过新的企业功能提高生产力OpenAI 推出两项强大的新功能,将 ChatGPT 转变为全面的企业生产力工具:自动会议记录和无缝云存储集成。革命性的记录功能新推出的 "记录模式 "可自动转录和分析以下内容:重要的商务会议创造性的头脑风暴会议 个人思维过程这一高级功能目前仅面向 ChatGPT 团队用户(每用户每月 25 美元),可提供准确、有时间戳的记
谷歌推出人工智能虚拟试衣功能
谷歌正在通过一种先进的虚拟试穿体验彻底改变网上购物,这种体验超越了标准的模特图像。这项创新功能目前已在搜索实验室中面向美国用户推出,购物者可以上传个人照片,并在自己的身体上可视化服装,准确度极高。如何使用GIF:谷歌选择加入实验后,用户只需点击服装搜索结果旁边的 "试穿 "按钮上传一张全身照片接收人工智能生成的自己穿着所选服装的图像复杂的人工智能模型会考虑身体定位、面料特性以及不同材料与不同体型的
苹果计划开放本地人工智能模型供第三方应用集成
苹果将向开发者开放人工智能模型据彭博社消息,科技巨头苹果公司正准备向开发者开放支持其苹果智能功能的核心人工智能技术。据报道,在今天的谷歌 I/O 大会上,谷歌将推出 Gemini Nano AI API,该公司计划首先发布一个 SDK,允许开发者访问其较小的、设备上的大型语言模型,这与谷歌的做法如出一辙。开发者访问详情初期推广将侧重于设备上的小型模型基于云的模型不会立即推出现有 A
评论 (0)
0/200
Anthropic 推出了下一代克劳德人工智能模型--克劳德 Opus 4 和克劳德 Sonnet 4--代表了混合推理能力的重大进步,特别是在编程应用和复杂问题解决场景方面。
Claude Opus 4 被定位为 Anthropic 迄今最复杂的人工智能,通过长时间连续执行要求苛刻的任务,展示了前所未有的耐力。在内部评估中,该模型成功地保持了连续七个小时的自主运行--这是一个里程碑,极大地增强了人工智能代理的能力。Anthropic 声称自己在编码能力方面处于领先地位,基准测试结果表明 Opus 4 在编程任务和工具使用(如网络搜索)方面都超过了竞争对手的模型,包括谷歌的 Gemini 2.5 Pro、OpenAI 的 o3 推理系统和 GPT-4.1。
对于优先考虑成本效益的用户,Claude Sonnet 4 提供了一个优化的解决方案,取代了二月份的 3.7 版本。该版本增强了编程和逻辑推理性能,提高了响应精度。这两款新机型在任务执行方法上都有大幅改进--走捷径的可能性降低了 65%,在允许访问文件系统时,通过高级内存保留功能,可更好地进行长时间操作。

Claude 4 系列引入了创新的 "思考摘要",将复杂的推理过程提炼为易于理解的见解。实验性的 "扩展思维 "切换允许在分析推理和工具辅助模式之间动态切换,以提高输出质量和精确度。
企业和开发人员可通过Anthropic的API、亚马逊Bedrock和谷歌云Vertex人工智能平台访问这两个模型。Claude 付费计划的用户可以访问包括扩展思维测试版在内的所有功能,而免费用户目前只能访问 Sonnet 4 功能。
作为这些版本的补充,Anthropic 在成功进行测试版测试后,将其 Claude Code agentic 命令行工具推向了全面可用性。该公司表示,随着主要人工智能开发商之间竞争的加剧,公司计划加快更新速度。












