选项
首页
新闻
人类揭示其最聪明的“混合推理” AI模型

人类揭示其最聪明的“混合推理” AI模型

2025-06-02
41

Anthropic 刚刚发布了 Claude 3.7 Sonnet,标志着其首个人工智能“混合推理模型”的亮相。这一突破性模型旨在应对更复杂的挑战,在数学和编码等任务上超越了早期版本。

为了配合这一进步,Anthropic 还推出了 Claude Code 的“有限研究预览”,这是一款智能编码工具。虽然 Anthropic 已经为 AI 编码解决方案(如 Cursor)提供支持,但 Claude Code 被定位为一个交互式伙伴,能够搜索和阅读代码、修改文件、编写和运行测试、将代码推送到 GitHub,并使用命令行工具。

Claude 3.7 Sonnet 将于周一在 Claude 应用程序以及 Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上正式可用。定价与其前身 3.5 Sonnet 保持一致,输入每百万 token 为 3 美元,输出每百万 token 为 15 美元。

与 OpenAI 等竞争对手提供独立推理模型不同,Anthropic 强调将推理能力直接集成到模型本身中。正如 Anthropic 的产品研究负责人 Dianne Penn 在接受《The Verge》采访时解释道:“我们坚信推理是 AI 的一项功能,而不是完全独立的东西。”例如,Claude 在处理简单查询如“现在是星期几?”时不会遇到太多困难,但在处理复杂提示(如规划两周的意大利旅行并考虑天气条件)时表现出色。

Claude 的最新模型卡。Anthropic
Claude 的软件工程性能。Anthropic
Penn 指出,Claude 3.7 Sonnet 在智能编码、财务和法律事务方面表现出显著改进。虽然 Claude 尚未支持实时网络搜索——这是其他模型已具备的功能——但其知识截止日期为 2024 年 10 月,信息更加新颖。开发者可以通过其 scratchpad 功能影响模型的运行方式,并指定精确的响应时间。Anthropic 的产品副总裁 Michael Gerstenhaber 表示:“有时候,开发者只需指明回答这个问题不应超过 200 毫秒,”这凸显了一个战略性的产品决策。

在内部,Anthropic 员工已使用新模型设计前端网站界面、创建交互式游戏,并进行长达 45 分钟的编码活动,例如构建测试集和迭代优化测试用例,Penn 说道。

Claude 代码的截图。
Claude Code. Anthropic

Penn 提到,Anthropic 通过让模型玩一款老式 Pokémon 视频游戏来评估其能力,将模型的 API 映射到控制器界面。虽然 Claude 3.5 Sonnet 最初难以离开 Pallet Town,但 Claude 3.7 已成功击败了多个道馆馆主。

Elon Musk 上周发布的 Grok-3 凸显了 AI 模型竞争的快速发展。目前,凭借 Claude 3.7 Sonnet 的出色表现,Anthropic 暂时领先。其发布预示着一个未来,单一模型将能处理所有任务,而无需为不同功能使用专门工具。

相关文章
经过法律诉讼,Pebble 重新获得了原品牌名称 经过法律诉讼,Pebble 重新获得了原品牌名称 鹅卵石的回归名称与一切Pebble 的爱好者们可以欢呼雀跃了--这个备受喜爱的智能手表品牌不仅卷土重来,还夺回了自己的标志性名称。"Core Devices 公司首席执行官 Eric Migicovsky 在公司博客更新中透露:"我们已经成功地重新获得了 Pebble 商标,其顺利程度着实让我感到惊讶。这意味着之前发布的 Core 2 Duo 现在将正式命名为 Pebble 2 Duo,而 Cor
Midjourney 推出用于创意内容的尖端人工智能视频生成器 Midjourney 推出用于创意内容的尖端人工智能视频生成器 Midjourney 的人工智能视频生成技术取得突破性进展Midjourney 发布了其首款人工智能视频生成工具,标志着其在著名的图像创建功能之外的重大扩展。最初的版本使用户能够将上传的图片和平台生成的作品转换成简短的 5 秒钟动画短片,并计划在未来进行增强。核心特点和功能直观的 "动画 "按钮,可将静态图像转换为动态图像根据文本提示生成 5 秒钟的基本视频通过手动提示编辑进行自定义动作控制视频扩
谷歌提前正式发布 Pixel 10 智能手机,遏制泄密行为 谷歌提前正式发布 Pixel 10 智能手机,遏制泄密行为 谷歌(Google)正在向粉丝们展示其即将推出的 Pixel 10 智能手机阵容,并在 8 月 20 日发布会前几周展示了官方设计。谷歌网站上的一段宣传视频展示了一款时尚的灰蓝色设备,它配备了三后置摄像头、LED 闪光灯和温度传感器--这是之前 Pro 机型独有的功能。虽然谷歌只是简单地将其命名为 "Pixel 10",但其设计与泄露的高端 Pro 机型的渲染图非常吻合。这已经不是谷歌第一次提前发
评论 (1)
0/200
JoeCarter
JoeCarter 2025-08-14 13:00:59

This new Claude 3.7 sounds wild! 🤯 Hybrid reasoning? That's like giving AI a supercharged brain for math and coding. Can't wait to see how it stacks up against others in real-world tasks.

返回顶部
OR