人类揭示其最聪明的“混合推理” AI模型
Anthropic刚刚宣布了Claude 3.7十四行诗,标志着其第一个“混合推理模型”的首次亮相。这种开创性的模型旨在应对更复杂的挑战,并在数学和编码等任务上超越早期的迭代。
为了补充这一进步,Anthropic还启动了Claude Code(代理编码工具)的“有限的研究预览”。虽然人类已经为光标等人AI编码解决方案提供了动力,但Claude代码被销售为一个交互式合作伙伴,能够搜索和读取代码,修改文件,编写和运行测试,将代码推向GitHub以及使用命令行工具。
Claude 3.7十四行诗将从周一的Claude应用程序开始,并通过Anthropic的API,Amazon Bedrock和Google Cloud的Vertex AI访问。定价与其前身3.5十四行诗保持一致,每百万美元投入令牌和每百万美元产出代币15美元。
与诸如OpenAI这样的竞争对手(提供不同的推理模型)不同,人类强调将推理能力直接整合到模型本身中。正如拟人化产品研究负责人戴安娜·佩恩(Dianne Penn)在《边缘》中解释的那样:“我们从根本上认为推理是AI的特征,而不是完全分开的东西。”例如,克劳德(Claude)不应该在直接的查询中挣扎太多,例如“现在几点?”但是在处理复杂的提示中,擅长于计划在天气条件下进行两周的意大利旅行。
人类
人类
宾夕法尼亚州指出,克劳德3.7十四行诗在代理编码,财务和法律事务方面表现出明显改善。尽管克劳德(Claude)尚未支持实时网络搜索(其他模型中存在的功能),但它拥有2024年10月的知识截止日期,使其更加最新。开发人员可以通过其SCRATCHPAD功能来影响模型的运作方式,并指定确切的响应时间。 “有时候,” Anthropic的产品副总裁Michael Gerstenhaber说,“开发人员只需要表明回答这个问题不应花费超过200毫秒的时间,”突出了战略性产品决策。
佩恩说,在内部,人类的员工利用新型号来设计前端网站界面,创建互动游戏,并最多进行45分钟的编码活动,例如建筑测试集和迭代的测试案例。

克劳德代码。人类
宾夕法尼亚州提到,拟人化可以通过导航老式的神奇宝贝视频游戏来评估其模型的功能,从而将模型的API映射到控制器接口。克劳德(Claude 3.5)十四行诗最初努力离开托盘镇时,克劳德3.7成功击败了几位体育馆领导人。
埃隆·马斯克(Elon Musk)最近在上周揭幕了Grok-3的揭幕,强调了AI模型竞赛的迅速步伐。就目前而言,由于克劳德3.7 SONNET令人印象深刻的表现,众人赛站在提前。它的发行暗示了一个未来,一个模型可以处理每个任务,而不是需要用于不同功能的专门工具。
相关文章
苹果用户可申请95百万美元Siri隐私和解赔偿
美国苹果设备用户现可申请95百万美元和解赔偿的一部分,以解决Siri隐私问题。一个专门的网站为在2014年9月17日至2024年12月31日期间,私人对话中意外触发Siri的用户提供资金分配服务。此和解源于2019年的一起集体诉讼,指控苹果未经用户同意,通过Siri监听对话并将其分享给第三方承包商进行质量控制,侵犯了用户隐私。苹果发表了道歉声明,承诺停止保留用户录音,并否认使用Siri数据进行定向
Meta 增强人工智能安全,推出高级 Llama 工具
Meta 发布了新的 Llama 安全工具,以加强人工智能开发并防御新兴威胁。这些升级的 Llama 人工智能模型安全工具与 Meta 的新资源相结合,旨在增强网络安全团队利用人工智能进行防御的能力,提升所有人工智能利益相关者的安全性。使用 Llama 模型的开发者现在可以直接在 Meta 的 Llama Protections 页面、Hugging Face 和 GitHub 上访问增强的工具。
NotebookLM推出顶级出版物和专家精选笔记本
谷歌正在增强其人工智能驱动的研究和笔记工具NotebookLM,使其成为一个综合知识中心。周一,该公司推出了一套由知名作者、出版物、研究人员和非营利组织精心策划的笔记本集合,使用户能够探索健康、旅行、财务等多样化主题。首批内容包括《经济学人》、《大西洋月刊》、知名教授、作者以及莎士比亚作品的贡献,展示了NotebookLM在深入主题探索中的实际应用。谷歌解释说,用户可以访问原始资料,提出问题,深入
评论 (0)
0/200
Anthropic刚刚宣布了Claude 3.7十四行诗,标志着其第一个“混合推理模型”的首次亮相。这种开创性的模型旨在应对更复杂的挑战,并在数学和编码等任务上超越早期的迭代。
为了补充这一进步,Anthropic还启动了Claude Code(代理编码工具)的“有限的研究预览”。虽然人类已经为光标等人AI编码解决方案提供了动力,但Claude代码被销售为一个交互式合作伙伴,能够搜索和读取代码,修改文件,编写和运行测试,将代码推向GitHub以及使用命令行工具。
Claude 3.7十四行诗将从周一的Claude应用程序开始,并通过Anthropic的API,Amazon Bedrock和Google Cloud的Vertex AI访问。定价与其前身3.5十四行诗保持一致,每百万美元投入令牌和每百万美元产出代币15美元。
与诸如OpenAI这样的竞争对手(提供不同的推理模型)不同,人类强调将推理能力直接整合到模型本身中。正如拟人化产品研究负责人戴安娜·佩恩(Dianne Penn)在《边缘》中解释的那样:“我们从根本上认为推理是AI的特征,而不是完全分开的东西。”例如,克劳德(Claude)不应该在直接的查询中挣扎太多,例如“现在几点?”但是在处理复杂的提示中,擅长于计划在天气条件下进行两周的意大利旅行。
人类
人类
宾夕法尼亚州指出,克劳德3.7十四行诗在代理编码,财务和法律事务方面表现出明显改善。尽管克劳德(Claude)尚未支持实时网络搜索(其他模型中存在的功能),但它拥有2024年10月的知识截止日期,使其更加最新。开发人员可以通过其SCRATCHPAD功能来影响模型的运作方式,并指定确切的响应时间。 “有时候,” Anthropic的产品副总裁Michael Gerstenhaber说,“开发人员只需要表明回答这个问题不应花费超过200毫秒的时间,”突出了战略性产品决策。
佩恩说,在内部,人类的员工利用新型号来设计前端网站界面,创建互动游戏,并最多进行45分钟的编码活动,例如建筑测试集和迭代的测试案例。
克劳德代码。人类
宾夕法尼亚州提到,拟人化可以通过导航老式的神奇宝贝视频游戏来评估其模型的功能,从而将模型的API映射到控制器接口。克劳德(Claude 3.5)十四行诗最初努力离开托盘镇时,克劳德3.7成功击败了几位体育馆领导人。
埃隆·马斯克(Elon Musk)最近在上周揭幕了Grok-3的揭幕,强调了AI模型竞赛的迅速步伐。就目前而言,由于克劳德3.7 SONNET令人印象深刻的表现,众人赛站在提前。它的发行暗示了一个未来,一个模型可以处理每个任务,而不是需要用于不同功能的专门工具。










