Zhipu GLM-5.1 正式发布,其长上下文处理性能超越 Opus 4.6
4月10日,智普AI正式 发布并开源了其全新旗舰模型GLM-5.1。该模型最重大的突破在于其长时任务处理能力,使其成为全球首个能够连续工作8小时的开源模型。

核心突破:从“问答”到“自主工作”
智普AI团队 强调,大模型的新标杆不再仅仅是基准测试分数,而是“能够自主工作多长时间”。
8小时续航: GLM-5.1可在 单一任务上独立连续工作超过8小时。在此期间,它能自主规划、执行、识别瓶颈并自我进化,最终产出可投入生产的结果。
顶尖编程能力:在评估专业软件工程能力的SWE-bench Pro基准测试中,GLM-5.1成为 首个超越海外领先模型Opus4.6 的国内模型。
卓越的实战表现:在一项涉及海量数据检索系统的编程测试中,GLM-5.1 执行了超过 6,000 次优化操作,最终速度比此前最佳表现快了六倍。

行业转型:从“价格战”到“性能溢价”
伴随性能的飞跃,智普AI的 定价策略也发生了重大转变。
定价与全球领军企业持平:平台数据显示,GLM-5.1的 定价再次上调10%。其在编程场景的定价首次与海外领先供应商Anthropic 持平。
聚焦商业价值: 智普AI CEO张鹏 表示,长期低价竞争对行业不利,此次调价旨在将AI价值回归合理区间。智普已实现全球变现,其API业务的年度经常性收入(ARR)同比增长60倍。
市场趋势:基础算力与模型进入“涨价”阶段
自2026年初以来,中国AI行业正集体从“低价量变”向“价值定价”转型。
腾讯云:宣布将其AI计算和容器服务价格上调5%。
阿里云:将AI计算相关产品的价格上调了5%至34%。
百度AI云:相关AI计算服务价格上调5%至30%。
结论:AGI时间线
业界普遍认为,衡量通用人工智能(AGI)的关键指标是任务完成的时间线。当前,尖端模型完成任务所需的时间每七个月就会翻一番。随着GLM-5.1 推出其“8小时工作模式”,大型模型正正式从问答聊天机器人演变为能够深度参与复杂项目的“虚拟员工”。
相关文章
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助
据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医
Cursor Composer 2 与 Claude Opus 4.6:基准测试引发新一轮人工智能编程争论
3月19日,Cursor正式发布了其自主研发的编程模型Composer 2。 这一消息在开发者社区中立即引发热议——据 Cursor 称,Composer 2 在 Terminal-Bench 2.0 测试中获得了 61.7% 的得分,在相同的测试条件下,这一成绩显著超过了 Claude Opus 4.6 的 58.0%。Anthropic的旗舰模型竟被自家IDE内置的模型超越?随着消息传开,相关
StrictlyVC旧金山站将汇聚TDK Ventures、Replit等企业的领军人物
今年首场StrictlyVC活动即将登陆旧金山,时间比你想象的要早。 4月30日,我们在菲律宾文化中心(Sentro Filipino Cultural Center)举办的聚会门票仍在热售中,届时将有阵容强大的演讲嘉宾阵容。除了StrictlyVC一贯以人脉拓展和社区互动著称外,本次旧金山活动对于寻求最新融资洞见的AI创新者和创始人而言,将具有特别重要的价值。谁将登台门票现已开售,但如果您此前未
相关专题推荐
评论 (0)
0/500
4月10日

核心突破:从“问答”到“自主工作”
8小时续航:
顶尖编程能力:在评估专业软件工程能力的SWE-bench Pro基准
卓越的实战表现:在一项涉及海量数据检索系统的编程测试中,

行业转型:从“价格战”到“性能溢价”
伴随性能的飞跃
定价与全球领军企业持平:平台
聚焦商业价值:
市场趋势:基础算力与模型进入“涨价”阶段
自2026年初以来,中国AI行业正集体从“低价量变”向“价值定价”转型。
腾讯云:宣布将其AI计算和容器服务价格上调5%。
阿里云:将AI计算相关产品的价格上调了5%至34%。
百度AI云:相关AI计算服务价格上调5%至30%。
结论:AGI时间线
业界普遍认为,衡量通用人工智能(AGI)的关键指标是任务完成的时间线。当前,尖端模型完成任务所需的时间每七个月就会翻一番。随着
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助
据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医
Cursor Composer 2 与 Claude Opus 4.6:基准测试引发新一轮人工智能编程争论
3月19日,Cursor正式发布了其自主研发的编程模型Composer 2。 这一消息在开发者社区中立即引发热议——据 Cursor 称,Composer 2 在 Terminal-Bench 2.0 测试中获得了 61.7% 的得分,在相同的测试条件下,这一成绩显著超过了 Claude Opus 4.6 的 58.0%。Anthropic的旗舰模型竟被自家IDE内置的模型超越?随着消息传开,相关
StrictlyVC旧金山站将汇聚TDK Ventures、Replit等企业的领军人物
今年首场StrictlyVC活动即将登陆旧金山,时间比你想象的要早。 4月30日,我们在菲律宾文化中心(Sentro Filipino Cultural Center)举办的聚会门票仍在热售中,届时将有阵容强大的演讲嘉宾阵容。除了StrictlyVC一贯以人脉拓展和社区互动著称外,本次旧金山活动对于寻求最新融资洞见的AI创新者和创始人而言,将具有特别重要的价值。谁将登台门票现已开售,但如果您此前未





首页






