如何扩展大型模型:杨志林在GTC大会上关于令牌效率和代理集群的策略

迈入大模型时代后半程的门票,不再仅仅在于计算能力的扩展,而是对底层架构的根本性重构。
3月18日,在NVIDIA GTC 2026大会上,Moonshot AI创始人杨志林发表了备受瞩目的主题演讲。这是他首次全面公开阐述Kimi K2.5 模型背后的核心技术路线图,为“后规模化”时代的大模型演进提供了全新视角。
杨志林指出,要突破当前智能技术的瓶颈,必须对优化器、注意力机制和残差连接等关键技术进行彻底重构。他将Kimi的演进归纳为三个相互协同的维度:
令牌效率:消除资源浪费,追求更极致的计算性能比。
长上下文:持续深化Kimi在长上下文记忆方面的优势,以实现海量信息处理。
智能集群:智能正从单个智能体演进为动态生成的“数字集群”。
在杨志林看来,规模化已演变为在效率、记忆力和自动化协作中寻找规模效应。这三个维度的收益相乘,有望解锁远超当前能力的智能水平。
根据此前公告,1月初发布的Kimi K2.5模型已展现出这种“全方位”能力。作为Moonshot AI迄今最强大的开源模型,它具备原生多模态架构,在代码和视觉理解方面达到最先进水平(SOTA),并支持在“思考”与“非思考”模式间灵活切换,以精准适应基于代理的任务。
随着Moonshot AI的技术路径日益清晰,大型模型的竞争焦点正从“参数数量”转向“智能密度”。随着代理集群逐渐成为未来智能的潜在终极形态,Kimi 能否在杨志林的“三维乘法”框架下实现突破,已成为业界关注的焦点。
相关文章
BuzzFeed 推出专注于垃圾应用的 AI 子公司
在面临重大经营危机的背景下,曾经的数字媒体巨头BuzzFeed正启动一项由人工智能驱动的雄心勃勃的自救实验。 在最近举行的SXSW大会上,联合创始人兼首席执行官乔纳·佩雷蒂宣布成立一家名为Branch Office的子公司,旨在通过一系列由人工智能驱动的消费者应用程序,重新定义“软件即内容”的商业模式。核心产品组合:融合网络梗与社交媒体Branch Office 推出了三款核心应用,每款都旨在捕捉
ChatGPT成人模式再次推迟;奥特曼:优先考虑智能
OpenAI再次推迟推出备受争议的功能,转而专注于个性化和主动交互“不适当内容”是否应成为高效AI工具的一部分,这一问题在科技界早已引发热议。 OpenAI曾承诺让ChatGPT更好地理解成年用户,但再次令期待这一变革的人们失望。据IT之家报道,该公司近日确认,原定于2026年第一季度推出的所谓“成人模式”已再次推迟。这并非萨姆·阿尔特曼(Sam Altman)首次食言。早在2025年底,他就曾宣
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助
据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医
相关专题推荐
评论 (0)
0/500

迈入大模型时代后半程的门票,不再仅仅在于计算能力的扩展,而是对底层架构的根本性重构。
3月18日,在NVIDIA GTC 2026大会上,Moonshot AI创始人杨志林发表了备受瞩目的主题演讲。这是他首次全面公开阐述
杨志林指出,要突破当前智能技术的瓶颈,必须对优化器、注意力机制和残差连接等关键技术进行彻底重构。他将Kimi的演进归纳为三个相互协同的维度:
令牌效率:消除资源浪费,追求更极致的计算性能比。
长上下文:持续深化Kimi在长上下文记忆方面的优势,以实现海量信息处理。
智能集群:智能正从单个智能体演进为动态生成的“数字集群”。
在杨志林看来,规模化已演变为在效率、记忆力和自动化协作中寻找规模效应。这三个维度的收益相乘,有望解锁远超当前能力的智能水平。
根据此前公告,1月初发布的Kimi K2.5模型已展现出这种“全方位”能力。作为Moonshot AI迄今最强大的开源模型,它具备原生多模态架构,在代码和视觉理解方面达到最先进水平(SOTA),并支持在“思考”与“非思考”模式间灵活切换,以精准适应基于代理的任务。
随着Moonshot AI的技术路径日益清晰,大型模型的竞争焦点正从“参数数量”转向“智能密度”。随着代理集群逐渐成为未来智能的潜在终极形态,
BuzzFeed 推出专注于垃圾应用的 AI 子公司
在面临重大经营危机的背景下,曾经的数字媒体巨头BuzzFeed正启动一项由人工智能驱动的雄心勃勃的自救实验。 在最近举行的SXSW大会上,联合创始人兼首席执行官乔纳·佩雷蒂宣布成立一家名为Branch Office的子公司,旨在通过一系列由人工智能驱动的消费者应用程序,重新定义“软件即内容”的商业模式。核心产品组合:融合网络梗与社交媒体Branch Office 推出了三款核心应用,每款都旨在捕捉
ChatGPT成人模式再次推迟;奥特曼:优先考虑智能
OpenAI再次推迟推出备受争议的功能,转而专注于个性化和主动交互“不适当内容”是否应成为高效AI工具的一部分,这一问题在科技界早已引发热议。 OpenAI曾承诺让ChatGPT更好地理解成年用户,但再次令期待这一变革的人们失望。据IT之家报道,该公司近日确认,原定于2026年第一季度推出的所谓“成人模式”已再次推迟。这并非萨姆·阿尔特曼(Sam Altman)首次食言。早在2025年底,他就曾宣
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助
据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医





首页






