蚂蚁数字推出“百灵”企业金融大语言模型:重新定义速度与效率
OpenAI的Agent等自主执行代理的兴起,标志着人工智能应用迈向了新的加速阶段,从简单的“对话交互”转向了复杂的“任务执行”。尽管企业正迅速拥抱这一趋势,但也面临着计算资源浪费和安全合规等挑战。实现智能代理的大规模、可持续部署已成为行业关注的焦点。
3月26日,在“中关村论坛·未来产业创新论坛”上,蚂蚁数字大模型技术创新部总经理张鹏在演讲中指出,此类智能代理的出现将彻底改变企业AI的范式。这一转变将推动大模型的产业化部署从“参数规模竞赛”转向“令牌效率竞赛”。

蚂蚁数字大模型技术创新部总经理张鹏在中关村论坛上发表演讲。
智能代理的快速普及反映了市场对自主任务执行的强烈需求。然而,将其部署到真实的工业环境中却面临重大障碍。 由于往往缺乏对行业规则和工作流的深刻理解,这些智能代理在处理复杂任务时,可能会反复调用工具,导致效率低下。这使得令牌消耗远超其实际创造的价值。报告显示,在某些高频场景下,智能代理的执行成本可能是集成解决方案的数十倍甚至数百倍,这引发了人们对其广泛工业应用可持续性的担忧。
“大模型工业化下一阶段的核心挑战不在于参数数量的竞争,而在于持续提升每Token的效率,”张鹏指出。他认为企业应根据具体场景和需求,选择战略性地结合大模型与小模型的AI解决方案,以更低的计算成本实现更大的商业价值。
以金融行业为例。该领域每天处理海量的高频、低延迟任务——快速识别用户意图、提取关键数据、检索和排序信息。这些任务要求高并发、快速响应和精准无误。 虽然传统的大型推理模型功能强大,但将其用于此类场景往往是“大材小用”——如同“用大锤砸核桃”——导致成本高昂、速度缓慢且资源浪费。
“行业真正需要的是既能保证专业性、严谨性和合规性,又能提供最佳成本效益和响应速度的AI解决方案,”张鹏解释道。他强调,大参数模型擅长复杂推理和深度分析,而小模型则能为高频、简单的任务提供更低的延迟和更好的成本效益。利用两者的混合方法是更高效、更经济地解决现实世界问题的关键。
在中关村论坛上,蚂蚁数字发布了名为“Ling-DT-Fin-Mini-2.5”的轻量级金融专用模型,这是其Ling DT系列的首款产品。该模型基于最新的Ling 2.5混合线性注意力框架,采用轻量级的专家混合(MoE)架构,针对高并发、低延迟的金融任务进行了优化。 它在保持专业能力的同时,将推理成本降至适合大规模部署的水平。与能力相当的主流通用模型相比,它在处理同等任务量时,推理速度提升100%,硬件成本显著降低,为金融机构带来了切实的成本节约和效率提升。
事实上,随着AI代理深入核心工业流程执行实际工作,大小模型结合的策略正成为行业标准。近期,OpenAI自身也发布了两款更小型的模型——GPT-4o mini和nano,专注于低延迟和高性价比,以作为主要的执行级代理。
张鹏总结道,技术进步最终必须与产业效率的理性需求相契合。在下一阶段的竞争中,Token效率将成为评估企业AI价值的核心指标。蚂蚁数字将继续专注于企业级AGI,计划发布“凌DT”大模型的企业版及行业定制版,加速智能代理在复杂商业环境中的大规模部署。
相关文章
北京工业大学就包括人工智能模型上下文协议在内的121项行业标准征求公众意见
中国工业和信息化部正式发布通知,征求公众对121项行业标准化的意见,其中包括“人工智能安全治理模型上下文协议的应用安全要求”。这一公告标志着中国在建立人工智能基础标准和安全监管框架方面取得了重要进展。此次公开征求意见的重点是针对该模型上下文协议的应用安全问题,旨在通过标准化的技术规范来解决多模态交互、长文本处理以及跨平台调用过程中出现的协议兼容性和数据安全方面的问题。
OpenAI与美国国防部合作,ChatGPT的卸载数量激增了295%
公众愤怒:OpenAI的军事合作引发“卸载潮”近日,人工智能领域的领头羊OpenAI宣布与美国国防部建立了深度合作关系,将其人工智能模型整合到高度机密的军事网络中。这一消息在美国引发了广泛的用户抗议,“抵制ChatGPT”运动势头日益强劲。根据市场分析机构Sensor Tower的数据,2026年2月28日——OpenAI正式宣布这一合作的当天——美国市场上ChatGPT移动应用的卸载率比前一天激增了295%,而此前该应用的平均每日卸载率约为9%。用户们对人工智能被用于军事目的表示强烈担忧,
OpenAI 推出“Sites”功能,以基于文本的网站标志着“无代码时代”的终结
OpenAI 推出了 Sites,这是其面向软件工程的人工智能平台 Codex 的一项新功能。该功能目前处于预览阶段,仅向付费的“商业版”和“企业版”订阅用户开放,旨在消除网页和应用程序开发中的传统障碍。从本质上讲,Sites 是一个将抽象概念转化为实用工具的平台。用户可以输入概念、数据分析或项目计划,Codex 会自动将这些静态内容重构为仪表盘、日程规划器、评审工作区、项目看板以及轻量级应用程序
相关专题推荐
评论 (0)
0/500
OpenAI的Agent等自主执行代理的兴起,标志着人工智能应用迈向了新的加速阶段,从简单的“对话交互”转向了复杂的“任务执行”。尽管企业正迅速拥抱这一趋势,但也面临着计算资源浪费和安全合规等挑战。实现智能代理的大规模、可持续部署已成为行业关注的焦点。
3月26日,在“中关村论坛·未来产业创新论坛”上,蚂蚁数字大模型技术创新部总经理张鹏在演讲中指出,此类智能代理的出现将彻底改变企业AI的范式。这一转变将推动大模型的产业化部署从“参数规模竞赛”转向“令牌效率竞赛”。

蚂蚁数字大模型技术创新部总经理张鹏在中关村论坛上发表演讲。
智能代理的快速普及反映了市场对自主任务执行的强烈需求。然而,将其部署到真实的工业环境中却面临重大障碍。 由于往往缺乏对行业规则和工作流的深刻理解,这些智能代理在处理复杂任务时,可能会反复调用工具,导致效率低下。这使得令牌消耗远超其实际创造的价值。报告显示,在某些高频场景下,智能代理的执行成本可能是集成解决方案的数十倍甚至数百倍,这引发了人们对其广泛工业应用可持续性的担忧。
“大模型工业化下一阶段的核心挑战不在于参数数量的竞争,而在于持续提升每Token的效率,”张鹏指出。他认为企业应根据具体场景和需求,选择战略性地结合大模型与小模型的AI解决方案,以更低的计算成本实现更大的商业价值。
以金融行业为例。该领域每天处理海量的高频、低延迟任务——快速识别用户意图、提取关键数据、检索和排序信息。这些任务要求高并发、快速响应和精准无误。 虽然传统的大型推理模型功能强大,但将其用于此类场景往往是“大材小用”——如同“用大锤砸核桃”——导致成本高昂、速度缓慢且资源浪费。
“行业真正需要的是既能保证专业性、严谨性和合规性,又能提供最佳成本效益和响应速度的AI解决方案,”张鹏解释道。他强调,大参数模型擅长复杂推理和深度分析,而小模型则能为高频、简单的任务提供更低的延迟和更好的成本效益。利用两者的混合方法是更高效、更经济地解决现实世界问题的关键。
在中关村论坛上,蚂蚁数字发布了名为“Ling-DT-Fin-Mini-2.5”的轻量级金融专用模型,这是其Ling DT系列的首款产品。该模型基于最新的Ling 2.5混合线性注意力框架,采用轻量级的专家混合(MoE)架构,针对高并发、低延迟的金融任务进行了优化。 它在保持专业能力的同时,将推理成本降至适合大规模部署的水平。与能力相当的主流通用模型相比,它在处理同等任务量时,推理速度提升100%,硬件成本显著降低,为金融机构带来了切实的成本节约和效率提升。
事实上,随着AI代理深入核心工业流程执行实际工作,大小模型结合的策略正成为行业标准。近期,OpenAI自身也发布了两款更小型的模型——GPT-4o mini和nano,专注于低延迟和高性价比,以作为主要的执行级代理。
张鹏总结道,技术进步最终必须与产业效率的理性需求相契合。在下一阶段的竞争中,Token效率将成为评估企业AI价值的核心指标。蚂蚁数字将继续专注于企业级AGI,计划发布“凌DT”大模型的企业版及行业定制版,加速智能代理在复杂商业环境中的大规模部署。
北京工业大学就包括人工智能模型上下文协议在内的121项行业标准征求公众意见
中国工业和信息化部正式发布通知,征求公众对121项行业标准化的意见,其中包括“人工智能安全治理模型上下文协议的应用安全要求”。这一公告标志着中国在建立人工智能基础标准和安全监管框架方面取得了重要进展。此次公开征求意见的重点是针对该模型上下文协议的应用安全问题,旨在通过标准化的技术规范来解决多模态交互、长文本处理以及跨平台调用过程中出现的协议兼容性和数据安全方面的问题。
OpenAI与美国国防部合作,ChatGPT的卸载数量激增了295%
公众愤怒:OpenAI的军事合作引发“卸载潮”近日,人工智能领域的领头羊OpenAI宣布与美国国防部建立了深度合作关系,将其人工智能模型整合到高度机密的军事网络中。这一消息在美国引发了广泛的用户抗议,“抵制ChatGPT”运动势头日益强劲。根据市场分析机构Sensor Tower的数据,2026年2月28日——OpenAI正式宣布这一合作的当天——美国市场上ChatGPT移动应用的卸载率比前一天激增了295%,而此前该应用的平均每日卸载率约为9%。用户们对人工智能被用于军事目的表示强烈担忧,
OpenAI 推出“Sites”功能,以基于文本的网站标志着“无代码时代”的终结
OpenAI 推出了 Sites,这是其面向软件工程的人工智能平台 Codex 的一项新功能。该功能目前处于预览阶段,仅向付费的“商业版”和“企业版”订阅用户开放,旨在消除网页和应用程序开发中的传统障碍。从本质上讲,Sites 是一个将抽象概念转化为实用工具的平台。用户可以输入概念、数据分析或项目计划,Codex 会自动将这些静态内容重构为仪表盘、日程规划器、评审工作区、项目看板以及轻量级应用程序





首页






