蚂蚁集团发布开源模型Ling-2.6-flash,这是宝灵模型家族的新成员
蚂蚁集团的宝灵大模型系列今日迎来重大更新,Ling-2.6-flash 现已正式面向全球开发者开放。为适应不同的硬件环境并降低部署门槛,该模型还推出了包括 BF16、FP8 和 INT4 在内的多种精度版本,为开发者提供了更灵活的推理选项。
作为一款拥有1040亿总参数和74亿激活参数的Instruct模型,Ling-2.6-flash 此前曾在OpenRouter平台上以“Elephant Alpha”的代号进行过测试。 在为期两周的试用期间,开发团队收集了大量实际应用反馈并进行了针对性优化,显著提升了中英代码切换的流畅度,并增强了与主流编程框架的兼容性。

技术亮点:混合架构与卓越效率
Ling-2.6-flash的核心 优势在于其独特的架构和极高的运行效率:
混合线性架构:通过底层计算优化,该模型实现了卓越的推理速度。在4张H20显卡配置下,推理速度可达340令牌/秒。在预填充吞吐量方面,其表现是Nemotron-3-Super的2.2倍,显著降低了响应延迟。
卓越的令牌效率比:团队在训练过程中对令牌效率进行了精细调校。评估数据表明,在同等质量的任务下,Ling-2.6-flash 仅消耗约1500万令牌——约为同类竞品的十分之一——大幅降低了商业化成本。
场景深化:针对性增强代理能力
针对大型模型最常见的应用场景之一——智能体场景,Ling-2.6-flash 进行了专项优化。无论是处理复杂的工具调用、多步骤规划还是最终任务执行,该模型均表现稳定可靠。 在 BFCL-V4 和 SWE-bench 等多个行业标准评估中,即使与激活参数数量更大的模型相比,Ling-2.6-flash 仍能保持相当甚至最先进(SOTA)的性能。
开发者现可通过 Hugging Face 和 ModelScope(Moba 社区)获取该模型的开源资源,这为在各类行业应用中进一步探索其潜力提供了可能。
相关文章
埃隆·马斯克在针对山姆·奥尔特曼和OpenAI的诉讼中败诉
埃隆·马斯克声称OpenAI的联合创始人亏待了他,但这一说法在九名加州陪审员一致裁定他的诉讼提起得太晚之后被推翻了。 马斯克指控萨姆·奥尔特曼、格雷格·布罗克曼、OpenAI以及微软通过成立这个高级人工智能实验室的盈利机构“窃取了一笔慈善资金”。然而,陪审员们认定,马斯克可能遭受的任何损失都发生在他提起诉讼的法律截止日期之前。 尽管这场审判深入探讨了OpenAI的发展历程,并有硅谷知名人物的证词,但最终它还是围绕一些相对具体的法律问题展开的。诉讼的核心在于奥尔特曼和其他被告是否以及何时向
请提供文章标题,以便将其改写为问题。
在当今的数字环境中,人工智能正在全面重塑各行各业,博客领域也不例外。博主们一直在寻找方法来优化工作流程、提升内容质量并加强搜索引擎优化(SEO)。 幸运的是,各类人工智能工具都能助您实现这些目标。本文将介绍2025年每位博主工具箱中都应配备的五大AI工具——这些并非泛泛之选,而是我个人运营博客时所依赖的得力助手。它们彻底改变了我处理内容创作、SEO以及受众互动的方式。重点摘要ChatGPT:非常适
Conntour 获得 General Catalyst 和 YC 700 万美元融资,用于开发人工智能驱动的安防视频搜索技术
监控技术行业目前正受到密切关注,不过原因并不令人欣慰。 据报道,美国移民和海关执法局曾接入Flock的摄像头网络进行监控,引发争议;而家用摄像头制造商Ring因开发允许执法部门向业主索取社区监控录像的功能而遭到批评。这些事件引发了关于安全、隐私及监控伦理的广泛讨论。然而,争议并未削弱市场需求。视觉语言模型的持续进步,正推动着那些帮助企业更有效地监控其场所的公司实现增长。视频监控初创公司Connto
相关专题推荐
评论 (0)
0/500
蚂蚁集团的宝灵大模型系列今日迎来重大更新
作为一款拥有1040亿总参数和74亿激活参数的Instruct模型,

技术亮点:混合架构与卓越效率
混合线性架构:通过底层计算优化,该模型实现了卓越的推理速度。在4张H20显卡配置下,推理速度可达340令牌/秒。在预填充吞吐量方面,其表现是Nemotron-3-Super的2.2倍,显著降低了响应延迟。
卓越的令牌效率比:团队在训练过程中对令牌效率进行了精细调校。评估数据表明,在同等质量的任务下,
场景深化:针对性增强代理能力
针对大型模型最常见的应用场景之一——智能体场景
开发者现可通过 Hugging Face 和 ModelScope(Moba 社区)获取该模型的开源资源,这为在各类行业应用中进一步探索其潜力提供了可能。
埃隆·马斯克在针对山姆·奥尔特曼和OpenAI的诉讼中败诉
埃隆·马斯克声称OpenAI的联合创始人亏待了他,但这一说法在九名加州陪审员一致裁定他的诉讼提起得太晚之后被推翻了。 马斯克指控萨姆·奥尔特曼、格雷格·布罗克曼、OpenAI以及微软通过成立这个高级人工智能实验室的盈利机构“窃取了一笔慈善资金”。然而,陪审员们认定,马斯克可能遭受的任何损失都发生在他提起诉讼的法律截止日期之前。 尽管这场审判深入探讨了OpenAI的发展历程,并有硅谷知名人物的证词,但最终它还是围绕一些相对具体的法律问题展开的。诉讼的核心在于奥尔特曼和其他被告是否以及何时向
请提供文章标题,以便将其改写为问题。
在当今的数字环境中,人工智能正在全面重塑各行各业,博客领域也不例外。博主们一直在寻找方法来优化工作流程、提升内容质量并加强搜索引擎优化(SEO)。 幸运的是,各类人工智能工具都能助您实现这些目标。本文将介绍2025年每位博主工具箱中都应配备的五大AI工具——这些并非泛泛之选,而是我个人运营博客时所依赖的得力助手。它们彻底改变了我处理内容创作、SEO以及受众互动的方式。重点摘要ChatGPT:非常适
Conntour 获得 General Catalyst 和 YC 700 万美元融资,用于开发人工智能驱动的安防视频搜索技术
监控技术行业目前正受到密切关注,不过原因并不令人欣慰。 据报道,美国移民和海关执法局曾接入Flock的摄像头网络进行监控,引发争议;而家用摄像头制造商Ring因开发允许执法部门向业主索取社区监控录像的功能而遭到批评。这些事件引发了关于安全、隐私及监控伦理的广泛讨论。然而,争议并未削弱市场需求。视觉语言模型的持续进步,正推动着那些帮助企业更有效地监控其场所的公司实现增长。视频监控初创公司Connto





首页






