选项
首页
快讯
内容
MarkSanchez
MarkSanchez
2026-02-11

蚂蚁集团开源了其多模态人工智能模型明闪全能2.0。据报道,该模型在视觉语言理解、图像编辑和音频生成等基准测试中超越了Gemini 2.5 Pro等模型。其关键特性在于统一音频生成能力,可通过自然语言提示在单音轨上生成语音、音效及音乐。 该模型基于MoE架构的Ling 2.0构建,旨在为开发者提供可复用的基础框架,从而简化多模态应用开发流程。

蚂蚁集团开源了其多模态人工智能模型明闪全能2.0。据报道,该模型在视觉语言理解、图像编辑和音频生成等基准测试中超越了Gemini 2.5 Pro等模型。其关键特性在于统一音频生成能力,可通过自然语言提示在单音轨上生成语音、音效及音乐。 该模型基于MoE架构的Ling 2.0构建,旨在为开发者提供可复用的基础框架,从而简化多模态应用开发流程。
评论 (0)
0/300
OR