選項
首頁
快訊
內容
MarkSanchez
MarkSanchez
2026-02-11

螞蟻集團開源了其多模態人工智慧模型明閃全知2.0(Ming-Flash-Omni 2.0)。據報導,該模型在視覺語言理解、圖像編輯及音頻生成等基準測試中,表現超越Gemini 2.5 Pro等競爭對手。其核心特色在於統一音頻生成能力,能根據自然語言提示在單一音軌上同步生成語音、音效與音樂。 該模型基於MoE架構的Ling 2.0架構構建,旨在為開發者提供可重複使用的基礎架構,簡化多模態應用開發流程。

螞蟻集團開源了其多模態人工智慧模型明閃全知2.0(Ming-Flash-Omni 2.0)。據報導,該模型在視覺語言理解、圖像編輯及音頻生成等基準測試中,表現超越Gemini 2.5 Pro等競爭對手。其核心特色在於統一音頻生成能力,能根據自然語言提示在單一音軌上同步生成語音、音效與音樂。 該模型基於MoE架構的Ling 2.0架構構建,旨在為開發者提供可重複使用的基礎架構,簡化多模態應用開發流程。
評論 (0)
0/300
OR