オプション
速報
コンテンツ
MarkSanchez
MarkSanchez
2026年2月11日

アントグループはマルチモーダルAIモデル「Ming-Flash-Omni 2.0」をオープンソース化した。視覚言語理解、画像編集、音声生成などのベンチマークにおいてGemini 2.5 Proなどのモデルを上回る性能を発揮すると報じられている。主な特徴は統合音声生成機能で、自然言語プロンプトから音声・効果音・音楽を単一トラックで生成する。 本モデルはMoEベースのLing 2.0アーキテクチャを基盤とし、開発者がマルチモーダルアプリ開発を簡素化できる再利用可能な基盤として設計されている。

アントグループはマルチモーダルAIモデル「Ming-Flash-Omni 2.0」をオープンソース化した。視覚言語理解、画像編集、音声生成などのベンチマークにおいてGemini 2.5 Proなどのモデルを上回る性能を発揮すると報じられている。主な特徴は統合音声生成機能で、自然言語プロンプトから音声・効果音・音楽を単一トラックで生成する。 本モデルはMoEベースのLing 2.0アーキテクチャを基盤とし、開発者がマルチモーダルアプリ開発を簡素化できる再利用可能な基盤として設計されている。
コメント (0)
0/300
OR