옵션
속보
콘텐츠
MarkSanchez
MarkSanchez
2026년 2월 11일

앤트그룹이 다중 모달 AI 모델 '밍플래시옴니 2.0'을 오픈소스화했다. 시각-언어 이해, 이미지 편집, 오디오 생성 등 일부 벤치마크에서 '제미니 2.5 프로' 같은 모델을 능가하는 것으로 알려졌다. 핵심 기능은 통합 오디오 생성으로, 자연어 프롬프트 하나로 음성, 음향 효과, 음악을 단일 트랙으로 출력한다. 이 모델은 MoE 기반 Ling 2.0 아키텍처로 구축되었으며, 개발자들이 다중 모달 앱 개발을 간소화할 수 있도록 재사용 가능한 기반으로 설계되었다.

앤트그룹이 다중 모달 AI 모델 '밍플래시옴니 2.0'을 오픈소스화했다. 시각-언어 이해, 이미지 편집, 오디오 생성 등 일부 벤치마크에서 '제미니 2.5 프로' 같은 모델을 능가하는 것으로 알려졌다. 핵심 기능은 통합 오디오 생성으로, 자연어 프롬프트 하나로 음성, 음향 효과, 음악을 단일 트랙으로 출력한다. 이 모델은 MoE 기반 Ling 2.0 아키텍처로 구축되었으며, 개발자들이 다중 모달 앱 개발을 간소화할 수 있도록 재사용 가능한 기반으로 설계되었다.
의견 (0)
0/300
OR