A Tencent Hy e instituições de pesquisa líderes lançaram o MMAE, o primeiro benchmark em larga escala para edição de áudio orientada por instruções. Os testes mostram que os modelos atuais de IA alcançam uma taxa de correspondência exata inferior a 5%, destacando as principais deficiências na modificação precisa de áudio. O MMAE utiliza 2000 amostras reais e 17.741 métricas para avaliar a precisão da edição em sons, música e fala.





Lar
