Tencent Hy y destacadas instituciones de investigación lanzaron MMAE, el primer benchmark a gran escala para la edición de audio basada en instrucciones. Las pruebas demuestran que los modelos actuales de IA alcanzan una tasa de coincidencia exacta inferior al 5%, lo que destaca las principales deficiencias en la modificación precisa de audio. MMAE utiliza 2000 ejemplos reales y 17,741 métricas para evaluar la precisión de la edición en sonido, música y voz.





Hogar
