Hogar
ElevenLabs establece un nuevo referente en la conversión de voz a texto; Google Gemini le sigue con amplias capacidades
Artificial Analysis ha lanzado la última versión de su prueba de rendimiento de conversión de voz a texto, AA-WER v2.0. Los resultados sitúan a ElevenLabs y Google como claros líderes en rendimiento de transcripción de audio.

Al medirlo por la tasa de error de palabras (WER), Scribe v2 de ElevenLabs alcanzó el primer puesto con una tasa de error impresionantemente baja del 2,3 %. Muy cerca le siguió Gemini3Pro de Google, con un 2,9 %. Cabe destacar que Google no ajustó Gemini específicamente para la transcripción; este resultado se debe exclusivamente a sus sólidas capacidades generales multimodales.
Otros modelos destacados obtuvieron los siguientes resultados:
Mistral Voxtral Small: ocupó el tercer puesto con una tasa de error del 3,0 %.
Google Gemini3Flash: Ofreció un rendimiento sólido con una tasa de error del 3,1 %.
OpenAI Whisper Large v3: el modelo de código abierto más utilizado se situó en la mitad de la tabla con una tasa de error del 4,2 %.
Los de peor rendimiento: Qwen3ASR Flash de Alibaba (5,9 %), Nova2Omni de Amazon (6,0 %) y Rev AI (6,1 %) cerraron la parte baja de la clasificación.

En la prueba de rendimiento específica AA-AgentTalk para comandos de asistentes de voz, la clasificación se mantuvo sin cambios. Scribe v2 de ElevenLabs y Gemini3Pro de Google mantuvieron su liderazgo con tasas de error del 1,6 % y el 1,7 % respectivamente, demostrando ser muy fiables para interacciones de voz breves y directas.
Artículo relacionado
Cursor Composer 2 frente a Claude Opus 4.6: una prueba de rendimiento reaviva el debate sobre la programación con IA
El 19 de marzo, Cursor lanzó oficialmente su modelo de programación propio, Composer 2. El anuncio desató un debate inmediato en la comunidad de desarrolladores: según Cursor, Composer 2 obtuvo una pu
StrictlyVC San Francisco reunirá a líderes de TDK Ventures, Replit y otras empresas
El primer evento de StrictlyVC del año llega a San Francisco antes de lo que imaginas. Aún quedan entradas disponibles para nuestro encuentro del 30 de abril en el Centro Cultural Filipino Sentro, que
Notion convierte su espacio de trabajo en un centro para agentes de IA
Notion, la empresa de software de productividad, se adentra en la era de los agentes.Durante un anuncio de producto retransmitido en directo el miércoles, Notion —conocida sobre todo por su aplicación
Recomendaciones de temas especiales relacionados
comentario (1)
0/500
Artificial Analysis ha lanzado la última versión de su prueba de rendimiento de conversión de voz a texto, AA-WER v2.0. Los resultados sitúan a ElevenLabs y Google como claros líderes en rendimiento de transcripción de audio.

Al medirlo por la tasa de error de palabras (WER), Scribe v2 de ElevenLabs alcanzó el primer puesto con una tasa de error impresionantemente baja del 2,3 %. Muy cerca le siguió Gemini3Pro de Google, con un 2,9 %. Cabe destacar que Google no ajustó Gemini específicamente para la transcripción; este resultado se debe exclusivamente a sus sólidas capacidades generales multimodales.
Otros modelos destacados obtuvieron los siguientes resultados:
Mistral Voxtral Small: ocupó el tercer puesto con una tasa de error del 3,0 %.
Google Gemini3Flash: Ofreció un rendimiento sólido con una tasa de error del 3,1 %.
OpenAI Whisper Large v3: el modelo de código abierto más utilizado se situó en la mitad de la tabla con una tasa de error del 4,2 %.
Los de peor rendimiento: Qwen3ASR Flash de Alibaba (5,9 %), Nova2Omni de Amazon (6,0 %) y Rev AI (6,1 %) cerraron la parte baja de la clasificación.

En la prueba de rendimiento específica AA-AgentTalk para comandos de asistentes de voz, la clasificación se mantuvo sin cambios. Scribe v2 de ElevenLabs y Gemini3Pro de Google mantuvieron su liderazgo con tasas de error del 1,6 % y el 1,7 % respectivamente, demostrando ser muy fiables para interacciones de voz breves y directas.
Cursor Composer 2 frente a Claude Opus 4.6: una prueba de rendimiento reaviva el debate sobre la programación con IA
El 19 de marzo, Cursor lanzó oficialmente su modelo de programación propio, Composer 2. El anuncio desató un debate inmediato en la comunidad de desarrolladores: según Cursor, Composer 2 obtuvo una pu
StrictlyVC San Francisco reunirá a líderes de TDK Ventures, Replit y otras empresas
El primer evento de StrictlyVC del año llega a San Francisco antes de lo que imaginas. Aún quedan entradas disponibles para nuestro encuentro del 30 de abril en el Centro Cultural Filipino Sentro, que
Notion convierte su espacio de trabajo en un centro para agentes de IA
Notion, la empresa de software de productividad, se adentra en la era de los agentes.Durante un anuncio de producto retransmitido en directo el miércoles, Notion —conocida sobre todo por su aplicación











