Maison
ElevenLabs établit une nouvelle référence en matière de reconnaissance vocale ; Google Gemini emboîte le pas avec des fonctionnalités étendues
Artificial Analysis a publié la dernière version de son benchmark de reconnaissance vocale, AA-WER v2.0. Les résultats désignent ElevenLabs et Google comme les leaders incontestés en matière de performances de transcription audio.

Mesuré par le taux d'erreur sur les mots (WER), Scribe v2 d'ElevenLabs s'est classé en tête avec un taux d'erreur impressionnant de 2,3 %. Il est suivi de près par Gemini3Pro de Google, avec 2,9 %. Il convient de noter que Google n'a pas optimisé Gemini pour la transcription ; ce résultat découle uniquement de ses solides capacités multimodales générales.
Les autres modèles de premier plan ont affiché les résultats suivants :
Mistral Voxtral Small: s'est classé troisième avec un taux d'erreur de 3,0 %.
Google Gemini3Flash: a livré une performance solide avec un taux d'erreur de 3,1 %.
OpenAI Whisper Large v3: le modèle open source le plus utilisé s'est classé en milieu de tableau avec un taux d'erreur de 4,2 %.
Les moins performants : Qwen3ASR Flash d'Alibaba (5,9 %), Nova2Omni d'Amazon (6,0 %) et Rev AI (6,1 %) ont fermé la marche du classement.

Dans le benchmark AA-AgentTalk dédié aux commandes vocales pour assistants vocaux, le classement est resté inchangé. Scribe v2 d'ElevenLabs et Gemini3Pro de Google ont conservé leur avance avec des taux d'erreur de 1,6 % et 1,7 % respectivement, s'avérant très fiables pour les interactions vocales courtes et directes.
Article connexe
Cursor Composer 2 contre Claude Opus 4.6 : un test de performance relance le débat sur la programmation par IA
Le 19 mars, Cursor a officiellement lancé son modèle de codage développé en interne, Composer 2. Cette annonce a immédiatement suscité des discussions au sein de la communauté des développeurs : selon
StrictlyVC San Francisco réunira des dirigeants de TDK Ventures, Replit et d'autres entreprises
Le premier événement StrictlyVC de l'année arrive à San Francisco plus tôt que vous ne le pensez. Il reste encore des billets pour notre rencontre du 30 avril au Sentro Filipino Cultural Center,
Notion transforme son espace de travail en une plateforme centralisée pour les agents IA
Notion, l'éditeur de logiciels de productivité, entre dans l'ère des agents.Lors d'une annonce de produit diffusée en direct mercredi, Notion — surtout connu pour son application de pri
Recommandations de sujets spéciaux liés
commentaires (1)
Artificial Analysis a publié la dernière version de son benchmark de reconnaissance vocale, AA-WER v2.0. Les résultats désignent ElevenLabs et Google comme les leaders incontestés en matière de performances de transcription audio.

Mesuré par le taux d'erreur sur les mots (WER), Scribe v2 d'ElevenLabs s'est classé en tête avec un taux d'erreur impressionnant de 2,3 %. Il est suivi de près par Gemini3Pro de Google, avec 2,9 %. Il convient de noter que Google n'a pas optimisé Gemini pour la transcription ; ce résultat découle uniquement de ses solides capacités multimodales générales.
Les autres modèles de premier plan ont affiché les résultats suivants :
Mistral Voxtral Small: s'est classé troisième avec un taux d'erreur de 3,0 %.
Google Gemini3Flash: a livré une performance solide avec un taux d'erreur de 3,1 %.
OpenAI Whisper Large v3: le modèle open source le plus utilisé s'est classé en milieu de tableau avec un taux d'erreur de 4,2 %.
Les moins performants : Qwen3ASR Flash d'Alibaba (5,9 %), Nova2Omni d'Amazon (6,0 %) et Rev AI (6,1 %) ont fermé la marche du classement.

Dans le benchmark AA-AgentTalk dédié aux commandes vocales pour assistants vocaux, le classement est resté inchangé. Scribe v2 d'ElevenLabs et Gemini3Pro de Google ont conservé leur avance avec des taux d'erreur de 1,6 % et 1,7 % respectivement, s'avérant très fiables pour les interactions vocales courtes et directes.
Cursor Composer 2 contre Claude Opus 4.6 : un test de performance relance le débat sur la programmation par IA
Le 19 mars, Cursor a officiellement lancé son modèle de codage développé en interne, Composer 2. Cette annonce a immédiatement suscité des discussions au sein de la communauté des développeurs : selon
StrictlyVC San Francisco réunira des dirigeants de TDK Ventures, Replit et d'autres entreprises
Le premier événement StrictlyVC de l'année arrive à San Francisco plus tôt que vous ne le pensez. Il reste encore des billets pour notre rencontre du 30 avril au Sentro Filipino Cultural Center,
Notion transforme son espace de travail en une plateforme centralisée pour les agents IA
Notion, l'éditeur de logiciels de productivité, entre dans l'ère des agents.Lors d'une annonce de produit diffusée en direct mercredi, Notion — surtout connu pour son application de pri











