Дом
ElevenLabs устанавливает новый рекорд в области преобразования речи в текст; Google Gemini следует за ним, предлагая широкий спектр возможностей
Компания Artificial Analysis выпустила новую версию своего теста производительности систем преобразования речи в текст — AA-WER v2.0. Результаты тестирования показывают, что ElevenLabs и Google являются явными лидерами по эффективности транскрипции аудиозаписей.

По показателю коэффициента ошибок по ключевым словам (WER) первое место заняла система Scribe v2 от ElevenLabs с впечатляюще низким показателем ошибок — 2,3%. С небольшим отрывом за ней следует система Gemini3Pro от Google с показателем 2,9%. Стоит отметить, что Google не проводила точную настройку Gemini для транскрипции; этот результат обусловлен исключительно ее надежными мультимодальными общими возможностями.
Другие ведущие модели показали следующие результаты:
Mistral Voxtral Small: заняла третье место с показателем ошибок 3,0%.
Google Gemini3Flash: продемонстрировал стабильную производительность с показателем ошибок 3,1%.
OpenAI Whisper Large v3: самая широко используемая модель с открытым исходным кодом заняла место в середине рейтинга с показателем ошибок 4,2%.
Наименее эффективные модели: Qwen3ASR Flash от Alibaba (5,9%), Nova2Omni от Amazon (6,0%) и Rev AI (6,1%) заняли последние места в рейтинге.

В специальном тесте AA-AgentTalk для команд голосовых помощников лидеры остались прежними. Scribe v2 от ElevenLabs и Gemini3Pro от Google сохранили лидерство с показателями ошибок 1,6% и 1,7% соответственно, продемонстрировав высокую надежность при коротких и прямых голосовых взаимодействиях.
Связанная статья
Компания Baidu Health в ближайшее время проведет внутреннее тестирование AI-помощника врача DoctorClaw для поиска научной информации и оказания помощи в офисной работе
По имеющимся данным, компания Baidu Health приступила к внутреннему тестированию профессионального интеллектуального помощника на базе искусственного интеллекта, предназначенного для врачей. Этот прод
Cursor Composer 2 против Claude Opus 4.6: тест производительности разжигает новую дискуссию о программировании с помощью ИИ
19 марта компания Cursor официально представила свою собственную модель кодирования — Composer 2. Это объявление сразу же вызвало бурную дискуссию в сообществе разработчиков — по данным Cursor, Compos
На конференции StrictlyVC в Сан-Франциско соберутся руководители компаний TDK Ventures, Replit и других
Первое в этом году мероприятие StrictlyVC состоится в Сан-Франциско раньше, чем вы думаете. Еще есть билеты на нашу встречу 30 апреля в Sentro Filipino Cultural Center, где выступит впечатляющий соста
Рекомендации по связанным специальным темам
Комментарии (1)
Компания Artificial Analysis выпустила новую версию своего теста производительности систем преобразования речи в текст — AA-WER v2.0. Результаты тестирования показывают, что ElevenLabs и Google являются явными лидерами по эффективности транскрипции аудиозаписей.

По показателю коэффициента ошибок по ключевым словам (WER) первое место заняла система Scribe v2 от ElevenLabs с впечатляюще низким показателем ошибок — 2,3%. С небольшим отрывом за ней следует система Gemini3Pro от Google с показателем 2,9%. Стоит отметить, что Google не проводила точную настройку Gemini для транскрипции; этот результат обусловлен исключительно ее надежными мультимодальными общими возможностями.
Другие ведущие модели показали следующие результаты:
Mistral Voxtral Small: заняла третье место с показателем ошибок 3,0%.
Google Gemini3Flash: продемонстрировал стабильную производительность с показателем ошибок 3,1%.
OpenAI Whisper Large v3: самая широко используемая модель с открытым исходным кодом заняла место в середине рейтинга с показателем ошибок 4,2%.
Наименее эффективные модели: Qwen3ASR Flash от Alibaba (5,9%), Nova2Omni от Amazon (6,0%) и Rev AI (6,1%) заняли последние места в рейтинге.

В специальном тесте AA-AgentTalk для команд голосовых помощников лидеры остались прежними. Scribe v2 от ElevenLabs и Gemini3Pro от Google сохранили лидерство с показателями ошибок 1,6% и 1,7% соответственно, продемонстрировав высокую надежность при коротких и прямых голосовых взаимодействиях.
Компания Baidu Health в ближайшее время проведет внутреннее тестирование AI-помощника врача DoctorClaw для поиска научной информации и оказания помощи в офисной работе
По имеющимся данным, компания Baidu Health приступила к внутреннему тестированию профессионального интеллектуального помощника на базе искусственного интеллекта, предназначенного для врачей. Этот прод
Cursor Composer 2 против Claude Opus 4.6: тест производительности разжигает новую дискуссию о программировании с помощью ИИ
19 марта компания Cursor официально представила свою собственную модель кодирования — Composer 2. Это объявление сразу же вызвало бурную дискуссию в сообществе разработчиков — по данным Cursor, Compos
На конференции StrictlyVC в Сан-Франциско соберутся руководители компаний TDK Ventures, Replit и других
Первое в этом году мероприятие StrictlyVC состоится в Сан-Франциско раньше, чем вы думаете. Еще есть билеты на нашу встречу 30 апреля в Sentro Filipino Cultural Center, где выступит впечатляющий соста











