ElevenLabsが音声認識の新たなベンチマークを樹立、Google Geminiが幅広い機能を備えてこれに続く
Artificial Analysisは、音声認識ベンチマーク「AA-WER v2.0」の最新版を公開した。その結果、音声文字変換性能においてElevenLabsとGoogleが圧倒的なトップに立っていることが明らかになった。

主要指標である単語誤り率(WER)で測定したところ、ElevenLabsの「Scribe v2」が2.3%という驚異的な低誤り率を記録し、首位に立った。これに僅差でGoogleの「Gemini3Pro 」が2.9%で続いた。特筆すべきは、GoogleがGeminiを文字起こし用に微調整していない点であり、この結果は同モデルの堅牢なマルチモーダル汎用能力に由来するものである。
その他の主要モデルの結果は以下の通りです:
Mistral Voxtral Small:3.0%の誤り率で3位となった。
Google Gemini3Flash:3.1%の誤り率で堅実なパフォーマンスを示した。
OpenAI Whisper Large v3:最も広く利用されているオープンソースモデルで、誤り率4.2%という結果で中位につけた。
最下位グループ:AlibabaのQwen3ASRFlash(5.9%)、AmazonのNova2Omni(6.0%)、Rev AI(6.1%)がランキングの下位を占めました。

音声アシスタントコマンド専用のAA-AgentTalkベンチマークにおいても、順位は変わらなかった。ElevenLabsのScribe v2とGoogleのGemini3Proは、それぞれ1.6%と 1.7%の誤認識率で首位を維持し、短く直接的な音声対話において高い信頼性を示した。
関連記事
「Cursor Composer 2」対「Claude Opus 4.6」:ベンチマークテストがAIコーディングを巡る新たな議論を巻き起こす
3月19日、Cursorは自社開発のコーディングモデル「Composer 2」を正式にリリースした。 この発表は開発者コミュニティで即座に議論を巻き起こした。Cursorによると、Composer 2はTerminal-Bench 2.0で61.7%のスコアを記録し、同一のテスト条件下でClaude Opus 4.6の58.0%を大幅に上回ったという。Anthropicのフラッグシップモデルが、自
「StrictlyVC サンフランシスコ」に、TDKベンチャーズやReplitなどのリーダーが集結
今年最初のStrictlyVCイベントが、あっという間にサンフランシスコで開催されます。 4月30日にセントロ・フィリピーノ・カルチュラル・センターで開催される本イベントのチケットは、現在も販売中です。豪華なスピーカー陣が登壇するこのイベントでは、StrictlyVCならではのネットワーキングやコミュニティ交流に加え、資金調達に関する最新の知見を求めるAI分野のイノベーターや起業家の方々にとって、
Notionは、ワークスペースをAIエージェントのハブへと変革します
生産性向上ソフトウェア企業であるNotionが、「エージェント時代」に突入する。水曜日にライブ配信された製品発表会で、共同ノート作成アプリで知られるNotionは、カスタムAIエージェントの機能を拡張し、外部エージェントと連携し、あらゆるデータベースからデータを取得できる自動化された多段階ワークフローをチームが構築できるようにする新しい開発者向けプラットフォームを発表した。複数のツールやデータソー
関連特集おすすめ
コメント (1)
0/500
Artificial Analysisは、音声認識ベンチマーク「AA-WER v2.0」の最新版を公開した。その結果、音声文字変換性能においてElevenLabsとGoogleが圧倒的なトップに立っていることが明らかになった。

主要指標である単語誤り率(WER)で測定したところ、ElevenLabsの「Scribe v2」が2.3%という驚異的な低誤り率を記録し、首位に立った。これに僅差でGoogleの「Gemini3Pro 」が2.9%で続いた。特筆すべきは、GoogleがGeminiを文字起こし用に微調整していない点であり、この結果は同モデルの堅牢なマルチモーダル汎用能力に由来するものである。
その他の主要モデルの結果は以下の通りです:
Mistral Voxtral Small:3.0%の誤り率で3位となった。
Google Gemini3Flash:3.1%の誤り率で堅実なパフォーマンスを示した。
OpenAI Whisper Large v3:最も広く利用されているオープンソースモデルで、誤り率4.2%という結果で中位につけた。
最下位グループ:AlibabaのQwen3ASRFlash(5.9%)、AmazonのNova2Omni(6.0%)、Rev AI(6.1%)がランキングの下位を占めました。

音声アシスタントコマンド専用のAA-AgentTalkベンチマークにおいても、順位は変わらなかった。ElevenLabsのScribe v2とGoogleのGemini3Proは、それぞれ1.6%と 1.7%の誤認識率で首位を維持し、短く直接的な音声対話において高い信頼性を示した。
「Cursor Composer 2」対「Claude Opus 4.6」:ベンチマークテストがAIコーディングを巡る新たな議論を巻き起こす
3月19日、Cursorは自社開発のコーディングモデル「Composer 2」を正式にリリースした。 この発表は開発者コミュニティで即座に議論を巻き起こした。Cursorによると、Composer 2はTerminal-Bench 2.0で61.7%のスコアを記録し、同一のテスト条件下でClaude Opus 4.6の58.0%を大幅に上回ったという。Anthropicのフラッグシップモデルが、自
「StrictlyVC サンフランシスコ」に、TDKベンチャーズやReplitなどのリーダーが集結
今年最初のStrictlyVCイベントが、あっという間にサンフランシスコで開催されます。 4月30日にセントロ・フィリピーノ・カルチュラル・センターで開催される本イベントのチケットは、現在も販売中です。豪華なスピーカー陣が登壇するこのイベントでは、StrictlyVCならではのネットワーキングやコミュニティ交流に加え、資金調達に関する最新の知見を求めるAI分野のイノベーターや起業家の方々にとって、
Notionは、ワークスペースをAIエージェントのハブへと変革します
生産性向上ソフトウェア企業であるNotionが、「エージェント時代」に突入する。水曜日にライブ配信された製品発表会で、共同ノート作成アプリで知られるNotionは、カスタムAIエージェントの機能を拡張し、外部エージェントと連携し、あらゆるデータベースからデータを取得できる自動化された多段階ワークフローをチームが構築できるようにする新しい開発者向けプラットフォームを発表した。複数のツールやデータソー





家






