ElevenLabs 樹立新的語音轉文字基準;Google Gemini 緊隨其後,展現廣泛功能
Artificial Analysis 已發布其語音轉文字基準測試的最新版本——AA-WER v2.0。測試結果顯示,ElevenLabs 和 Google 在語音轉文字表現方面明顯領先。

以核心字元錯誤率(WER)為衡量標準時,ElevenLabs 的Scribe v2以驚人的2.3%低錯誤率奪得榜首。緊隨其後的是Google 的 Gemini3Pro,錯誤率為 2.9%。值得注意的是,Google 並未針對轉錄任務對 Gemini 進行微調;此結果純粹源自其強大的多模態通用能力。
其他領先模型的結果如下:
Mistral Voxtral Small:以3.0%的錯誤率位居第三。
Google Gemini3Flash:表現穩健,錯誤率為3.1%。
OpenAI Whisper Large v3:這款最廣泛使用的開源模型以4.2%的錯誤率位居中游。
表現最差者:阿里巴巴的Qwen3ASR Flash(5.9%)、亞馬遜的Nova2Omni(6.0%)以及Rev AI(6.1%)則位居排行榜末端。

在專為語音助理指令設計的AA-AgentTalk基準測試中,排行榜名次保持不變。ElevenLabs 的 Scribe v2 與 Google 的 Gemini3Pro 分別以1.6%和1.7%的錯誤率維持領先地位,證明了它們在簡短、直接的語音互動中極具可靠性。
相關文章
iOS 27 將推出具備聊天機器人介面的獨立版 Siri 應用程式
距離蘋果 2026 年全球開發者大會(WWDC)開辦不到一個月,知名科技記者馬克·古爾曼(Mark Gurman)分享了關於 iOS 27 的最新消息。 在代號為「Rave」的即將推出的系統中,Siri 將以獨立應用程式的形式強勢回歸——這標誌著睽違 15 年後,Siri 再次擁有專屬的入口。更新後的Siri將作為一款常駐的智能助理,具備類似聊天機器人的介面,支援對話記錄、檔案上傳及內容釘選功能。
AI 專家進駐:大型模型進駐工廠,工業製造邁入新紀元
在生物發酵、建築設計,甚至廢水處理等領域的前線,一種新型的「員工」正悄然重塑傳統製造業。他們並非滿身大汗的工人,而是被稱為「AI大師」的工業時間序列控制大型模型,其名稱為ManuDrive。上海交通大學人工智慧與微結構實驗室(AIMS Lab)近期的一項突破性成果,已引起業界的矚目。由李金金教授創立的這家科技公司,正將人工智慧的應用範圍從文字生成與影像處理,拓展至充滿噪音與油漬的工廠現場。 與常見
Google 相片運用人工智慧,讓《窈窕淑女》中那座標誌性的衣櫥栩栩如生
Google Photos 於週三宣布了一項由人工智慧驅動的新功能,這項功能將很快能將您衣物的照片轉化為數位衣櫥,讓您能創造嶄新的穿搭組合,甚至進行虛擬試穿。這個概念顯然是受到電影《窈窕淑女》中 Cher 那座標誌性的虛擬衣櫥啟發,她在片中可以瀏覽眾多服裝組合,同時決定該穿什麼。Google表示,這項功能將運用AI技術,根據您Google相簿圖庫中的衣物,自動建立您的衣櫥數位副本。在應用程式內,您
相關專題推薦
評論 (1)
0/500
Artificial Analysis 已發布其語音轉文字基準測試的最新版本——AA-WER v2.0。測試結果顯示,ElevenLabs 和 Google 在語音轉文字表現方面明顯領先。

以核心字元錯誤率(WER)為衡量標準時,ElevenLabs 的Scribe v2以驚人的2.3%低錯誤率奪得榜首。緊隨其後的是Google 的 Gemini3Pro,錯誤率為 2.9%。值得注意的是,Google 並未針對轉錄任務對 Gemini 進行微調;此結果純粹源自其強大的多模態通用能力。
其他領先模型的結果如下:
Mistral Voxtral Small:以3.0%的錯誤率位居第三。
Google Gemini3Flash:表現穩健,錯誤率為3.1%。
OpenAI Whisper Large v3:這款最廣泛使用的開源模型以4.2%的錯誤率位居中游。
表現最差者:阿里巴巴的Qwen3ASR Flash(5.9%)、亞馬遜的Nova2Omni(6.0%)以及Rev AI(6.1%)則位居排行榜末端。

在專為語音助理指令設計的AA-AgentTalk基準測試中,排行榜名次保持不變。ElevenLabs 的 Scribe v2 與 Google 的 Gemini3Pro 分別以1.6%和1.7%的錯誤率維持領先地位,證明了它們在簡短、直接的語音互動中極具可靠性。
iOS 27 將推出具備聊天機器人介面的獨立版 Siri 應用程式
距離蘋果 2026 年全球開發者大會(WWDC)開辦不到一個月,知名科技記者馬克·古爾曼(Mark Gurman)分享了關於 iOS 27 的最新消息。 在代號為「Rave」的即將推出的系統中,Siri 將以獨立應用程式的形式強勢回歸——這標誌著睽違 15 年後,Siri 再次擁有專屬的入口。更新後的Siri將作為一款常駐的智能助理,具備類似聊天機器人的介面,支援對話記錄、檔案上傳及內容釘選功能。
AI 專家進駐:大型模型進駐工廠,工業製造邁入新紀元
在生物發酵、建築設計,甚至廢水處理等領域的前線,一種新型的「員工」正悄然重塑傳統製造業。他們並非滿身大汗的工人,而是被稱為「AI大師」的工業時間序列控制大型模型,其名稱為ManuDrive。上海交通大學人工智慧與微結構實驗室(AIMS Lab)近期的一項突破性成果,已引起業界的矚目。由李金金教授創立的這家科技公司,正將人工智慧的應用範圍從文字生成與影像處理,拓展至充滿噪音與油漬的工廠現場。 與常見
Google 相片運用人工智慧,讓《窈窕淑女》中那座標誌性的衣櫥栩栩如生
Google Photos 於週三宣布了一項由人工智慧驅動的新功能,這項功能將很快能將您衣物的照片轉化為數位衣櫥,讓您能創造嶄新的穿搭組合,甚至進行虛擬試穿。這個概念顯然是受到電影《窈窕淑女》中 Cher 那座標誌性的虛擬衣櫥啟發,她在片中可以瀏覽眾多服裝組合,同時決定該穿什麼。Google表示,這項功能將運用AI技術,根據您Google相簿圖庫中的衣物,自動建立您的衣櫥數位副本。在應用程式內,您





首頁






