選項
首頁
新聞
Elevenlabs推出了新的語音到文本模型

Elevenlabs推出了新的語音到文本模型

2025-04-10
114

ElevenLabs,一家最近獲得1.8億美元融資的AI新創公司,以其音頻生成技術聞名。但現在,他們大膽跨入新領域,推出首個獨立語音轉文字模型,名為Scribe。

估值33億美元的ElevenLabs一直是許多公司尋求文字轉語音服務的首選,歸功於其龐大的語音庫。現在,他們將目標轉向語音檢測,旨在挑戰Gladia、Speechmatics、AssemblyAI、Deepgram及OpenAI的Whisper模型等大品牌。

Scribe一開始就支援超過99種語言。ElevenLabs表示,其在超過25種語言中具有出色準確度,字詞錯誤率低於5%。包括英語(號稱準確度97%)、法語、德語、印地語、印尼語、日語、卡納達語、馬拉雅拉姆語、波蘭語、葡萄牙語、西班牙語及越南語等。其他語言分為不同準確度類別:高(5%至10%字詞錯誤率)、良好(10%至20%字詞錯誤率)及中等(25%至50%)。

該公司聲稱,根據FLEURS與Common Voice基準測試,Scribe在多種語言中超越Google Gemini 2.0 Flash及Whisper Large V3。

圖片來源:ElevenLabs

ElevenLabs去年實際上已為其AI對話代理平台建構了語音轉文字功能,但Scribe是他們首次推出的獨立語音檢測模型。上個月與TechCrunch的對話中,執行長Mati Staniszewski透露了他們增強語音檢測技術的計劃。

Staniszewski表示:「我們希望更擅長理解你在對話中說什麼。我們不再僅限於生成內容;我們正轉向理解與轉錄語音。很多人認為語音轉文字已是舊技術,但在許多語言中仍相當粗糙。我們認為可以做得更好,因為我們有內部團隊標記數據並提供快速反饋。」

Scribe還具備一些很酷的功能,例如智能語者分割以辨識誰在說話、字級時間戳記以提供精準字幕,以及自動標記觀眾笑聲等聲音事件。此外,ElevenLabs允許客戶直接轉錄視頻內容,在其工作室中添加字幕或標題。

目前,Scribe僅支援預錄音頻。但公司表示,他們正在開發低延遲的實時版本,很快將推出。因此,暫時還不適用於會議記錄或語音筆記。

ElevenLabs對Scribe的收費為每小時轉錄音頻0.40美元。價格具競爭力,但一些競爭對手提供更低的音頻轉錄費率,並附帶一些不同的功能。

相關文章
創建AI驅動的著色書:全面指南 創建AI驅動的著色書:全面指南 設計著色書是一項有益的追求,結合藝術表達與為使用者提供平靜的體驗。然而,此過程可能相當勞力密集。幸運的是,AI工具能輕鬆簡化高品質、一致的著色頁創建。本指南提供使用AI製作著色書的逐步方法,專注於保持一致風格和最佳效率的技術。關鍵要點使用AI提示工具開發詳細、結構化的著色頁提示。確保著色書中所有頁面的藝術風格一致。生成單一著色頁設計的多樣變化。利用Ideogram等AI平台快速高效創建著色書。精煉
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。國際數學奧林匹克的重要性自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽
評論 (27)
0/200
TimothyMartínez
TimothyMartínez 2025-08-21 21:01:20

Scribe sounds like a game-changer! I'm curious if it'll handle my thick accent as well as it claims. Excited to try it for podcast transcriptions! 😎

MatthewTaylor
MatthewTaylor 2025-08-13 05:00:59

Just saw ElevenLabs' Scribe model news—97% accuracy in English is wild! 😮 I'm curious how it'll handle my thick accent in meetings. Hope they drop that real-time version soon!

RogerRoberts
RogerRoberts 2025-04-21 09:44:55

¡El Scribe de ElevenLabs es genial! Es increíble cómo han entrado en el mercado de voz a texto con un modelo tan sólido. Mi única queja es que a veces tiene problemas con acentos fuertes. Pero, para ser el primer intento, es bastante impresionante. ¡Sigan así, ElevenLabs! 🚀

RalphHill
RalphHill 2025-04-21 04:36:44

O novo modelo Scribe do ElevenLabs é incrível! Eles passaram da geração de áudio para o reconhecimento de fala de forma tão suave. Testei e a precisão é boa, mas tropeça um pouco com sotaques fortes. Vale a pena conferir se você gosta de IA! 😊

PaulBrown
PaulBrown 2025-04-20 10:47:04

ElevenLabsのScribeはすごいね!音声からテキストへの変換がこんなにスムーズだなんて。ただ、少しだけ重いアクセントだと苦手なところがあるかな。でも、初挑戦にしてはかなり良いと思うよ!頑張ってね、ElevenLabs!🚀

HarryLewis
HarryLewis 2025-04-20 09:23:49

ElevenLabs의 Scribe 정말 멋지네요! 음성에서 텍스트로 변환하는 게 이렇게 부드럽다니. 다만, 조금 무거운 억양은 어려워하는 것 같아요. 그래도 첫 시도치고는 꽤 훌륭해요! 계속 화이팅, ElevenLabs! 🚀

回到頂部
OR