以文字翻譯聞名的 DeepL,現已進軍語音翻譯領域

以文字翻譯工具聞名的翻譯公司 DeepL,今日推出了一套語音對語音翻譯解決方案,透過客製化應用程式,針對前線工作人員在會議、行動裝置與網路對話,以及群組討論等情境提供支援。 該公司同時推出了一項 API,讓外部開發者與企業能基於 DeepL 的技術,打造適用於呼叫中心等特定情境的解決方案。
「在專注於文字翻譯多年後,語音翻譯對我們而言是水到渠成的下一步,」DeepL 執行長 Jarek Kutylowski 在接受 TechCrunch 採訪時表示。「我們在文字與文件翻譯方面已取得顯著進展,但我們認為目前市面上尚缺乏一款出色的即時語音翻譯產品。」
庫蒂洛夫斯基解釋,開發即時翻譯產品的主要挑戰在於,如何在降低延遲(即使用者說話與聽到翻譯音訊之間的間隔)與維持高準確度之間取得適當平衡。
DeepL 即將推出適用於 Zoom 和 Microsoft Teams 等平台的擴充功能,讓聽眾在他人以母語說話時,既能聆聽即時翻譯,也能在螢幕上追蹤即時翻譯的文字。此計畫目前開放早期體驗,公司正邀請各組織加入候補名單。 DeepL 同時提供適用於行動裝置及網頁端對話的產品,無論是面對面或遠端溝通皆可使用。
DeepL 還讓使用者能參與培訓課程或工作坊等群組對話,與會者可透過 QR 碼加入。
DeepL 表示,其語音對語音技術能夠學習並適應自訂詞彙,包括行業專用術語,以及公司名稱和個人姓名。
Kutylowski 指出,人工智慧將在未來幾年重塑客戶服務。他強調,翻譯層有助於企業在缺乏合格人員且聘僱成本高昂的語言領域提供支援。
該公司聲稱其掌控了整個語音對語音技術棧。然而,現行系統的運作流程是將語音轉為文字、進行翻譯,再將文字轉回語音。DeepL 認為,其在文字翻譯領域多年的經驗,使其在翻譯品質上具備優勢。 展望未來,該公司目標是開發一套端到端的語音翻譯模型,完全跳過文字轉換步驟。
DeepL 面臨來自數家資金雄厚、活躍於相關領域新創公司的競爭。Sanas 去年從 Quadrille Capital 和 Teleperformance 籌得 6,500 萬美元,該公司利用 AI 即時調整說話者的口音——這項工具主要針對客服中心人員。
總部位於杜拜的 Camb.AI 專注於為媒體與娛樂公司(包括亞馬遜網路服務)提供語音合成與翻譯服務,協助其大規模地為影片內容進行配音與在地化。
由 Reddit 共同創辦人 Alexis Ohanian 的投資公司 Seven Seven Six 支持的 Palabra,正在開發一款即時語音翻譯引擎,旨在同時保留語意與講者原聲,這使其與 DeepL 目前正在開發的技術形成更直接的競爭關係。
相關文章
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
Mistral 推出開源語音生成模型
法國人工智慧公司 Mistral 於週四推出一款全新的開源文字轉語音模型,專為語音 AI 助理及客戶支援等企業應用而設計。該模型使企業能夠開發用於銷售和客戶互動的語音代理,使 Mistral 成為 ElevenLabs、Deepgram 和 OpenAI 的直接競爭對手。這款名為 Voxtral TTS 的模型支援九種語言,包括英語、法語、德語、西班牙語、荷蘭語、葡萄牙語、義大利語、印地語和阿拉伯
頂尖 AI 語音輸入應用程式:專家評測與排行榜
AI 語音輸入應用程式在相對短的時間內取得了顯著進展。長期以來,這些應用程式反應遲緩且容易出錯,要求使用者必須以特定口音清晰地發音。隨著大型語言模型(LLMs)與語音轉文字技術的進步,這種情況已然改變,如今的系統不僅能更精準地理解語音,還能運用語境來正確格式化文字。開發者已整合多項功能,可自動刪除口頭語、修正口誤並管理標點符號,產出的文字幾乎無需編輯。鑑於現今選擇眾多,我們整理了一份您現在即可使用
相關專題推薦
評論 (0)
0/500

以文字翻譯工具聞名的翻譯公司 DeepL,今日推出了一套語音對語音翻譯解決方案,透過客製化應用程式,針對前線工作人員在會議、行動裝置與網路對話,以及群組討論等情境提供支援。 該公司同時推出了一項 API,讓外部開發者與企業能基於 DeepL 的技術,打造適用於呼叫中心等特定情境的解決方案。
「在專注於文字翻譯多年後,語音翻譯對我們而言是水到渠成的下一步,」DeepL 執行長 Jarek Kutylowski 在接受 TechCrunch 採訪時表示。「我們在文字與文件翻譯方面已取得顯著進展,但我們認為目前市面上尚缺乏一款出色的即時語音翻譯產品。」
庫蒂洛夫斯基解釋,開發即時翻譯產品的主要挑戰在於,如何在降低延遲(即使用者說話與聽到翻譯音訊之間的間隔)與維持高準確度之間取得適當平衡。
DeepL 即將推出適用於 Zoom 和 Microsoft Teams 等平台的擴充功能,讓聽眾在他人以母語說話時,既能聆聽即時翻譯,也能在螢幕上追蹤即時翻譯的文字。此計畫目前開放早期體驗,公司正邀請各組織加入候補名單。 DeepL 同時提供適用於行動裝置及網頁端對話的產品,無論是面對面或遠端溝通皆可使用。
DeepL 還讓使用者能參與培訓課程或工作坊等群組對話,與會者可透過 QR 碼加入。
DeepL 表示,其語音對語音技術能夠學習並適應自訂詞彙,包括行業專用術語,以及公司名稱和個人姓名。
Kutylowski 指出,人工智慧將在未來幾年重塑客戶服務。他強調,翻譯層有助於企業在缺乏合格人員且聘僱成本高昂的語言領域提供支援。
該公司聲稱其掌控了整個語音對語音技術棧。然而,現行系統的運作流程是將語音轉為文字、進行翻譯,再將文字轉回語音。DeepL 認為,其在文字翻譯領域多年的經驗,使其在翻譯品質上具備優勢。 展望未來,該公司目標是開發一套端到端的語音翻譯模型,完全跳過文字轉換步驟。
DeepL 面臨來自數家資金雄厚、活躍於相關領域新創公司的競爭。Sanas 去年從 Quadrille Capital 和 Teleperformance 籌得 6,500 萬美元,該公司利用 AI 即時調整說話者的口音——這項工具主要針對客服中心人員。
總部位於杜拜的 Camb.AI 專注於為媒體與娛樂公司(包括亞馬遜網路服務)提供語音合成與翻譯服務,協助其大規模地為影片內容進行配音與在地化。
由 Reddit 共同創辦人 Alexis Ohanian 的投資公司 Seven Seven Six 支持的 Palabra,正在開發一款即時語音翻譯引擎,旨在同時保留語意與講者原聲,這使其與 DeepL 目前正在開發的技術形成更直接的競爭關係。
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
Mistral 推出開源語音生成模型
法國人工智慧公司 Mistral 於週四推出一款全新的開源文字轉語音模型,專為語音 AI 助理及客戶支援等企業應用而設計。該模型使企業能夠開發用於銷售和客戶互動的語音代理,使 Mistral 成為 ElevenLabs、Deepgram 和 OpenAI 的直接競爭對手。這款名為 Voxtral TTS 的模型支援九種語言,包括英語、法語、德語、西班牙語、荷蘭語、葡萄牙語、義大利語、印地語和阿拉伯
頂尖 AI 語音輸入應用程式:專家評測與排行榜
AI 語音輸入應用程式在相對短的時間內取得了顯著進展。長期以來,這些應用程式反應遲緩且容易出錯,要求使用者必須以特定口音清晰地發音。隨著大型語言模型(LLMs)與語音轉文字技術的進步,這種情況已然改變,如今的系統不僅能更精準地理解語音,還能運用語境來正確格式化文字。開發者已整合多項功能,可自動刪除口頭語、修正口誤並管理標點符號,產出的文字幾乎無需編輯。鑑於現今選擇眾多,我們整理了一份您現在即可使用





首頁






