AI幫助印第安人在與Krisp的電話中發出美國人的聲音
在週三,音頻初創公司Krisp推出了一項突破性功能,利用AI在通話中改變使用者的口音。該公司最初專注於將印度英語口音轉換為美國英語口音。
根據Krisp的說法,口音轉換技術保留了講者的原始聲音,僅修改音素以符合美國口音。這項功能已在企業環境中進行試驗,現已進入Krisp桌面應用程式的測試階段。使用者可以在通話前或通話中隨時啟用此功能。
Krisp的聯合創始人Arto Minasyan分享了這項創新的靈感,講述了他自己的經歷。「很多人難以理解我的口音,即使我的英語說得很好。我們相信,通過改變口音,我們可以顯著改善溝通。我們已經為這個解決方案工作了兩年,我們很高興能推出測試版,」Minasyan解釋道。
然而,在我測試這項功能時,處理後的聲音顯得有些不自然,偶爾會遺漏單詞。Krisp承認這些問題是測試階段的一部分,並向使用者保證該模型將隨著時間推移而進化和改進。
Krisp報告稱,在企業試驗中,這項功能使銷售轉換率提高了26.1%,每筆預訂的收入增加了14.8%。

圖片來源:Krisp.ai 選擇從印度口音開始的決定,是因為印度專業人士在全球STEM領域中佔有重要地位。Krisp計劃未來擴展支持,包括菲律賓口音等。其他初創公司,如GV支持的Sanas,已經在呼叫中心大規模實施類似技術。
該公司在其會議助手的數據基礎上,經使用者同意,使用了代表各種口音和方言的數千個語音樣本來訓練其模型。
Minasyan強調了這項功能的另一個優勢:它無需對使用者的聲音進行任何預訓練,因為它會即時動態創建講者檔案。
Krisp於2021年最後一次獲得融資,計劃在今年晚些時候推出iOS和Android應用程式,以增強面對面會議體驗。此外,還在開發一個新的Chrome擴展程式,以改善與Google Meet的整合。
相關文章
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
以文字翻譯聞名的 DeepL,現已進軍語音翻譯領域
以文字翻譯工具聞名的翻譯公司 DeepL,今日推出了一套語音對語音翻譯解決方案,透過客製化應用程式,針對前線工作人員在會議、行動裝置與網路對話,以及群組討論等情境提供支援。 該公司同時推出了一項 API,讓外部開發者與企業能基於 DeepL 的技術,打造適用於呼叫中心等特定情境的解決方案。「在專注於文字翻譯多年後,語音翻譯對我們而言是水到渠成的下一步,」DeepL 執行長 Jarek Kutylo
Mistral 推出開源語音生成模型
法國人工智慧公司 Mistral 於週四推出一款全新的開源文字轉語音模型,專為語音 AI 助理及客戶支援等企業應用而設計。該模型使企業能夠開發用於銷售和客戶互動的語音代理,使 Mistral 成為 ElevenLabs、Deepgram 和 OpenAI 的直接競爭對手。這款名為 Voxtral TTS 的模型支援九種語言,包括英語、法語、德語、西班牙語、荷蘭語、葡萄牙語、義大利語、印地語和阿拉伯
相關專題推薦
評論 (48)
0/500
오늘 AI로 억양 변환하는 기술 기사 읽었는데요. 우리나라에서도 한참 영어 발음 걱정하는 사람들 많은데, 이 기술이 한국인 억양도 분석해줄 수 있을까요? 한국 영어교육 시장에 적용되면 진짜 대박 날 거 같은데... 🤔 그런데 미국식 억양이 ‘표준’이라는 가정 자체가 좀 불편하네요.
Je trouve ça un peu inquiétant ce besoin de gommer les accents régionaux pour correspondre à une norme... L'intelligence artificielle devrait-elle vraiment servir à uniformiser nos identités culturelles au lieu de nous aider à mieux nous comprendre mutuellement ? 😕
This AI accent switch is wild! It’s like giving your voice a Hollywood makeover in real-time. I wonder how it handles regional Indian accents—pretty cool for call centers, but does it make everyone sound like a generic American newscaster? 😄
La nueva función de IA de Krisp para sonar americano es alucinante. Es genial cambiar de acento en las llamadas, pero es raro perder mi acento indio. Es útil para el trabajo, pero espero que no nos haga sonar todos iguales. 🤔
在週三,音頻初創公司Krisp推出了一項突破性功能,利用AI在通話中改變使用者的口音。該公司最初專注於將印度英語口音轉換為美國英語口音。
根據Krisp的說法,口音轉換技術保留了講者的原始聲音,僅修改音素以符合美國口音。這項功能已在企業環境中進行試驗,現已進入Krisp桌面應用程式的測試階段。使用者可以在通話前或通話中隨時啟用此功能。
Krisp的聯合創始人Arto Minasyan分享了這項創新的靈感,講述了他自己的經歷。「很多人難以理解我的口音,即使我的英語說得很好。我們相信,通過改變口音,我們可以顯著改善溝通。我們已經為這個解決方案工作了兩年,我們很高興能推出測試版,」Minasyan解釋道。
然而,在我測試這項功能時,處理後的聲音顯得有些不自然,偶爾會遺漏單詞。Krisp承認這些問題是測試階段的一部分,並向使用者保證該模型將隨著時間推移而進化和改進。
Krisp報告稱,在企業試驗中,這項功能使銷售轉換率提高了26.1%,每筆預訂的收入增加了14.8%。

其他初創公司,如GV支持的Sanas,已經在呼叫中心大規模實施類似技術。
該公司在其會議助手的數據基礎上,經使用者同意,使用了代表各種口音和方言的數千個語音樣本來訓練其模型。
Minasyan強調了這項功能的另一個優勢:它無需對使用者的聲音進行任何預訓練,因為它會即時動態創建講者檔案。
Krisp於2021年最後一次獲得融資,計劃在今年晚些時候推出iOS和Android應用程式,以增強面對面會議體驗。此外,還在開發一個新的Chrome擴展程式,以改善與Google Meet的整合。
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
以文字翻譯聞名的 DeepL,現已進軍語音翻譯領域
以文字翻譯工具聞名的翻譯公司 DeepL,今日推出了一套語音對語音翻譯解決方案,透過客製化應用程式,針對前線工作人員在會議、行動裝置與網路對話,以及群組討論等情境提供支援。 該公司同時推出了一項 API,讓外部開發者與企業能基於 DeepL 的技術,打造適用於呼叫中心等特定情境的解決方案。「在專注於文字翻譯多年後,語音翻譯對我們而言是水到渠成的下一步,」DeepL 執行長 Jarek Kutylo
Mistral 推出開源語音生成模型
法國人工智慧公司 Mistral 於週四推出一款全新的開源文字轉語音模型,專為語音 AI 助理及客戶支援等企業應用而設計。該模型使企業能夠開發用於銷售和客戶互動的語音代理,使 Mistral 成為 ElevenLabs、Deepgram 和 OpenAI 的直接競爭對手。這款名為 Voxtral TTS 的模型支援九種語言,包括英語、法語、德語、西班牙語、荷蘭語、葡萄牙語、義大利語、印地語和阿拉伯
오늘 AI로 억양 변환하는 기술 기사 읽었는데요. 우리나라에서도 한참 영어 발음 걱정하는 사람들 많은데, 이 기술이 한국인 억양도 분석해줄 수 있을까요? 한국 영어교육 시장에 적용되면 진짜 대박 날 거 같은데... 🤔 그런데 미국식 억양이 ‘표준’이라는 가정 자체가 좀 불편하네요.
Je trouve ça un peu inquiétant ce besoin de gommer les accents régionaux pour correspondre à une norme... L'intelligence artificielle devrait-elle vraiment servir à uniformiser nos identités culturelles au lieu de nous aider à mieux nous comprendre mutuellement ? 😕
This AI accent switch is wild! It’s like giving your voice a Hollywood makeover in real-time. I wonder how it handles regional Indian accents—pretty cool for call centers, but does it make everyone sound like a generic American newscaster? 😄
La nueva función de IA de Krisp para sonar americano es alucinante. Es genial cambiar de acento en las llamadas, pero es raro perder mi acento indio. Es útil para el trabajo, pero espero que no nos haga sonar todos iguales. 🤔





首頁






