Phonic是語音AI平台,可從Lux獲得投資

AI生成語音已經變得相當出色,你知道嗎?它們已經足以勝任製作有聲書、播客、大聲朗讀文章,甚至是基本的客戶支援工作。但許多企業對於AI語音技術在其運營中的可靠性仍未完全信服。
這正是Moin Nadeem和Nikhil Murthy這兩位麻省理工學院畢業生登場的地方。他們創辦了Phonic,一家專注於提升合成語音可靠性的公司,同時降低延遲。他們倆已經是七年的好友,從在麻省理工學院相識開始。去年他們創辦Phonic時,發現市場上存在一個缺口——沒有人真正提供完整的語音技術解決方案。
「語音AI現在處於一個階段,你需要將不同的部分拼接起來,比如自動語音辨識和文字轉語音,然後再加入一些智能,」Murthy向TechCrunch解釋道。「但當我們與實際客戶交流時,我們發現市場上缺乏能夠大規模可靠處理事務的解決方案。」
Nadeem曾就職於MosaicML(該公司於2023年被Databricks以13億美元收購),他指出語音AI領域的許多公司,如Vapi和Rounded,只是將不同的AI模型拼湊在一起。而Phonic則採取不同做法——他們從頭到尾自行訓練模型,完全內部完成。Murthy認為這種方式有很大的優勢。
「當你擁有模型時,你可以直接在模型中融入穩固的可靠性功能,」他說。「如果你無法控制這一層,你只是在試圖將不完全契合的東西黏合在一起。」
此外,Murthy提到,Phonic的做法讓他們能夠以成本效益高的方式託管和運行模型。他們用各種錄音訓練模型,包括帶口音和模糊的語音,以確保模型極其穩健。
目前,Phonic正與保險和醫療行業的一些特定合作夥伴合作,但他們正準備在幾個月內進行更廣泛的發布。Nadeem表示,很快任何有興趣的人都能直接從他們的網站體驗Phonic的技術。
Phonic已成功獲得400萬美元的種子輪融資,由Lux領投,Replit共同創辦人Amjad Masad、Hugging Face共同創辦人Clem Delangue、Applied Intuition共同創辦人Qasar Younis和Modal Labs創辦人Erik Bernhardsson等知名人士也參與投資。
Lux Capital的Grace Isford表示,他們被Phonic內部訓練模型的獨特方法所吸引。「我們認為Moin和Nikhil是非常出色的技術專家,」她說。「他們在麻省理工學院創辦了一個機器學習俱樂部,並長期致力於訓練模型。他們在語音AI領域中混合擴散模型與專有模型的方法非常創新。」
相關文章
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
以文字翻譯聞名的 DeepL,現已進軍語音翻譯領域
以文字翻譯工具聞名的翻譯公司 DeepL,今日推出了一套語音對語音翻譯解決方案,透過客製化應用程式,針對前線工作人員在會議、行動裝置與網路對話,以及群組討論等情境提供支援。 該公司同時推出了一項 API,讓外部開發者與企業能基於 DeepL 的技術,打造適用於呼叫中心等特定情境的解決方案。「在專注於文字翻譯多年後,語音翻譯對我們而言是水到渠成的下一步,」DeepL 執行長 Jarek Kutylo
Mistral 推出開源語音生成模型
法國人工智慧公司 Mistral 於週四推出一款全新的開源文字轉語音模型,專為語音 AI 助理及客戶支援等企業應用而設計。該模型使企業能夠開發用於銷售和客戶互動的語音代理,使 Mistral 成為 ElevenLabs、Deepgram 和 OpenAI 的直接競爭對手。這款名為 Voxtral TTS 的模型支援九種語言,包括英語、法語、德語、西班牙語、荷蘭語、葡萄牙語、義大利語、印地語和阿拉伯
相關專題推薦
評論 (50)
0/500
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!

AI生成語音已經變得相當出色,你知道嗎?它們已經足以勝任製作有聲書、播客、大聲朗讀文章,甚至是基本的客戶支援工作。但許多企業對於AI語音技術在其運營中的可靠性仍未完全信服。
這正是Moin Nadeem和Nikhil Murthy這兩位麻省理工學院畢業生登場的地方。他們創辦了Phonic,一家專注於提升合成語音可靠性的公司,同時降低延遲。他們倆已經是七年的好友,從在麻省理工學院相識開始。去年他們創辦Phonic時,發現市場上存在一個缺口——沒有人真正提供完整的語音技術解決方案。
「語音AI現在處於一個階段,你需要將不同的部分拼接起來,比如自動語音辨識和文字轉語音,然後再加入一些智能,」Murthy向TechCrunch解釋道。「但當我們與實際客戶交流時,我們發現市場上缺乏能夠大規模可靠處理事務的解決方案。」
Nadeem曾就職於MosaicML(該公司於2023年被Databricks以13億美元收購),他指出語音AI領域的許多公司,如Vapi和Rounded,只是將不同的AI模型拼湊在一起。而Phonic則採取不同做法——他們從頭到尾自行訓練模型,完全內部完成。Murthy認為這種方式有很大的優勢。
「當你擁有模型時,你可以直接在模型中融入穩固的可靠性功能,」他說。「如果你無法控制這一層,你只是在試圖將不完全契合的東西黏合在一起。」
此外,Murthy提到,Phonic的做法讓他們能夠以成本效益高的方式託管和運行模型。他們用各種錄音訓練模型,包括帶口音和模糊的語音,以確保模型極其穩健。
目前,Phonic正與保險和醫療行業的一些特定合作夥伴合作,但他們正準備在幾個月內進行更廣泛的發布。Nadeem表示,很快任何有興趣的人都能直接從他們的網站體驗Phonic的技術。
Phonic已成功獲得400萬美元的種子輪融資,由Lux領投,Replit共同創辦人Amjad Masad、Hugging Face共同創辦人Clem Delangue、Applied Intuition共同創辦人Qasar Younis和Modal Labs創辦人Erik Bernhardsson等知名人士也參與投資。
Lux Capital的Grace Isford表示,他們被Phonic內部訓練模型的獨特方法所吸引。「我們認為Moin和Nikhil是非常出色的技術專家,」她說。「他們在麻省理工學院創辦了一個機器學習俱樂部,並長期致力於訓練模型。他們在語音AI領域中混合擴散模型與專有模型的方法非常創新。」
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
以文字翻譯聞名的 DeepL,現已進軍語音翻譯領域
以文字翻譯工具聞名的翻譯公司 DeepL,今日推出了一套語音對語音翻譯解決方案,透過客製化應用程式,針對前線工作人員在會議、行動裝置與網路對話,以及群組討論等情境提供支援。 該公司同時推出了一項 API,讓外部開發者與企業能基於 DeepL 的技術,打造適用於呼叫中心等特定情境的解決方案。「在專注於文字翻譯多年後,語音翻譯對我們而言是水到渠成的下一步,」DeepL 執行長 Jarek Kutylo
Mistral 推出開源語音生成模型
法國人工智慧公司 Mistral 於週四推出一款全新的開源文字轉語音模型,專為語音 AI 助理及客戶支援等企業應用而設計。該模型使企業能夠開發用於銷售和客戶互動的語音代理,使 Mistral 成為 ElevenLabs、Deepgram 和 OpenAI 的直接競爭對手。這款名為 Voxtral TTS 的模型支援九種語言,包括英語、法語、德語、西班牙語、荷蘭語、葡萄牙語、義大利語、印地語和阿拉伯
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!





首頁






