Phonic是语音AI平台,可从Lux获得投资

AI生成的语音已经相当出色,你知道吗?它们完全胜任有声书、播客、朗读文章,甚至基本的客户支持。但很多企业仍对AI语音技术的可靠性持怀疑态度。
这时,MIT毕业生Moin Nadeem和Nikhil Murthy登场了。他们创立了Phonic,一家致力于提升合成语音可靠性并减少延迟的公司。这两位朋友相识超过七年,从MIT相识开始。去年创立Phonic时,他们发现市场上缺乏完整的语音技术解决方案。
“语音AI现在是将不同部分拼接在一起,比如自动语音识别和文本转语音,再加入一些智能,”Murthy对TechCrunch解释说。“但与真实客户交流后,我们发现能够大规模可靠处理事务的解决方案很匮乏。”
曾在MosaicML(2023年被Databricks以13亿美元收购)工作的Nadeem指出,语音AI领域的许多公司,如Vapi和Rounded,只是将不同的AI模型拼凑在一起。而Phonic则不同,他们从头到尾自主训练模型。Murthy认为这种方式有很大优势。
“当你拥有模型时,可以直接在模型中嵌入强大的可靠性功能,”他说。“如果不控制这一层,你只是在尝试将不完全匹配的部分粘合在一起。”
此外,Murthy提到,Phonic的方法让他们能够以成本效益高的方式托管和运行模型。他们在各种录音上训练模型,包括带口音和模糊的语音,以确保模型非常稳健。
目前,Phonic正与保险和医疗行业的一些特定合作伙伴合作,但他们正准备在几个月内进行更广泛的发布。Nadeem表示,很快任何感兴趣的人都可以直接从他们的网站体验Phonic的技术。
Phonic已成功获得400万美元的种子轮融资,由Lux领投,Replit联合创始人Amjad Masad、Hugging Face联合创始人Clem Delangue、Applied Intuition联合创始人Qasar Younis和Modal Labs创始人Erik Bernhardsson等大咖也参与其中。
Lux Capital的Grace Isford表示,他们被Phonic自主训练模型的独特方法所吸引。“我们认为Moin和Nikhil是出色的技术专家,”她说。“他们在MIT创立了机器学习俱乐部,并且一直在从事模型训练工作。他们在语音AI领域混合使用扩散模型和专有模型的方法非常创新。”
相关文章
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者
语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech
Mistral 发布开源语音生成模型
法国人工智能公司Mistral于周四发布了一款新的开源文本转语音模型,该模型专为语音AI助手及客户支持等企业应用而设计。该模型使企业能够构建用于销售和客户互动的语音代理,从而使Mistral成为ElevenLabs、Deepgram和OpenAI的直接竞争对手。该模型名为Voxtral TTS,支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。“我们的客户
相关专题推荐
评论 (50)
0/500
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!

AI生成的语音已经相当出色,你知道吗?它们完全胜任有声书、播客、朗读文章,甚至基本的客户支持。但很多企业仍对AI语音技术的可靠性持怀疑态度。
这时,MIT毕业生Moin Nadeem和Nikhil Murthy登场了。他们创立了Phonic,一家致力于提升合成语音可靠性并减少延迟的公司。这两位朋友相识超过七年,从MIT相识开始。去年创立Phonic时,他们发现市场上缺乏完整的语音技术解决方案。
“语音AI现在是将不同部分拼接在一起,比如自动语音识别和文本转语音,再加入一些智能,”Murthy对TechCrunch解释说。“但与真实客户交流后,我们发现能够大规模可靠处理事务的解决方案很匮乏。”
曾在MosaicML(2023年被Databricks以13亿美元收购)工作的Nadeem指出,语音AI领域的许多公司,如Vapi和Rounded,只是将不同的AI模型拼凑在一起。而Phonic则不同,他们从头到尾自主训练模型。Murthy认为这种方式有很大优势。
“当你拥有模型时,可以直接在模型中嵌入强大的可靠性功能,”他说。“如果不控制这一层,你只是在尝试将不完全匹配的部分粘合在一起。”
此外,Murthy提到,Phonic的方法让他们能够以成本效益高的方式托管和运行模型。他们在各种录音上训练模型,包括带口音和模糊的语音,以确保模型非常稳健。
目前,Phonic正与保险和医疗行业的一些特定合作伙伴合作,但他们正准备在几个月内进行更广泛的发布。Nadeem表示,很快任何感兴趣的人都可以直接从他们的网站体验Phonic的技术。
Phonic已成功获得400万美元的种子轮融资,由Lux领投,Replit联合创始人Amjad Masad、Hugging Face联合创始人Clem Delangue、Applied Intuition联合创始人Qasar Younis和Modal Labs创始人Erik Bernhardsson等大咖也参与其中。
Lux Capital的Grace Isford表示,他们被Phonic自主训练模型的独特方法所吸引。“我们认为Moin和Nikhil是出色的技术专家,”她说。“他们在MIT创立了机器学习俱乐部,并且一直在从事模型训练工作。他们在语音AI领域混合使用扩散模型和专有模型的方法非常创新。”
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者
语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech
Mistral 发布开源语音生成模型
法国人工智能公司Mistral于周四发布了一款新的开源文本转语音模型,该模型专为语音AI助手及客户支持等企业应用而设计。该模型使企业能够构建用于销售和客户互动的语音代理,从而使Mistral成为ElevenLabs、Deepgram和OpenAI的直接竞争对手。该模型名为Voxtral TTS,支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。“我们的客户
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!





首页






