Phonic, uma plataforma de voz de voz, protege o investimento de Lux

As vozes geradas pela IA ficaram muito boas, sabe? Eles estão prontos para fazer coisas como audiolivros, podcasts, lendo artigos em voz alta e até suporte básico ao cliente. Mas muitas empresas ainda não são totalmente vendidas com a confiabilidade da tecnologia de voz da IA para suas operações.
É aí que Moin Nadeem e Nikhil Murthy, alguns graduados do MIT, entram. Eles começaram a Phonic, uma empresa que se trata de reforçar a confiabilidade das vozes sintéticas enquanto cortava o atraso. Esses caras são amigos há mais de sete anos, desde que se conheceram no MIT. Quando eles começaram a Phonic no ano passado, eles notaram uma lacuna no mercado-ninguém estava realmente oferecendo uma solução completa de tecnologia de voz.
"A Voice AI está em um ponto em que você está costurando diferentes pedaços, como reconhecimento automático de voz e fala em fala e, em seguida, adiciona alguns inteligentes", explicou Murthy ao TechCrunch. "Mas quando conversamos com clientes reais, percebemos que há uma escassez de soluções que podem lidar com as coisas de maneira confiável em larga escala".
Nadeem, que costumava trabalhar na MosaicML (que os Databricks aceleraram por US $ 1,3 bilhão em 2023), apontou que muitas empresas no espaço da AI de voz, como Vapi e arredondadas, estão apenas subindo diferentes modelos de IA. O Phonic, por outro lado, faz as coisas de maneira diferente-elas treinam seus modelos do início ao fim, tudo internamente. Murthy acha que essa abordagem tem grandes vantagens.
"Quando você possui os modelos, você pode realmente assar alguns recursos de confiabilidade sólidos nos próprios modelos", disse ele. "Se você não controla essa camada, está apenas tentando colar pedaços juntos que realmente não combinam bem."
Além disso, Murthy mencionou que a maneira de fazer as coisas de Phonic permite que eles hospedem e administram seus modelos de maneira econômica. Eles treinam seus modelos em todos os tipos de gravações, incluindo discursos acentuados e abafados, para garantir que sejam super robustos.
No momento, o Phonic está trabalhando com um grupo seleto de parceiros nas indústrias de seguros e saúde, mas estão se preparando para um lançamento mais amplo em alguns meses. Nadeem disse em breve: qualquer um interessado pode dar um giro da tecnologia de Phonic diretamente em seu site.
O Phonic conseguiu ganhar US $ 4 milhões em financiamento de sementes, com Lux liderando a rodada e alguns grandes nomes, como o co-fundador da Replit, Amjad Masad, abraçando o co-fundador do Clem DeLangue, o co-fundador da Intuição aplicado Qasar Younis e o fundador da Modal Labs, Erik Bernhards, entrando.
Grace Isford, da Lux Capital, disse que foi atraída para a abordagem única de Phonic para treinar modelos internamente. "Achamos que Moin e Nikhil são tecnólogos incríveis", disse ela. "Eles iniciaram um clube de aprendizado de máquina no MIT e estão trabalhando em modelos de treinamento há algum tempo. Seu método de misturar modelos de difusão e proprietário no setor de IA de voz é bastante inovador".
Artigo relacionado
एमआईटी अध्ययन में पाया गया है कि एआई वास्तव में, मूल्य नहीं है
एक अध्ययन जो कुछ महीने पहले वायरल हुआ था, ने सुझाव दिया कि जैसे-जैसे एआई अधिक उन्नत होता है, यह अपने स्वयं के "मूल्य प्रणालियों" को विकसित कर सकता है, संभावित रूप से मनुष्यों पर अपनी भलाई को प्राथमिकता देता है। हालांकि, एक हालिया एमआईटी अध्ययन इस विचार को चुनौती देता है, यह निष्कर्ष निकाला कि एआई वास्तव में सुसंगत मूल्यों के अधिकारी नहीं है।
अप्रैल 2025 के लिए शीर्ष 10 एआई आवाज जनरेटर का खुलासा हुआ
प्रौद्योगिकी की दुनिया को कृत्रिम बुद्धिमत्ता द्वारा बदल दिया गया है, और इस दायरे में सबसे गतिशील क्षेत्रों में से एक एआई वॉयस जनरेशन है। ये उपकरण अविश्वसनीय रूप से उन्नत हो गए हैं, विभिन्न प्रकार की आवाज़ें प्रदान करते हैं जिन्हें विभिन्न आवश्यकताओं और वरीयताओं के अनुरूप अनुकूलित किया जा सकता है। सीआर से
एआई भारतीयों को क्रिस्प के साथ कॉल पर अमेरिकी ध्वनि को मदद करता है
बुधवार को, ऑडियो स्टार्टअप क्रिस्प ने एक ग्राउंडब्रेकिंग सुविधा का अनावरण किया, जो कॉल के दौरान उपयोगकर्ता के उच्चारण को बदलने के लिए एआई का लाभ उठाता है। प्रारंभ में, कंपनी भारतीय अंग्रेजी लहजे को अमेरिकी अंग्रेजी में बदलने पर ध्यान केंद्रित कर रही है। KRISP के अनुसार, उच्चारण रूपांतरण प्रौद्योगिकी मूल VOI को बनाए रखती है
Comentários (45)
0/200
DonaldJackson
11 de Abril de 2025 à0 00:00:00 GMT
Phonic's AI voices are pretty cool for audiobooks and stuff, but I'm not sure if businesses should rely on them yet. They sound good, but there's still that uncanny valley vibe sometimes. Maybe in a few years, they'll be perfect. For now, it's a neat tool, but not a game-changer.
0
RogerGonzalez
11 de Abril de 2025 à0 00:00:00 GMT
PhonicのAI音声は、オーディオブックなどに使うにはかなりクールだけど、まだビジネスがこれに頼るべきかどうかはわからない。音質は良いけど、時々不気味の谷を感じることがある。数年後には完璧になるかもしれない。今のところは便利なツールだけど、ゲームチェンジャーではないね。
0
WillieMartinez
11 de Abril de 2025 à0 00:00:00 GMT
Phonic의 AI 음성은 오디오북 등에 사용하기에 꽤 멋지지만, 아직 비즈니스가 이것에 의존해야 할지 모르겠어. 음질은 좋지만, 때때로 불쾌한 골짜기 느낌이 들어. 몇 년 후에는 완벽해질지도 몰라. 지금은 유용한 도구지만, 게임 체인저는 아니야.
0
ChristopherAllen
11 de Abril de 2025 à0 00:00:00 GMT
As vozes de IA da Phonic são bem legais para audiolivros e coisas do tipo, mas não tenho certeza se as empresas devem confiar nelas ainda. Elas soam bem, mas às vezes ainda há aquela sensação de vale estranho. Talvez em alguns anos, elas sejam perfeitas. Por enquanto, é uma ferramenta legal, mas não é uma mudança de jogo.
0
RalphJohnson
11 de Abril de 2025 à0 00:00:00 GMT
Las voces de IA de Phonic son bastante geniales para audiolibros y cosas así, pero no estoy seguro de si las empresas deberían confiar en ellas todavía. Suenan bien, pero a veces todavía hay esa sensación de valle inquietante. Tal vez en unos años, serán perfectas. Por ahora, es una herramienta interesante, pero no es un cambio de juego.
0
AlbertWalker
11 de Abril de 2025 à0 00:00:00 GMT
Phonic's AI voices are pretty cool for audiobooks and stuff, but I'm not sure if they're ready for customer service yet. They sound good, but sometimes they miss the human touch. Still, it's a step in the right direction, right? Keep improving, Phonic!
0
As vozes geradas pela IA ficaram muito boas, sabe? Eles estão prontos para fazer coisas como audiolivros, podcasts, lendo artigos em voz alta e até suporte básico ao cliente. Mas muitas empresas ainda não são totalmente vendidas com a confiabilidade da tecnologia de voz da IA para suas operações.
É aí que Moin Nadeem e Nikhil Murthy, alguns graduados do MIT, entram. Eles começaram a Phonic, uma empresa que se trata de reforçar a confiabilidade das vozes sintéticas enquanto cortava o atraso. Esses caras são amigos há mais de sete anos, desde que se conheceram no MIT. Quando eles começaram a Phonic no ano passado, eles notaram uma lacuna no mercado-ninguém estava realmente oferecendo uma solução completa de tecnologia de voz.
"A Voice AI está em um ponto em que você está costurando diferentes pedaços, como reconhecimento automático de voz e fala em fala e, em seguida, adiciona alguns inteligentes", explicou Murthy ao TechCrunch. "Mas quando conversamos com clientes reais, percebemos que há uma escassez de soluções que podem lidar com as coisas de maneira confiável em larga escala".
Nadeem, que costumava trabalhar na MosaicML (que os Databricks aceleraram por US $ 1,3 bilhão em 2023), apontou que muitas empresas no espaço da AI de voz, como Vapi e arredondadas, estão apenas subindo diferentes modelos de IA. O Phonic, por outro lado, faz as coisas de maneira diferente-elas treinam seus modelos do início ao fim, tudo internamente. Murthy acha que essa abordagem tem grandes vantagens.
"Quando você possui os modelos, você pode realmente assar alguns recursos de confiabilidade sólidos nos próprios modelos", disse ele. "Se você não controla essa camada, está apenas tentando colar pedaços juntos que realmente não combinam bem."
Além disso, Murthy mencionou que a maneira de fazer as coisas de Phonic permite que eles hospedem e administram seus modelos de maneira econômica. Eles treinam seus modelos em todos os tipos de gravações, incluindo discursos acentuados e abafados, para garantir que sejam super robustos.
No momento, o Phonic está trabalhando com um grupo seleto de parceiros nas indústrias de seguros e saúde, mas estão se preparando para um lançamento mais amplo em alguns meses. Nadeem disse em breve: qualquer um interessado pode dar um giro da tecnologia de Phonic diretamente em seu site.
O Phonic conseguiu ganhar US $ 4 milhões em financiamento de sementes, com Lux liderando a rodada e alguns grandes nomes, como o co-fundador da Replit, Amjad Masad, abraçando o co-fundador do Clem DeLangue, o co-fundador da Intuição aplicado Qasar Younis e o fundador da Modal Labs, Erik Bernhards, entrando.
Grace Isford, da Lux Capital, disse que foi atraída para a abordagem única de Phonic para treinar modelos internamente. "Achamos que Moin e Nikhil são tecnólogos incríveis", disse ela. "Eles iniciaram um clube de aprendizado de máquina no MIT e estão trabalhando em modelos de treinamento há algum tempo. Seu método de misturar modelos de difusão e proprietário no setor de IA de voz é bastante inovador".




Phonic's AI voices are pretty cool for audiobooks and stuff, but I'm not sure if businesses should rely on them yet. They sound good, but there's still that uncanny valley vibe sometimes. Maybe in a few years, they'll be perfect. For now, it's a neat tool, but not a game-changer.




PhonicのAI音声は、オーディオブックなどに使うにはかなりクールだけど、まだビジネスがこれに頼るべきかどうかはわからない。音質は良いけど、時々不気味の谷を感じることがある。数年後には完璧になるかもしれない。今のところは便利なツールだけど、ゲームチェンジャーではないね。




Phonic의 AI 음성은 오디오북 등에 사용하기에 꽤 멋지지만, 아직 비즈니스가 이것에 의존해야 할지 모르겠어. 음질은 좋지만, 때때로 불쾌한 골짜기 느낌이 들어. 몇 년 후에는 완벽해질지도 몰라. 지금은 유용한 도구지만, 게임 체인저는 아니야.




As vozes de IA da Phonic são bem legais para audiolivros e coisas do tipo, mas não tenho certeza se as empresas devem confiar nelas ainda. Elas soam bem, mas às vezes ainda há aquela sensação de vale estranho. Talvez em alguns anos, elas sejam perfeitas. Por enquanto, é uma ferramenta legal, mas não é uma mudança de jogo.




Las voces de IA de Phonic son bastante geniales para audiolibros y cosas así, pero no estoy seguro de si las empresas deberían confiar en ellas todavía. Suenan bien, pero a veces todavía hay esa sensación de valle inquietante. Tal vez en unos años, serán perfectas. Por ahora, es una herramienta interesante, pero no es un cambio de juego.




Phonic's AI voices are pretty cool for audiobooks and stuff, but I'm not sure if they're ready for customer service yet. They sound good, but sometimes they miss the human touch. Still, it's a step in the right direction, right? Keep improving, Phonic!












