opción
Hogar
Noticias
Phonic, una plataforma de IA de voz, asegura la inversión de Lux

Phonic, una plataforma de IA de voz, asegura la inversión de Lux

10 de abril de 2025
138

Phonic, una plataforma de IA de voz, asegura la inversión de Lux

Las voces generadas por AI se han vuelto bastante buenas, ¿sabes? Están a la altura de cosas como audiolibros, podcasts, lectura de artículos en voz alta e incluso atención al cliente básico. Pero, muchas empresas todavía no están totalmente vendidas por la fiabilidad de la tecnología de voz de IA para sus operaciones.

Ahí es donde entran Moin Nadeem y Nikhil Murthy, un par de graduados del MIT. Comenzaron Phonic, una compañía que se trata de reforzar la confiabilidad de las voces sintéticas mientras reducen el retraso. Estos tipos han sido amigos durante más de siete años, desde que se conocieron en el MIT. Cuando comenzaron a Phonic el año pasado, notaron una brecha en el mercado, nadie realmente estaba ofreciendo una solución de tecnología de voz completa.

"La IA de voz está en un punto en el que estás uniendo diferentes bits, como reconocimiento automático de voz y texto a voz, y luego agregas algunas inteligencia", explicó Murthy a TechCrunch. "Pero cuando conversamos con clientes reales, nos dimos cuenta de que hay una escasez de soluciones que pueden manejar las cosas de manera confiable a gran escala".

Nadeem, que solía trabajar en Mosaicml (que Databricks se adquirió por $ 1.3 mil millones en 2023), señaló que muchas compañías en el espacio de IA de voz, como Vapi y redondeados, simplemente improvisan diferentes modelos de IA. Phonic, por otro lado, hace las cosas de manera diferente: entrenan a sus modelos de principio a fin, todos internamente. Murthy reconoce que este enfoque tiene algunas ventajas grandes.

"Cuando es dueño de los modelos, realmente puede hornear algunas características de confiabilidad sólida directamente en las modelos mismos", dijo. "Si no controlas esa capa, solo estás tratando de pegar bits que realmente no se mezclen bien".

Además, Murthy mencionó que la forma de hacer las cosas de Phonic les permite alojar y ejecutar sus modelos de una manera rentable. Entrenan a sus modelos en todo tipo de grabaciones, incluido el discurso acentuado y amortiguado, para asegurarse de que sean súper robustos.

En este momento, Phonic está trabajando con un grupo selecto de socios en las industrias de seguros y atención médica, pero se están preparando para un lanzamiento más amplio en unos pocos meses. Nadeem dijo que pronto, cualquier persona interesada puede darle un giro a Phonic's Tech directamente desde su sitio web.

Phonic logró obtener $ 4 millones en fondos de semillas, con Lux liderando la ronda y algunos grandes nombres como el cofundador de la lista Amjad Masad, el cofundador de Hugging Face, Clem DeLangue, el cofundador de la intuición aplicada Qasar Younis y el fundador modal de Labs Erik Bernhardsson.

Grace Isford de Lux Capital dijo que se sintieron atraídos por el enfoque único de Phonic para los modelos de entrenamiento internos. "Creemos que tanto Moin como Nikhil son tecnólogos increíbles", dijo. "Comenzaron un club de aprendizaje automático en el MIT y han estado trabajando en modelos de capacitación durante un tiempo. Su método de mezclar difusión y modelos patentados en el sector de IA de voz es bastante innovador".

Artículo relacionado
एमआईटी अध्ययन में पाया गया है कि एआई वास्तव में, मूल्य नहीं है एमआईटी अध्ययन में पाया गया है कि एआई वास्तव में, मूल्य नहीं है एक अध्ययन जो कुछ महीने पहले वायरल हुआ था, ने सुझाव दिया कि जैसे-जैसे एआई अधिक उन्नत होता है, यह अपने स्वयं के "मूल्य प्रणालियों" को विकसित कर सकता है, संभावित रूप से मनुष्यों पर अपनी भलाई को प्राथमिकता देता है। हालांकि, एक हालिया एमआईटी अध्ययन इस विचार को चुनौती देता है, यह निष्कर्ष निकाला कि एआई वास्तव में सुसंगत मूल्यों के अधिकारी नहीं है।
अप्रैल 2025 के लिए शीर्ष 10 एआई आवाज जनरेटर का खुलासा हुआ अप्रैल 2025 के लिए शीर्ष 10 एआई आवाज जनरेटर का खुलासा हुआ प्रौद्योगिकी की दुनिया को कृत्रिम बुद्धिमत्ता द्वारा बदल दिया गया है, और इस दायरे में सबसे गतिशील क्षेत्रों में से एक एआई वॉयस जनरेशन है। ये उपकरण अविश्वसनीय रूप से उन्नत हो गए हैं, विभिन्न प्रकार की आवाज़ें प्रदान करते हैं जिन्हें विभिन्न आवश्यकताओं और वरीयताओं के अनुरूप अनुकूलित किया जा सकता है। सीआर से
एआई भारतीयों को क्रिस्प के साथ कॉल पर अमेरिकी ध्वनि को मदद करता है एआई भारतीयों को क्रिस्प के साथ कॉल पर अमेरिकी ध्वनि को मदद करता है बुधवार को, ऑडियो स्टार्टअप क्रिस्प ने एक ग्राउंडब्रेकिंग सुविधा का अनावरण किया, जो कॉल के दौरान उपयोगकर्ता के उच्चारण को बदलने के लिए एआई का लाभ उठाता है। प्रारंभ में, कंपनी भारतीय अंग्रेजी लहजे को अमेरिकी अंग्रेजी में बदलने पर ध्यान केंद्रित कर रही है। KRISP के अनुसार, उच्चारण रूपांतरण प्रौद्योगिकी मूल VOI को बनाए रखती है
comentario (45)
0/200
DonaldJackson
DonaldJackson 11 de abril de 2025 00:00:00 GMT

Phonic's AI voices are pretty cool for audiobooks and stuff, but I'm not sure if businesses should rely on them yet. They sound good, but there's still that uncanny valley vibe sometimes. Maybe in a few years, they'll be perfect. For now, it's a neat tool, but not a game-changer.

RogerGonzalez
RogerGonzalez 11 de abril de 2025 00:00:00 GMT

PhonicのAI音声は、オーディオブックなどに使うにはかなりクールだけど、まだビジネスがこれに頼るべきかどうかはわからない。音質は良いけど、時々不気味の谷を感じることがある。数年後には完璧になるかもしれない。今のところは便利なツールだけど、ゲームチェンジャーではないね。

WillieMartinez
WillieMartinez 11 de abril de 2025 00:00:00 GMT

Phonic의 AI 음성은 오디오북 등에 사용하기에 꽤 멋지지만, 아직 비즈니스가 이것에 의존해야 할지 모르겠어. 음질은 좋지만, 때때로 불쾌한 골짜기 느낌이 들어. 몇 년 후에는 완벽해질지도 몰라. 지금은 유용한 도구지만, 게임 체인저는 아니야.

ChristopherAllen
ChristopherAllen 11 de abril de 2025 00:00:00 GMT

As vozes de IA da Phonic são bem legais para audiolivros e coisas do tipo, mas não tenho certeza se as empresas devem confiar nelas ainda. Elas soam bem, mas às vezes ainda há aquela sensação de vale estranho. Talvez em alguns anos, elas sejam perfeitas. Por enquanto, é uma ferramenta legal, mas não é uma mudança de jogo.

RalphJohnson
RalphJohnson 11 de abril de 2025 00:00:00 GMT

Las voces de IA de Phonic son bastante geniales para audiolibros y cosas así, pero no estoy seguro de si las empresas deberían confiar en ellas todavía. Suenan bien, pero a veces todavía hay esa sensación de valle inquietante. Tal vez en unos años, serán perfectas. Por ahora, es una herramienta interesante, pero no es un cambio de juego.

AlbertWalker
AlbertWalker 11 de abril de 2025 00:00:00 GMT

Phonic's AI voices are pretty cool for audiobooks and stuff, but I'm not sure if they're ready for customer service yet. They sound good, but sometimes they miss the human touch. Still, it's a step in the right direction, right? Keep improving, Phonic!

Volver arriba
OR