Phonic, une plate-forme de voix AI, sécurise l'investissement de lux

Les voix générées par IA sont devenues sacrément performantes, vous savez ? Elles sont à la hauteur pour des choses comme les livres audio, les podcasts, la lecture d'articles à voix haute, et même le support client de base. Mais, beaucoup d'entreprises ne sont pas encore totalement convaincues de la fiabilité de la technologie vocale IA pour leurs opérations.
C'est là qu'interviennent Moin Nadeem et Nikhil Murthy, deux diplômés du MIT. Ils ont fondé Phonic, une entreprise qui se consacre à renforcer la fiabilité des voix synthétiques tout en réduisant le décalage. Ces gars sont amis depuis plus de sept ans, depuis leur rencontre au MIT. Lorsqu'ils ont lancé Phonic l'année dernière, ils ont remarqué un vide sur le marché — personne ne proposait vraiment une solution complète en technologie vocale.
« L'IA vocale est à un stade où l'on assemble différents éléments, comme la reconnaissance vocale automatique et la synthèse vocale, puis on ajoute un peu d'intelligence », a expliqué Murthy à TechCrunch. « Mais quand nous avons discuté avec de vrais clients, nous avons réalisé qu'il manquait des solutions capables de gérer les choses de manière fiable à grande échelle. »
Nadeem, qui travaillait auparavant chez MosaicML (racheté par Databricks pour la coquette somme de 1,3 milliard de dollars en 2023), a souligné que beaucoup d'entreprises dans le secteur de l'IA vocale, comme Vapi et Rounded, se contentent d'assembler différents modèles d'IA. Phonic, en revanche, fait les choses différemment — ils entraînent leurs modèles de A à Z, en interne. Murthy estime que cette approche présente de grands avantages.
« Quand vous possédez les modèles, vous pouvez vraiment intégrer des fonctionnalités de fiabilité solides directement dans les modèles eux-mêmes », a-t-il déclaré. « Si vous ne contrôlez pas cette couche, vous essayez juste de coller ensemble des pièces qui ne s'assemblent pas vraiment bien. »
De plus, Murthy a mentionné que la méthode de Phonic leur permet d'héberger et d'exécuter leurs modèles de manière économique. Ils entraînent leurs modèles sur toutes sorts d'enregistrements, y compris des discours avec des accents et étouffés, pour s'assurer qu'ils sont extrêmement robustes.
Pour le moment, Phonic travaille avec un groupe restreint de partenaires dans les secteurs de l'assurance et de la santé, mais ils se préparent pour un lancement plus large dans quelques mois. Nadeem a indiqué que bientôt, toute personne intéressée pourra tester la technologie de Phonic directement depuis leur site web.
Phonic a réussi à lever 4 millions de dollars en financement de démarrage, avec Lux à la tête de ce tour et des noms prestigieux comme le cofondateur de Replit, Amjad Masad, le cofondateur de Hugging Face, Clem Delangue, le cofondateur d'Applied Intuition, Qasar Younis, et le fondateur de Modal Labs, Erik Bernhardsson, qui ont également contribué.
Grace Isford de Lux Capital a déclaré qu'ils étaient attirés par l'approche unique de Phonic pour l'entraînement des modèles en interne. « Nous pensons que Moin et Nikhil sont des technologues exceptionnels », a-t-elle dit. « Ils ont créé un club d'apprentissage automatique au MIT et travaillent sur l'entraînement de modèles depuis un certain temps. Leur méthode de mélange de diffusion et de modèles propriétaires dans le secteur de l'IA vocale est assez innovante. »
Article connexe
ElevenLabs annonce que BlackRock, Jamie Foxx et Eva Longoria ont rejoint le cercle de ses investisseurs
ElevenLabs, la société spécialisée dans l'IA vocale, a révélé le nom d'investisseurs supplémentaires ayant participé à son tour de table de série D de 500 millions de dollars, initialement annoncé en
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Mistral dévoile un modèle open source de synthèse vocale
La société française d'IA Mistral a dévoilé jeudi un nouveau modèle open source de synthèse vocale, conçu pour les assistants vocaux IA et les applications d'entreprise telles que le service client. C
Recommandations de sujets spéciaux liés
commentaires (50)
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!

Les voix générées par IA sont devenues sacrément performantes, vous savez ? Elles sont à la hauteur pour des choses comme les livres audio, les podcasts, la lecture d'articles à voix haute, et même le support client de base. Mais, beaucoup d'entreprises ne sont pas encore totalement convaincues de la fiabilité de la technologie vocale IA pour leurs opérations.
C'est là qu'interviennent Moin Nadeem et Nikhil Murthy, deux diplômés du MIT. Ils ont fondé Phonic, une entreprise qui se consacre à renforcer la fiabilité des voix synthétiques tout en réduisant le décalage. Ces gars sont amis depuis plus de sept ans, depuis leur rencontre au MIT. Lorsqu'ils ont lancé Phonic l'année dernière, ils ont remarqué un vide sur le marché — personne ne proposait vraiment une solution complète en technologie vocale.
« L'IA vocale est à un stade où l'on assemble différents éléments, comme la reconnaissance vocale automatique et la synthèse vocale, puis on ajoute un peu d'intelligence », a expliqué Murthy à TechCrunch. « Mais quand nous avons discuté avec de vrais clients, nous avons réalisé qu'il manquait des solutions capables de gérer les choses de manière fiable à grande échelle. »
Nadeem, qui travaillait auparavant chez MosaicML (racheté par Databricks pour la coquette somme de 1,3 milliard de dollars en 2023), a souligné que beaucoup d'entreprises dans le secteur de l'IA vocale, comme Vapi et Rounded, se contentent d'assembler différents modèles d'IA. Phonic, en revanche, fait les choses différemment — ils entraînent leurs modèles de A à Z, en interne. Murthy estime que cette approche présente de grands avantages.
« Quand vous possédez les modèles, vous pouvez vraiment intégrer des fonctionnalités de fiabilité solides directement dans les modèles eux-mêmes », a-t-il déclaré. « Si vous ne contrôlez pas cette couche, vous essayez juste de coller ensemble des pièces qui ne s'assemblent pas vraiment bien. »
De plus, Murthy a mentionné que la méthode de Phonic leur permet d'héberger et d'exécuter leurs modèles de manière économique. Ils entraînent leurs modèles sur toutes sorts d'enregistrements, y compris des discours avec des accents et étouffés, pour s'assurer qu'ils sont extrêmement robustes.
Pour le moment, Phonic travaille avec un groupe restreint de partenaires dans les secteurs de l'assurance et de la santé, mais ils se préparent pour un lancement plus large dans quelques mois. Nadeem a indiqué que bientôt, toute personne intéressée pourra tester la technologie de Phonic directement depuis leur site web.
Phonic a réussi à lever 4 millions de dollars en financement de démarrage, avec Lux à la tête de ce tour et des noms prestigieux comme le cofondateur de Replit, Amjad Masad, le cofondateur de Hugging Face, Clem Delangue, le cofondateur d'Applied Intuition, Qasar Younis, et le fondateur de Modal Labs, Erik Bernhardsson, qui ont également contribué.
Grace Isford de Lux Capital a déclaré qu'ils étaient attirés par l'approche unique de Phonic pour l'entraînement des modèles en interne. « Nous pensons que Moin et Nikhil sont des technologues exceptionnels », a-t-elle dit. « Ils ont créé un club d'apprentissage automatique au MIT et travaillent sur l'entraînement de modèles depuis un certain temps. Leur méthode de mélange de diffusion et de modèles propriétaires dans le secteur de l'IA vocale est assez innovante. »
ElevenLabs annonce que BlackRock, Jamie Foxx et Eva Longoria ont rejoint le cercle de ses investisseurs
ElevenLabs, la société spécialisée dans l'IA vocale, a révélé le nom d'investisseurs supplémentaires ayant participé à son tour de table de série D de 500 millions de dollars, initialement annoncé en
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Mistral dévoile un modèle open source de synthèse vocale
La société française d'IA Mistral a dévoilé jeudi un nouveau modèle open source de synthèse vocale, conçu pour les assistants vocaux IA et les applications d'entreprise telles que le service client. C
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!





Maison






