Phonic, eine Sprach -KI -Plattform, sichert Investitionen von Lux

KI-generierte Stimmen sind ziemlich verdammt gut geworden, weißt du? Sie sind auf dem Niveau für Dinge wie Hörbücher, Podcasts, das Vorlesen von Artikeln und sogar grundlegenden Kundensupport. Aber viele Unternehmen sind immer noch nicht völlig von der Zuverlässigkeit der KI-Stimmtechnologie für ihre Abläufe überzeugt.
Hier kommen Moin Nadeem und Nikhil Murthy ins Spiel, zwei MIT-Absolventen. Sie haben Phonic gegründet, ein Unternehmen, das sich ganz darauf konzentriert, die Zuverlässigkeit synthetischer Stimmen zu erhöhen und gleichzeitig die Verzögerung zu reduzieren. Diese Jungs sind seit über sieben Jahren befreundet, seit sie sich am MIT kennengelernt haben. Als sie letztes Jahr Phonic starteten, stellten sie eine Marktlücke fest – niemand bot wirklich eine umfassende Stimmtechnologie-Lösung an.
„KI-Stimmen sind an einem Punkt, an dem man verschiedene Teile zusammennäht, wie automatische Spracherkennung und Text-to-Speech, und dann etwas Intelligenz hinzufügt,“ erklärte Murthy gegenüber TechCrunch. „Aber als wir mit echten Kunden sprachen, stellten wir fest, dass es an Lösungen mangelt, die Dinge zuverlässig in großem Maßstab handhaben können.“
Nadeem, der früher bei MosaicML arbeitete (das 2023 von Databricks für satte 1,3 Milliarden Dollar übernommen wurde), wies darauf hin, dass viele Unternehmen im Bereich KI-Stimmen, wie Vapi und Rounded, einfach verschiedene KI-Modelle zusammenflicken. Phonic hingegen macht es anders – sie trainieren ihre Modelle von Anfang bis Ende komplett selbst. Murthy glaubt, dass dieser Ansatz große Vorteile hat.
„Wenn du die Modelle besitzt, kannst du wirklich solide Zuverlässigkeitsmerkmale direkt in die Modelle einbauen,“ sagte er. „Wenn du diese Ebene nicht kontrollierst, versuchst du nur, Teile zusammenzukleben, die nicht wirklich gut zusammenpassen.“
Außerdem erwähnte Murthy, dass Phonics Vorgehensweise es ihnen ermöglicht, ihre Modelle kosteneffizient zu hosten und zu betreiben. Sie trainieren ihre Modelle mit allerlei Aufnahmen, einschließlich akzentuierter und gedämpfter Sprache, um sicherzustellen, dass sie super robust sind.
Derzeit arbeitet Phonic mit einer ausgewählten Gruppe von Partnern in der Versicherungs- und Gesundheitsbranche zusammen, bereitet sich aber auf einen breiteren Start in ein paar Monaten vor. Nadeem sagte, dass bald jeder Interessierte die Technologie von Phonic direkt auf ihrer Website ausprobieren kann.
Phonic hat es geschafft, 4 Millionen Dollar in einer Seed-Finanzierungsrunde einzusammeln, angeführt von Lux, mit einigen großen Namen wie Replit-Mitgründer Amjad Masad, Hugging Face-Mitgründer Clem Delangue, Applied Intuition-Mitgründer Qasar Younis und Modal Labs-Gründer Erik Bernhardsson, die sich beteiligt haben.
Grace Isford von Lux Capital sagte, dass sie von Phonics einzigartigem Ansatz, Modelle intern zu trainieren, angezogen wurden. „Wir denken, dass sowohl Moin als auch Nikhil unglaubliche Technologen sind,“ sagte sie. „Sie haben am MIT einen Machine-Learning-Club gegründet und arbeiten schon seit einiger Zeit am Training von Modellen. Ihre Methode, Diffusion und proprietäre Modelle im KI-Stimmenbereich zu kombinieren, ist ziemlich innovativ.“
Verwandter Artikel
Assort Health sichert sich $50 Mio. Finanzierung zur Automatisierung der Patientenkommunikation
Assort Health, ein aufstrebendes KI-Startup im Gesundheitswesen, das sich auf automatisierte Patientenkommunikation für Facharztpraxen spezialisiert hat, hat sich eine Series-B-Finanzierung in Höhe vo
Fundamental Research Labs sichert $33M zur Weiterentwicklung von KI-Agenten
Die KI-Forschungsfirma Fundamental Research Labs, früher Altera, gab heute eine Serie-A-Finanzierungsrunde über 33 Millionen Dollar bekannt, angeführt von Prosus und unter Beteiligung von Stripe-Mitbe
Wispr Flow startet iOS-App zur Revolutionierung der Sprachdiktierung
KI-Unternehmen ermutigen Nutzer zunehmend, stimmlich mit ihren Produkten zu interagieren. Große Unternehmen wie Meta, Google, OpenAI und Anthropic haben ihre KI-Bots mit fortschrittlichen Sprach-zu-Te
Kommentare (49)
0/200
JustinHarris
20. August 2025 19:01:20 MESZ
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
0
DonaldRoberts
4. August 2025 10:40:05 MESZ
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
0
EdwardYoung
28. Juli 2025 03:19:30 MESZ
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
0
RogerKing
22. Juli 2025 03:25:03 MESZ
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!
0
FrankSmith
23. April 2025 17:26:22 MESZ
Las voces de IA de Phonic son bastante geniales, pero no estoy seguro de que estén listas para el soporte al cliente todavía. Suenan bien para audiolibros y cosas así, pero las empresas necesitan más fiabilidad. Aún así, ¡es genial que hayan obtenido financiación de Lux! 🚀
0
GregoryAdams
20. April 2025 04:16:06 MESZ
Phonic의 AI 음성은 꽤 멋지지만, 고객 지원에서 사용하기에는 아직 준비가 덜 된 것 같아요. 오디오북 등에는 좋지만, 비즈니스에서는 더 많은 신뢰성이 필요해요. 그래도 Lux로부터 투자받은 건 정말 멋지네요! 🚀
0
KI-generierte Stimmen sind ziemlich verdammt gut geworden, weißt du? Sie sind auf dem Niveau für Dinge wie Hörbücher, Podcasts, das Vorlesen von Artikeln und sogar grundlegenden Kundensupport. Aber viele Unternehmen sind immer noch nicht völlig von der Zuverlässigkeit der KI-Stimmtechnologie für ihre Abläufe überzeugt.
Hier kommen Moin Nadeem und Nikhil Murthy ins Spiel, zwei MIT-Absolventen. Sie haben Phonic gegründet, ein Unternehmen, das sich ganz darauf konzentriert, die Zuverlässigkeit synthetischer Stimmen zu erhöhen und gleichzeitig die Verzögerung zu reduzieren. Diese Jungs sind seit über sieben Jahren befreundet, seit sie sich am MIT kennengelernt haben. Als sie letztes Jahr Phonic starteten, stellten sie eine Marktlücke fest – niemand bot wirklich eine umfassende Stimmtechnologie-Lösung an.
„KI-Stimmen sind an einem Punkt, an dem man verschiedene Teile zusammennäht, wie automatische Spracherkennung und Text-to-Speech, und dann etwas Intelligenz hinzufügt,“ erklärte Murthy gegenüber TechCrunch. „Aber als wir mit echten Kunden sprachen, stellten wir fest, dass es an Lösungen mangelt, die Dinge zuverlässig in großem Maßstab handhaben können.“
Nadeem, der früher bei MosaicML arbeitete (das 2023 von Databricks für satte 1,3 Milliarden Dollar übernommen wurde), wies darauf hin, dass viele Unternehmen im Bereich KI-Stimmen, wie Vapi und Rounded, einfach verschiedene KI-Modelle zusammenflicken. Phonic hingegen macht es anders – sie trainieren ihre Modelle von Anfang bis Ende komplett selbst. Murthy glaubt, dass dieser Ansatz große Vorteile hat.
„Wenn du die Modelle besitzt, kannst du wirklich solide Zuverlässigkeitsmerkmale direkt in die Modelle einbauen,“ sagte er. „Wenn du diese Ebene nicht kontrollierst, versuchst du nur, Teile zusammenzukleben, die nicht wirklich gut zusammenpassen.“
Außerdem erwähnte Murthy, dass Phonics Vorgehensweise es ihnen ermöglicht, ihre Modelle kosteneffizient zu hosten und zu betreiben. Sie trainieren ihre Modelle mit allerlei Aufnahmen, einschließlich akzentuierter und gedämpfter Sprache, um sicherzustellen, dass sie super robust sind.
Derzeit arbeitet Phonic mit einer ausgewählten Gruppe von Partnern in der Versicherungs- und Gesundheitsbranche zusammen, bereitet sich aber auf einen breiteren Start in ein paar Monaten vor. Nadeem sagte, dass bald jeder Interessierte die Technologie von Phonic direkt auf ihrer Website ausprobieren kann.
Phonic hat es geschafft, 4 Millionen Dollar in einer Seed-Finanzierungsrunde einzusammeln, angeführt von Lux, mit einigen großen Namen wie Replit-Mitgründer Amjad Masad, Hugging Face-Mitgründer Clem Delangue, Applied Intuition-Mitgründer Qasar Younis und Modal Labs-Gründer Erik Bernhardsson, die sich beteiligt haben.
Grace Isford von Lux Capital sagte, dass sie von Phonics einzigartigem Ansatz, Modelle intern zu trainieren, angezogen wurden. „Wir denken, dass sowohl Moin als auch Nikhil unglaubliche Technologen sind,“ sagte sie. „Sie haben am MIT einen Machine-Learning-Club gegründet und arbeiten schon seit einiger Zeit am Training von Modellen. Ihre Methode, Diffusion und proprietäre Modelle im KI-Stimmenbereich zu kombinieren, ist ziemlich innovativ.“




AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔




AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️




Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄




Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!




Las voces de IA de Phonic son bastante geniales, pero no estoy seguro de que estén listas para el soporte al cliente todavía. Suenan bien para audiolibros y cosas así, pero las empresas necesitan más fiabilidad. Aún así, ¡es genial que hayan obtenido financiación de Lux! 🚀




Phonic의 AI 음성은 꽤 멋지지만, 고객 지원에서 사용하기에는 아직 준비가 덜 된 것 같아요. 오디오북 등에는 좋지만, 비즈니스에서는 더 많은 신뢰성이 필요해요. 그래도 Lux로부터 투자받은 건 정말 멋지네요! 🚀












