Phonic, eine Sprach -KI -Plattform, sichert Investitionen von Lux

Heim

Nachricht

10. April 2025

BrianWalker

209

# voice AI # mit

Phonic, eine Sprach -KI -Plattform, sichert Investitionen von Lux

KI-generierte Stimmen sind ziemlich verdammt gut geworden, weißt du? Sie sind auf dem Niveau für Dinge wie Hörbücher, Podcasts, das Vorlesen von Artikeln und sogar grundlegenden Kundensupport. Aber viele Unternehmen sind immer noch nicht völlig von der Zuverlässigkeit der KI-Stimmtechnologie für ihre Abläufe überzeugt.

Hier kommen Moin Nadeem und Nikhil Murthy ins Spiel, zwei MIT-Absolventen. Sie haben Phonic gegründet, ein Unternehmen, das sich ganz darauf konzentriert, die Zuverlässigkeit synthetischer Stimmen zu erhöhen und gleichzeitig die Verzögerung zu reduzieren. Diese Jungs sind seit über sieben Jahren befreundet, seit sie sich am MIT kennengelernt haben. Als sie letztes Jahr Phonic starteten, stellten sie eine Marktlücke fest – niemand bot wirklich eine umfassende Stimmtechnologie-Lösung an.

„KI-Stimmen sind an einem Punkt, an dem man verschiedene Teile zusammennäht, wie automatische Spracherkennung und Text-to-Speech, und dann etwas Intelligenz hinzufügt,“ erklärte Murthy gegenüber TechCrunch. „Aber als wir mit echten Kunden sprachen, stellten wir fest, dass es an Lösungen mangelt, die Dinge zuverlässig in großem Maßstab handhaben können.“

Nadeem, der früher bei MosaicML arbeitete (das 2023 von Databricks für satte 1,3 Milliarden Dollar übernommen wurde), wies darauf hin, dass viele Unternehmen im Bereich KI-Stimmen, wie Vapi und Rounded, einfach verschiedene KI-Modelle zusammenflicken. Phonic hingegen macht es anders – sie trainieren ihre Modelle von Anfang bis Ende komplett selbst. Murthy glaubt, dass dieser Ansatz große Vorteile hat.

„Wenn du die Modelle besitzt, kannst du wirklich solide Zuverlässigkeitsmerkmale direkt in die Modelle einbauen,“ sagte er. „Wenn du diese Ebene nicht kontrollierst, versuchst du nur, Teile zusammenzukleben, die nicht wirklich gut zusammenpassen.“

Außerdem erwähnte Murthy, dass Phonics Vorgehensweise es ihnen ermöglicht, ihre Modelle kosteneffizient zu hosten und zu betreiben. Sie trainieren ihre Modelle mit allerlei Aufnahmen, einschließlich akzentuierter und gedämpfter Sprache, um sicherzustellen, dass sie super robust sind.

Derzeit arbeitet Phonic mit einer ausgewählten Gruppe von Partnern in der Versicherungs- und Gesundheitsbranche zusammen, bereitet sich aber auf einen breiteren Start in ein paar Monaten vor. Nadeem sagte, dass bald jeder Interessierte die Technologie von Phonic direkt auf ihrer Website ausprobieren kann.

Phonic hat es geschafft, 4 Millionen Dollar in einer Seed-Finanzierungsrunde einzusammeln, angeführt von Lux, mit einigen großen Namen wie Replit-Mitgründer Amjad Masad, Hugging Face-Mitgründer Clem Delangue, Applied Intuition-Mitgründer Qasar Younis und Modal Labs-Gründer Erik Bernhardsson, die sich beteiligt haben.

Grace Isford von Lux Capital sagte, dass sie von Phonics einzigartigem Ansatz, Modelle intern zu trainieren, angezogen wurden. „Wir denken, dass sowohl Moin als auch Nikhil unglaubliche Technologen sind,“ sagte sie. „Sie haben am MIT einen Machine-Learning-Club gegründet und arbeiten schon seit einiger Zeit am Training von Modellen. Ihre Methode, Diffusion und proprietäre Modelle im KI-Stimmenbereich zu kombinieren, ist ziemlich innovativ.“

Verwandter Artikel

Assort Health sichert sich $50 Mio. Finanzierung zur Automatisierung der Patientenkommunikation Assort Health, ein aufstrebendes KI-Startup im Gesundheitswesen, das sich auf automatisierte Patientenkommunikation für Facharztpraxen spezialisiert hat, hat sich eine Series-B-Finanzierung in Höhe vo

Fundamental Research Labs sichert $33M zur Weiterentwicklung von KI-Agenten Die KI-Forschungsfirma Fundamental Research Labs, früher Altera, gab heute eine Serie-A-Finanzierungsrunde über 33 Millionen Dollar bekannt, angeführt von Prosus und unter Beteiligung von Stripe-Mitbe

Wispr Flow startet iOS-App zur Revolutionierung der Sprachdiktierung KI-Unternehmen ermutigen Nutzer zunehmend, stimmlich mit ihren Produkten zu interagieren. Große Unternehmen wie Meta, Google, OpenAI und Anthropic haben ihre KI-Bots mit fortschrittlichen Sprach-zu-Te

Kommentare (49)

0/200

Einreichen

JustinHarris

20. August 2025 19:01:20 MESZ

AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔

DonaldRoberts

4. August 2025 10:40:05 MESZ

AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️

EdwardYoung

28. Juli 2025 03:19:30 MESZ

Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄

RogerKing

22. Juli 2025 03:25:03 MESZ

Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!

FrankSmith

23. April 2025 17:26:22 MESZ

Las voces de IA de Phonic son bastante geniales, pero no estoy seguro de que estén listas para el soporte al cliente todavía. Suenan bien para audiolibros y cosas así, pero las empresas necesitan más fiabilidad. Aún así, ¡es genial que hayan obtenido financiación de Lux! 🚀

GregoryAdams

20. April 2025 04:16:06 MESZ

Phonic의 AI 음성은 꽤 멋지지만, 고객 지원에서 사용하기에는 아직 준비가 덜 된 것 같아요. 오디오북 등에는 좋지만, 비즈니스에서는 더 많은 신뢰성이 필요해요. 그래도 Lux로부터 투자받은 건 정말 멋지네요! 🚀

Top -Nachrichten

Gemini 2.5 Pro jetzt unbegrenzt und billiger als Claude, GPT-4O Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen AI-Synchronisation: Ultimativer Leitfaden zur realistischen Stimmen-Erstellung Die KI von Cambium verwandelt Abfall Holz in Holz OpenAI verbessert den AI -Sprachassistenten für bessere Chats So stellen Sie sicher, dass Ihre Daten für die KI -Integration vertrauenswürdig sind NotebookLM erweitert weltweit, fügt Folien und eine verbesserte Faktenprüfung hinzu Optimierungen an US -Rechenzentren könnten 76 GW neue Leistungskapazität freischalten Google nutzt KI, um über 39 Millionen Anzeigenkonten für mutmaßlichen Betrug auszusetzen Künstliche Intelligenz Sprachklonierung: Das ultimative Handbuch zur Beherrschung der Sprachkonvertierung

Mehr

Vorgestellt