Phonic, платформа AI Voice, обеспечивает инвестиции от Lux

Голоса, сгенерированные ИИ, стали довольно хороши, знаете? Они подходят для аудиокниг, подкастов, чтения статей вслух и даже базовой поддержки клиентов. Но многие компании всё ещё не полностью уверены в надёжности голосовых технологий ИИ для своих операций.
Тут на сцену выходят Моин Надим и Нихил Мурти, два выпускника MIT. Они основали Phonic, компанию, которая сосредоточена на повышении надёжности синтетических голосов и сокращении задержек. Эти парни дружат уже более семи лет, с тех пор как познакомились в MIT. Когда они запустили Phonic в прошлом году, они заметили пробел на рынке — никто не предлагал полноценного решения для голосовых технологий.
«Голосовой ИИ сейчас на этапе, когда вы сшиваете разные компоненты, такие как автоматическое распознавание голоса и преобразование текста в речь, а затем добавляете немного интеллекта», — объяснил Мурти TechCrunch. «Но когда мы общались с реальными клиентами, мы поняли, что не хватает решений, которые могут надёжно работать в большом масштабе».
Надим, который раньше работал в MosaicML (купленной Databricks за $1,3 миллиарда в 2023 году), отметил, что многие компании в сфере голосового ИИ, такие как Vapi и Rounded, просто собирают разные модели ИИ. Phonic же действует иначе — они обучают свои модели с нуля, полностью внутри компании. Мурти считает, что этот подход имеет большие преимущества.
«Когда вы владеете моделями, вы можете встроить в них надёжные функции прямо на уровне модели», — сказал он. «Если вы не контролируете этот слой, вы просто пытаетесь склеить части, которые плохо сочетаются».
Кроме того, Мурти упомянул, что подход Phonic позволяет им размещать и запускать свои модели экономично. Они обучают свои модели на самых разных записях, включая акцентированную и приглушённую речь, чтобы обеспечить их высокую устойчивость.
Сейчас Phonic работает с избранной группой партнёров в страховой и медицинской индустриях, но они готовятся к более широкому запуску через несколько месяцев. Надим сказал, что скоро любой желающий сможет опробовать технологии Phonic прямо на их сайте.
Phonic удалось привлечь $4 миллиона в виде начального финансирования, с Lux во главе раунда и такими известными именами, как сооснователь Replit Амджад Масад, сооснователь Hugging Face Клем Деланг, сооснователь Applied Intuition Касар Юнис и основатель Modal Labs Эрик Бернхардссон.
Грейс Исфорд из Lux Capital сказала, что их привлек уникальный подход Phonic к обучению моделей внутри компании. «Мы считаем, что Моин и Нихил — невероятные технологи», — сказала она. «Они основали клуб машинного обучения в MIT и уже давно работают над обучением моделей. Их метод комбинирования диффузии и проприетарных моделей в секторе голосового ИИ довольно инновационен».
Связанная статья
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории
Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Mistral представляет модель генерации речи с открытым исходным кодом
Французская компания Mistral, специализирующаяся на искусственном интеллекте, представила в четверг новую модель преобразования текста в речь с открытым исходным кодом, предназначенную для голосовых И
Рекомендации по связанным специальным темам
Комментарии (50)
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!

Голоса, сгенерированные ИИ, стали довольно хороши, знаете? Они подходят для аудиокниг, подкастов, чтения статей вслух и даже базовой поддержки клиентов. Но многие компании всё ещё не полностью уверены в надёжности голосовых технологий ИИ для своих операций.
Тут на сцену выходят Моин Надим и Нихил Мурти, два выпускника MIT. Они основали Phonic, компанию, которая сосредоточена на повышении надёжности синтетических голосов и сокращении задержек. Эти парни дружат уже более семи лет, с тех пор как познакомились в MIT. Когда они запустили Phonic в прошлом году, они заметили пробел на рынке — никто не предлагал полноценного решения для голосовых технологий.
«Голосовой ИИ сейчас на этапе, когда вы сшиваете разные компоненты, такие как автоматическое распознавание голоса и преобразование текста в речь, а затем добавляете немного интеллекта», — объяснил Мурти TechCrunch. «Но когда мы общались с реальными клиентами, мы поняли, что не хватает решений, которые могут надёжно работать в большом масштабе».
Надим, который раньше работал в MosaicML (купленной Databricks за $1,3 миллиарда в 2023 году), отметил, что многие компании в сфере голосового ИИ, такие как Vapi и Rounded, просто собирают разные модели ИИ. Phonic же действует иначе — они обучают свои модели с нуля, полностью внутри компании. Мурти считает, что этот подход имеет большие преимущества.
«Когда вы владеете моделями, вы можете встроить в них надёжные функции прямо на уровне модели», — сказал он. «Если вы не контролируете этот слой, вы просто пытаетесь склеить части, которые плохо сочетаются».
Кроме того, Мурти упомянул, что подход Phonic позволяет им размещать и запускать свои модели экономично. Они обучают свои модели на самых разных записях, включая акцентированную и приглушённую речь, чтобы обеспечить их высокую устойчивость.
Сейчас Phonic работает с избранной группой партнёров в страховой и медицинской индустриях, но они готовятся к более широкому запуску через несколько месяцев. Надим сказал, что скоро любой желающий сможет опробовать технологии Phonic прямо на их сайте.
Phonic удалось привлечь $4 миллиона в виде начального финансирования, с Lux во главе раунда и такими известными именами, как сооснователь Replit Амджад Масад, сооснователь Hugging Face Клем Деланг, сооснователь Applied Intuition Касар Юнис и основатель Modal Labs Эрик Бернхардссон.
Грейс Исфорд из Lux Capital сказала, что их привлек уникальный подход Phonic к обучению моделей внутри компании. «Мы считаем, что Моин и Нихил — невероятные технологи», — сказала она. «Они основали клуб машинного обучения в MIT и уже давно работают над обучением моделей. Их метод комбинирования диффузии и проприетарных моделей в секторе голосового ИИ довольно инновационен».
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории
Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Mistral представляет модель генерации речи с открытым исходным кодом
Французская компания Mistral, специализирующаяся на искусственном интеллекте, представила в четверг новую модель преобразования текста в речь с открытым исходным кодом, предназначенную для голосовых И
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!





Дом






