音声AIプラットフォームであるPhonicは、Luxからの投資を確保しています

AI生成の音声は、かなり良くなっていますね。オーディオブック、ポッドキャスト、記事の読み上げ、さらには基本的なカスタマーサポートにも十分対応できるレベルです。でも、多くの企業はまだAI音声技術の信頼性に完全に納得していないようです。
そこで、MIT出身のモイン・ナディームとニキル・マーフィーが登場します。彼らはPhonicという会社を立ち上げ、合成音声の信頼性を高めつつ、遅延を減らすことに注力しています。この二人はMITで出会ってから7年以上も友人関係にあります。昨年Phonicを始めたとき、市場にギャップがあることに気づきました。本格的な音声技術ソリューションを提供している企業がほとんどなかったのです。
「音声AIは、自動音声認識やテキスト読み上げなどの異なる要素を組み合わせ、さらに知能を加える段階にあります」とマーフィーはTechCrunchに説明しました。「でも、実際の顧客と話してみると、大規模に信頼性高く対応できるソリューションが不足していることがわかりました。」
かつてMosaicML(2023年にDatabricksが13億ドルで買収)で働いていたナディームは、VapiやRoundedのような音声AI分野の多くの企業が、異なるAIモデルを寄せ集めているだけだと指摘します。一方、Phonicは違います。彼らはモデルを最初から最後まで自社でトレーニングしています。マーフィーはこのアプローチには大きな利点があると考えています。
「モデルを自社で所有することで、モデルそのものに確かな信頼性機能をしっかりと組み込むことができます」と彼は言いました。「その層をコントロールできない場合、うまく噛み合わない部品をただくっつけようとしているだけになります。」
さらに、マーフィーは、Phonicのやり方ならモデルをコスト効率よくホストし、実行できると述べました。彼らは、アクセントのある音声やこもった音声など、さまざまな録音でモデルをトレーニングし、非常に堅牢であることを保証しています。
現在、Phonicは保険や医療業界の選ばれたパートナーと協力していますが、数ヶ月後にはより広範なローンチを予定しています。ナディームは、近いうちに興味のある人は誰でもPhonicのウェブサイトからその技術を試せると話しています。
Phonicは400万ドルのシード資金を調達しており、Luxがリードするラウンドには、Replitの共同創業者アムジャド・マサド、Hugging Faceの共同創業者クレム・デランギュー、Applied Intuitionの共同創業者カサール・ユーニス、Modal Labsの創業者エリック・バーナードソンといったビッグネームも参加しています。
Lux Capitalのグレース・イスフォードは、Phonicの自社でのモデルトレーニングという独自のアプローチに惹かれたと述べました。「モインとニキルはどちらも素晴らしい技術者だと思います」と彼女は言いました。「彼らはMITで機械学習クラブを始め、モデルトレーニングに取り組んできました。音声AI分野での拡散モデルと独自モデルの組み合わせはかなり革新的です。」
関連記事
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表
音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
関連特集おすすめ
コメント (50)
0/500
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!

AI生成の音声は、かなり良くなっていますね。オーディオブック、ポッドキャスト、記事の読み上げ、さらには基本的なカスタマーサポートにも十分対応できるレベルです。でも、多くの企業はまだAI音声技術の信頼性に完全に納得していないようです。
そこで、MIT出身のモイン・ナディームとニキル・マーフィーが登場します。彼らはPhonicという会社を立ち上げ、合成音声の信頼性を高めつつ、遅延を減らすことに注力しています。この二人はMITで出会ってから7年以上も友人関係にあります。昨年Phonicを始めたとき、市場にギャップがあることに気づきました。本格的な音声技術ソリューションを提供している企業がほとんどなかったのです。
「音声AIは、自動音声認識やテキスト読み上げなどの異なる要素を組み合わせ、さらに知能を加える段階にあります」とマーフィーはTechCrunchに説明しました。「でも、実際の顧客と話してみると、大規模に信頼性高く対応できるソリューションが不足していることがわかりました。」
かつてMosaicML(2023年にDatabricksが13億ドルで買収)で働いていたナディームは、VapiやRoundedのような音声AI分野の多くの企業が、異なるAIモデルを寄せ集めているだけだと指摘します。一方、Phonicは違います。彼らはモデルを最初から最後まで自社でトレーニングしています。マーフィーはこのアプローチには大きな利点があると考えています。
「モデルを自社で所有することで、モデルそのものに確かな信頼性機能をしっかりと組み込むことができます」と彼は言いました。「その層をコントロールできない場合、うまく噛み合わない部品をただくっつけようとしているだけになります。」
さらに、マーフィーは、Phonicのやり方ならモデルをコスト効率よくホストし、実行できると述べました。彼らは、アクセントのある音声やこもった音声など、さまざまな録音でモデルをトレーニングし、非常に堅牢であることを保証しています。
現在、Phonicは保険や医療業界の選ばれたパートナーと協力していますが、数ヶ月後にはより広範なローンチを予定しています。ナディームは、近いうちに興味のある人は誰でもPhonicのウェブサイトからその技術を試せると話しています。
Phonicは400万ドルのシード資金を調達しており、Luxがリードするラウンドには、Replitの共同創業者アムジャド・マサド、Hugging Faceの共同創業者クレム・デランギュー、Applied Intuitionの共同創業者カサール・ユーニス、Modal Labsの創業者エリック・バーナードソンといったビッグネームも参加しています。
Lux Capitalのグレース・イスフォードは、Phonicの自社でのモデルトレーニングという独自のアプローチに惹かれたと述べました。「モインとニキルはどちらも素晴らしい技術者だと思います」と彼女は言いました。「彼らはMITで機械学習クラブを始め、モデルトレーニングに取り組んできました。音声AI分野での拡散モデルと独自モデルの組み合わせはかなり革新的です。」
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表
音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
AI音声がここまで自然になったのはすごい進歩だね😲 でもまだ多くの企業が信用に足るかどうか躊躇しているって紹介されてた通り、私も大事な顧客対応を全て任せるのはちょっと…と感じる。Phonicへの投資が実用性の向上につながるといいな。
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Wonder how it stacks up against human voices in real-world chaos? 🤔
AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️
Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄
Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!





家






