AIは、インディアンがKrispとの電話でアメリカ人の音を聞くのに役立ちます
水曜日に、オーディオスタートアップのKrispは、AIを活用して通話中にユーザーのアクセントを変更する画期的な機能を発表しました。最初に、同社はインド英語のアクセントをアメリカ英語に変換することに焦点を当てています。
Krispによると、このアクセント変換技術は、話者の元の声を維持し、アメリカのアクセントに合わせて音素のみを変更します。この機能は、企業環境での試用を経て、現在Krispデスクトップアプリケーションでベータ段階に入っています。ユーザーは通話の前や最中にこの機能を自由に有効にできます。
Krispの共同創業者であるArto Minasyanは、このイノベーションの背景にあるインスピレーションを共有し、自身の経験を語りました。「私のアクセントは、英語をうまく話していても理解しにくいと感じる人が多いです。アクセントを変更することで、コミュニケーションを大幅に改善できると信じていました。このソリューションに2年間取り組んできましたが、ベータ版としてリリースできて興奮しています」とMinasyanは説明しました。
しかし、この機能をテストしたところ、処理された声は若干不自然で、時折単語が省略されることがありました。Krispはこれらの問題をベータ段階の一部として認め、モデルは時間とともに進化し改善されるとユーザーに保証しました。
Krispは、企業での試用において、この機能が販売コンバージョン率を26.1%増加させ、予約ごとの収益を14.8%増加させたことを報告しています。

画像提供:Krisp.ai インドのアクセントから始める決定は、世界のSTEM分野におけるインド人プロフェッショナルの大きな存在感によって推進されました。Krispは将来的にフィリピンのアクセントなどを含むサポートを拡大する予定です。GVが支援するSanasなどの他のスタートアップは、すでにコールセンターで同様の技術を大規模に導入しています。
同社は、ユーザーの同意を得て会議アシスタントから収集したデータを使用し、さまざまなアクセントや方言を表す数千の音声サンプルでモデルをトレーニングしました。
Minasyanは、この機能のもう一つの利点を強調しました。それは、ユーザーの声に対する事前トレーニングを必要とせず、リアルタイムで話者プロファイルを動的に作成することです。
2021年に最後に資金調達を行ったKrispは、対面会議を強化するために、今年後半にiOSおよびAndroidアプリをリリースする予定です。さらに、Google Meetとの統合を改善するための新しいChrome拡張機能も開発中です。
関連記事
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表
音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
関連特集おすすめ
コメント (48)
0/500
오늘 AI로 억양 변환하는 기술 기사 읽었는데요. 우리나라에서도 한참 영어 발음 걱정하는 사람들 많은데, 이 기술이 한국인 억양도 분석해줄 수 있을까요? 한국 영어교육 시장에 적용되면 진짜 대박 날 거 같은데... 🤔 그런데 미국식 억양이 ‘표준’이라는 가정 자체가 좀 불편하네요.
Je trouve ça un peu inquiétant ce besoin de gommer les accents régionaux pour correspondre à une norme... L'intelligence artificielle devrait-elle vraiment servir à uniformiser nos identités culturelles au lieu de nous aider à mieux nous comprendre mutuellement ? 😕
This AI accent switch is wild! It’s like giving your voice a Hollywood makeover in real-time. I wonder how it handles regional Indian accents—pretty cool for call centers, but does it make everyone sound like a generic American newscaster? 😄
La nueva función de IA de Krisp para sonar americano es alucinante. Es genial cambiar de acento en las llamadas, pero es raro perder mi acento indio. Es útil para el trabajo, pero espero que no nos haga sonar todos iguales. 🤔
水曜日に、オーディオスタートアップのKrispは、AIを活用して通話中にユーザーのアクセントを変更する画期的な機能を発表しました。最初に、同社はインド英語のアクセントをアメリカ英語に変換することに焦点を当てています。
Krispによると、このアクセント変換技術は、話者の元の声を維持し、アメリカのアクセントに合わせて音素のみを変更します。この機能は、企業環境での試用を経て、現在Krispデスクトップアプリケーションでベータ段階に入っています。ユーザーは通話の前や最中にこの機能を自由に有効にできます。
Krispの共同創業者であるArto Minasyanは、このイノベーションの背景にあるインスピレーションを共有し、自身の経験を語りました。「私のアクセントは、英語をうまく話していても理解しにくいと感じる人が多いです。アクセントを変更することで、コミュニケーションを大幅に改善できると信じていました。このソリューションに2年間取り組んできましたが、ベータ版としてリリースできて興奮しています」とMinasyanは説明しました。
しかし、この機能をテストしたところ、処理された声は若干不自然で、時折単語が省略されることがありました。Krispはこれらの問題をベータ段階の一部として認め、モデルは時間とともに進化し改善されるとユーザーに保証しました。
Krispは、企業での試用において、この機能が販売コンバージョン率を26.1%増加させ、予約ごとの収益を14.8%増加させたことを報告しています。

GVが支援するSanasなどの他のスタートアップは、すでにコールセンターで同様の技術を大規模に導入しています。
同社は、ユーザーの同意を得て会議アシスタントから収集したデータを使用し、さまざまなアクセントや方言を表す数千の音声サンプルでモデルをトレーニングしました。
Minasyanは、この機能のもう一つの利点を強調しました。それは、ユーザーの声に対する事前トレーニングを必要とせず、リアルタイムで話者プロファイルを動的に作成することです。
2021年に最後に資金調達を行ったKrispは、対面会議を強化するために、今年後半にiOSおよびAndroidアプリをリリースする予定です。さらに、Google Meetとの統合を改善するための新しいChrome拡張機能も開発中です。
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表
音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
오늘 AI로 억양 변환하는 기술 기사 읽었는데요. 우리나라에서도 한참 영어 발음 걱정하는 사람들 많은데, 이 기술이 한국인 억양도 분석해줄 수 있을까요? 한국 영어교육 시장에 적용되면 진짜 대박 날 거 같은데... 🤔 그런데 미국식 억양이 ‘표준’이라는 가정 자체가 좀 불편하네요.
Je trouve ça un peu inquiétant ce besoin de gommer les accents régionaux pour correspondre à une norme... L'intelligence artificielle devrait-elle vraiment servir à uniformiser nos identités culturelles au lieu de nous aider à mieux nous comprendre mutuellement ? 😕
This AI accent switch is wild! It’s like giving your voice a Hollywood makeover in real-time. I wonder how it handles regional Indian accents—pretty cool for call centers, but does it make everyone sound like a generic American newscaster? 😄
La nueva función de IA de Krisp para sonar americano es alucinante. Es genial cambiar de acento en las llamadas, pero es raro perder mi acento indio. Es útil para el trabajo, pero espero que no nos haga sonar todos iguales. 🤔





家






