Wispr FlowがiOSアプリをリリースし、音声ディクテーションを革新

AI企業は、ユーザーが製品と音声で対話することをますます推奨しています。Meta、Google、OpenAI、Anthropicなどの大手企業は、AIボットに高度な音声認識機能を強化し、スムーズな会話を可能にしています。
Wispr Flowは、スタートアップ企業として、100以上の言語をサポートするディクテーション技術で優位性を主張しています。本日、キーボードとして統合され、どのアプリケーションでも音声入力が可能なiOSアプリを発表しました。
当初は懐疑的だったこの記者は、Wispr Flowのパフォーマンスに感銘を受けました。インド人ユーザーとして、音声認識アプリが私のアクセントを理解するのに苦労してきました。AlexaやSiriなどの他のAIアシスタントは、私の要求を正確に処理できないことがよくありました。
しかし、Wispr Flowは、大手テック企業のディクテーションツールと比較して優れた体験を提供しました。初期の使用では、デスクトップおよびモバイルアプリで軽微な文の編集が必要でしたが、システムはすぐに適応し、音声コマンドだけで長いメール、メッセージ、そしてこの記事の一部を下書きすることができました。
このアプリには、特殊文字用の数字および記号キーボードが含まれており、カスタム用語を自動的に学習する機能や、辞書を通じて追加するオプションがあります。静かな環境での控えめな使用のためにささやき声をサポートし、ネットワーク接続が弱い地域でも確実に機能します。
Wispr Flowの共同創業者であるTanay Kothari氏は、TechCrunchに対し、当初は無音の単語発声入力用のウェアラブルデバイスを開発する目標だったと語りました。昨年7月にコアソフトウェアであるFlowに焦点を移し、すぐにMacアプリをリリースしました。
デスクトップアプリは、ホットキーでどのプログラムでもディクテーションを可能にし、簡単なアクセスを提供します。ただし、iOSアプリでは、音声入力のためにWisprのキーボードに切り替える必要があり、普及には課題があるかもしれません。
6月4日までTechCrunch Sessions: AIで割引
TC Sessions: AIのチケットを300ドル割引で購入し、2枚目のパスを50%オフで入手できます。OpenAI、Anthropic、Khosla Venturesなどのリーダーによる専門家トーク、ハンズオン形式のワークショップ、インパクトのあるネットワーキングを通じて洞察を得られます。これらの割引価格は、6月5日にイベントが始まると終了します。
TechCrunch Sessions: AIで展示
TC Sessions: AIであなたのイノベーションを1,200人以上の意思決定者に展示するために場所を確保してください。5月9日まで、またはスペースがなくなるまで、手頃な展示オプションが利用可能です。
Wispr Flowは、週2,000語までの無料使用を提供しています。月額12ドルまたは年額144ドルの無制限プランには、早期機能アクセスが含まれます。
NEA、Palo Alto Networks、8VCなどの投資家から2,600万ドルを調達したKothari氏は、19%のサブスクリプション転換率と60%の年間収益成長を報告しています。
同社は今年中にAndroidアプリをリリースする予定で、企業特有の用語をより良く認識するためのチーム向け共有コンテキスト機能を開発中です。
Wisprは、YC支援のAqua、TalkTastic、Superwhisper、BetterDictationと競争しています。Kothari氏は、Wisprのエンジニアリング専門知識と持続的な投資が、進化するAIおよび音声技術の分野で優位性を維持すると確信しています。
関連記事
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表
音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
関連特集おすすめ
コメント (0)
0/500

AI企業は、ユーザーが製品と音声で対話することをますます推奨しています。Meta、Google、OpenAI、Anthropicなどの大手企業は、AIボットに高度な音声認識機能を強化し、スムーズな会話を可能にしています。
Wispr Flowは、スタートアップ企業として、100以上の言語をサポートするディクテーション技術で優位性を主張しています。本日、キーボードとして統合され、どのアプリケーションでも音声入力が可能なiOSアプリを発表しました。
当初は懐疑的だったこの記者は、Wispr Flowのパフォーマンスに感銘を受けました。インド人ユーザーとして、音声認識アプリが私のアクセントを理解するのに苦労してきました。AlexaやSiriなどの他のAIアシスタントは、私の要求を正確に処理できないことがよくありました。
しかし、Wispr Flowは、大手テック企業のディクテーションツールと比較して優れた体験を提供しました。初期の使用では、デスクトップおよびモバイルアプリで軽微な文の編集が必要でしたが、システムはすぐに適応し、音声コマンドだけで長いメール、メッセージ、そしてこの記事の一部を下書きすることができました。
このアプリには、特殊文字用の数字および記号キーボードが含まれており、カスタム用語を自動的に学習する機能や、辞書を通じて追加するオプションがあります。静かな環境での控えめな使用のためにささやき声をサポートし、ネットワーク接続が弱い地域でも確実に機能します。
Wispr Flowの共同創業者であるTanay Kothari氏は、TechCrunchに対し、当初は無音の単語発声入力用のウェアラブルデバイスを開発する目標だったと語りました。昨年7月にコアソフトウェアであるFlowに焦点を移し、すぐにMacアプリをリリースしました。
デスクトップアプリは、ホットキーでどのプログラムでもディクテーションを可能にし、簡単なアクセスを提供します。ただし、iOSアプリでは、音声入力のためにWisprのキーボードに切り替える必要があり、普及には課題があるかもしれません。
6月4日までTechCrunch Sessions: AIで割引
TC Sessions: AIのチケットを300ドル割引で購入し、2枚目のパスを50%オフで入手できます。OpenAI、Anthropic、Khosla Venturesなどのリーダーによる専門家トーク、ハンズオン形式のワークショップ、インパクトのあるネットワーキングを通じて洞察を得られます。これらの割引価格は、6月5日にイベントが始まると終了します。
TechCrunch Sessions: AIで展示
TC Sessions: AIであなたのイノベーションを1,200人以上の意思決定者に展示するために場所を確保してください。5月9日まで、またはスペースがなくなるまで、手頃な展示オプションが利用可能です。
Wispr Flowは、週2,000語までの無料使用を提供しています。月額12ドルまたは年額144ドルの無制限プランには、早期機能アクセスが含まれます。
NEA、Palo Alto Networks、8VCなどの投資家から2,600万ドルを調達したKothari氏は、19%のサブスクリプション転換率と60%の年間収益成長を報告しています。
同社は今年中にAndroidアプリをリリースする予定で、企業特有の用語をより良く認識するためのチーム向け共有コンテキスト機能を開発中です。
Wisprは、YC支援のAqua、TalkTastic、Superwhisper、BetterDictationと競争しています。Kothari氏は、Wisprのエンジニアリング専門知識と持続的な投資が、進化するAIおよび音声技術の分野で優位性を維持すると確信しています。
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表
音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し





家






