Speechify、音声入力とバーチャルアシスタントでChrome拡張機能を強化
Speechifyは主に記事、PDF、文書を聞くためのツールとして知られている。同社は今回、Chrome拡張機能を音声検出機能で強化し、音声入力や質問に答える会話型音声アシスタントの機能を導入した。
この1年、音声認識モデルの品質が大幅に向上したことにより、音声検出ツールが急増している。Speechifyはこのトレンドに乗じて独自のディクテーションツールを発表し、当初は英語をサポートしています。他のソリューションと同様に、Speechifyの音声入力は自動的にエラーを修正し、フィラー語を削除します。
1日あまりの短いテストでは、Speechifyのツールには改善の余地がかなりあることがわかった。例えば、GmailやGoogle Docsではうまく機能するが、WordPressのようなウェブサイトでは、音声ディクテーション機能の起動や信頼できるパフォーマンスの達成に問題があった。同社は、人気サイト向けにツールの最適化を進めていると述べている。

画像クレジット:Speechify 精度に関しては、このツールの単語エラー率は、Wispr Flow、Willow、Monologueのような競合製品よりも高かった。Speechifyは、そのモデルは使用頻度が高いほど改善され、エラー率が徐々に低下すると指摘している。
この新興企業は、ブラウザのサイドバーからアクセスできる会話型音声アシスタントも導入している。今見ているウェブページについて、"3つの要点は何ですか?"とか "もっと簡単な言葉で説明してください "といった質問をすることができる。
ChatGPTとGeminiは会話音声モードを提供しているが、Speechifyはこれらのプラットフォームではこれらの機能は二の次であると主張している。対照的に、Speechifyは音声対話を自社ツールの中核と位置づけ、その体験を前面に押し出している。
"我々は、ユーザーがChatGPTやGeminiアプリを開いたとき、テキストベースのチャットが常にデフォルトの体験になると信じている。それは、ユーザーが期待するものです。音声対話は、おそらく二次的な機能であり続けるでしょう。Speechifyの長年の経験から、私たちのユーザーを含め、AIと対話する際に音声を主要なデフォルトモードとして好むユーザーが市場のかなりの部分に存在することがわかりました」と、同社の最高事業責任者であるRohan Pavuluri氏はTechCrunchへの電子メールで説明している。
テッククランチのイベントDisrupt 2026のキャンセル待ちリストに参加する
Disrupt 2026のキャンセル待ちリストに登録すると、早期割引チケットに優先的にアクセスできる。過去のDisruptステージでは、Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil、Vinod Khoslaのリーダーが登場し、成長を加速させ、競争力を磨くために設計された200以上のセッションをリードする250人以上の業界エキスパートの一部となっている。また、あらゆる分野でイノベーションを推進する何百もの新興企業とつながる機会もあります。
Disrupt 2026のキャンセル待ちリストに参加する
Disrupt 2026のキャンセル待ちリストに登録すると、早期割引チケットに優先的にアクセスできます。過去のDisruptステージでは、Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil、Vinod Khoslaのリーダーが登場し、成長を加速させ、競争力を磨くために設計された200以上のセッションをリードする250人以上の業界エキスパートの一部となっています。また、あらゆる分野でイノベーションを推進する何百もの新興企業とつながる機会もある。
サンフランシスコ|2026年10月13日~15日 今すぐ予約する現在の制限のひとつは、Speechifyのアシスタントが、OpenAIのAtlasやPerplexityのComet、Diaのようなサイドバーアシスタントを内蔵したブラウザと互換性がないことだ。Speechifyの拡張機能は主にChromeとその膨大なユーザーベースのために設計されているため、スタートアップは過度に懸念していない。
Speechifyは、音声入力と音声アシスタントの両方の機能を、すべてのデスクトップとモバイルのアプリケーションに統合し、段階的に展開する計画だ。
同社はまた、自律的にタスクを実行できるAIエージェントの開発も目指している。ロードマップの全貌は明らかにされなかったが、エージェントが電話をかけてアポイントメントを取ったり、カスタマーサービスと保留で待機したりすることが一例として挙げられている。TruecallerやCloackedのような他の企業も同様の目標を追求している。
関連記事
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
おすすめのAI音声入力アプリ:専門家のレビューとランキング
AI音声入力アプリは、比較的短期間で目覚ましい進歩を遂げました。長い間、これらのアプリは動作が重く、誤認識も多いため、ユーザーは特定のアクセントで、かつ非常に明瞭に話す必要がありました。しかし、大規模言語モデル(LLM)や音声認識技術の進歩により、状況は一変しました。現在では、音声をより正確に理解するだけでなく、文脈を把握して適切な形式でテキストを生成できるシステムが実現しています。開発者たちは、
Wispr Flow、課題はあるもののインドにおける音声AIの将来性に賭ける
インドのデジタル環境は、音声メモから多言語メッセージングに至るまで、音声技術と深く結びついています。しかし、同国の言語的多様性、コードスイッチングの慣習、そして収益化の可能性のばらつきを考慮すると、こうした広く浸透した習慣をスケーラブルなAIビジネスへと転換するには、大きな課題が伴います。Wispr Flowは、この複雑ながらも有望な機会に取り組むべく、その地位を確立しつつあります。AIを活用した
関連特集おすすめ
コメント (1)
0/500
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅
Speechifyは主に記事、PDF、文書を聞くためのツールとして知られている。同社は今回、Chrome拡張機能を音声検出機能で強化し、音声入力や質問に答える会話型音声アシスタントの機能を導入した。
この1年、音声認識モデルの品質が大幅に向上したことにより、音声検出ツールが急増している。Speechifyはこのトレンドに乗じて独自のディクテーションツールを発表し、当初は英語をサポートしています。他のソリューションと同様に、Speechifyの音声入力は自動的にエラーを修正し、フィラー語を削除します。
1日あまりの短いテストでは、Speechifyのツールには改善の余地がかなりあることがわかった。例えば、GmailやGoogle Docsではうまく機能するが、WordPressのようなウェブサイトでは、音声ディクテーション機能の起動や信頼できるパフォーマンスの達成に問題があった。同社は、人気サイト向けにツールの最適化を進めていると述べている。

精度に関しては、このツールの単語エラー率は、Wispr Flow、Willow、Monologueのような競合製品よりも高かった。Speechifyは、そのモデルは使用頻度が高いほど改善され、エラー率が徐々に低下すると指摘している。
この新興企業は、ブラウザのサイドバーからアクセスできる会話型音声アシスタントも導入している。今見ているウェブページについて、"3つの要点は何ですか?"とか "もっと簡単な言葉で説明してください "といった質問をすることができる。
ChatGPTとGeminiは会話音声モードを提供しているが、Speechifyはこれらのプラットフォームではこれらの機能は二の次であると主張している。対照的に、Speechifyは音声対話を自社ツールの中核と位置づけ、その体験を前面に押し出している。
"我々は、ユーザーがChatGPTやGeminiアプリを開いたとき、テキストベースのチャットが常にデフォルトの体験になると信じている。それは、ユーザーが期待するものです。音声対話は、おそらく二次的な機能であり続けるでしょう。Speechifyの長年の経験から、私たちのユーザーを含め、AIと対話する際に音声を主要なデフォルトモードとして好むユーザーが市場のかなりの部分に存在することがわかりました」と、同社の最高事業責任者であるRohan Pavuluri氏はTechCrunchへの電子メールで説明している。
テッククランチのイベントDisrupt 2026のキャンセル待ちリストに参加する
Disrupt 2026のキャンセル待ちリストに登録すると、早期割引チケットに優先的にアクセスできる。過去のDisruptステージでは、Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil、Vinod Khoslaのリーダーが登場し、成長を加速させ、競争力を磨くために設計された200以上のセッションをリードする250人以上の業界エキスパートの一部となっている。また、あらゆる分野でイノベーションを推進する何百もの新興企業とつながる機会もあります。
Disrupt 2026のキャンセル待ちリストに参加する
Disrupt 2026のキャンセル待ちリストに登録すると、早期割引チケットに優先的にアクセスできます。過去のDisruptステージでは、Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil、Vinod Khoslaのリーダーが登場し、成長を加速させ、競争力を磨くために設計された200以上のセッションをリードする250人以上の業界エキスパートの一部となっています。また、あらゆる分野でイノベーションを推進する何百もの新興企業とつながる機会もある。
サンフランシスコ|2026年10月13日~15日 今すぐ予約する現在の制限のひとつは、Speechifyのアシスタントが、OpenAIのAtlasやPerplexityのComet、Diaのようなサイドバーアシスタントを内蔵したブラウザと互換性がないことだ。Speechifyの拡張機能は主にChromeとその膨大なユーザーベースのために設計されているため、スタートアップは過度に懸念していない。
Speechifyは、音声入力と音声アシスタントの両方の機能を、すべてのデスクトップとモバイルのアプリケーションに統合し、段階的に展開する計画だ。
同社はまた、自律的にタスクを実行できるAIエージェントの開発も目指している。ロードマップの全貌は明らかにされなかったが、エージェントが電話をかけてアポイントメントを取ったり、カスタマーサービスと保留で待機したりすることが一例として挙げられている。TruecallerやCloackedのような他の企業も同様の目標を追求している。
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
おすすめのAI音声入力アプリ:専門家のレビューとランキング
AI音声入力アプリは、比較的短期間で目覚ましい進歩を遂げました。長い間、これらのアプリは動作が重く、誤認識も多いため、ユーザーは特定のアクセントで、かつ非常に明瞭に話す必要がありました。しかし、大規模言語モデル(LLM)や音声認識技術の進歩により、状況は一変しました。現在では、音声をより正確に理解するだけでなく、文脈を把握して適切な形式でテキストを生成できるシステムが実現しています。開発者たちは、
Wispr Flow、課題はあるもののインドにおける音声AIの将来性に賭ける
インドのデジタル環境は、音声メモから多言語メッセージングに至るまで、音声技術と深く結びついています。しかし、同国の言語的多様性、コードスイッチングの慣習、そして収益化の可能性のばらつきを考慮すると、こうした広く浸透した習慣をスケーラブルなAIビジネスへと転換するには、大きな課題が伴います。Wispr Flowは、この複雑ながらも有望な機会に取り組むべく、その地位を確立しつつあります。AIを活用した
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅





家






