Google、オフライン対応のAI音声入力アプリをリリース
【 更新(4月7日 午後10時30分 PT)】同社は アプリストアの掲載情報を更新し、Android版に関する記述を削除した。ただし、iOS向けキーボード機能がまもなく提供されることも併せて明記している。
月曜日、Googleは「Google AI Edge Eloquent」というiOS向けの新オフライン優先音声入力アプリをひっそりとリリースし、Wispr Flow、SuperWhisper、Willowといった競合サービスに対抗する位置づけとした。
この無料アプリでは、Gemmaベースの自動音声認識(ASR)モデルをダウンロードすれば、すぐに音声入力を開始できます。入力内容はリアルタイムで文字起こし表示され、一時停止すると「えー」や「あー」といった間投詞が自動的に削除され、文章が整えられます。
文字起こしの下には、「Key points(要点)」、「Formal(フォーマル)」、「Short(短文)」、「Long(長文)」といった、テキストの書式を変更するためのオプションが用意されている。

画像クレジット:TechCrunchによるスクリーンショット
クラウド接続をオフにすることで、ローカルのみでの処理モードを有効にできます。(クラウドモードがオンの場合、アプリはテキストの精緻化のためにクラウド上のGeminiモデルを使用します。)Google AI Edge Eloquentでは、オプションでGmailアカウントから特定のキーワード、名前、専門用語を取り込むことができます。また、辞書に独自の単語を追加することも可能です。
このアプリはすべての文字起こしセッションの履歴を保持しており、検索が可能です。前回のセッションのメトリクス(口述した単語数、1分あたりの入力速度、総単語数など)も表示されます。
「Google AI Edge Eloquentは、自然な話し言葉を洗練されたプロフェッショナルなテキストに変換するように設計された高度なディクテーションアプリです。つまずきやつなぎ言葉をすべて文字起こししてしまう基本的なソフトウェアとは異なり、EloquentはAIを活用してユーザーの意図を理解します。『えー』や『あー』といった言葉、文中の訂正を自動的に編集して削除し、クリーンで正確な文章を提供します」と、同社のApp Storeの説明文には記載されています。

「文字起こし」と言おうとしていました。このアプリはまだ開発初期段階にあります。画像クレジット:TechCrunchによるスクリーンショット
現在はiOS限定ですが、App Storeの説明文にはAndroid版についても言及されています。(詳細についてはGoogleに問い合わせており、情報が入り次第、この記事を更新する予定です。)
説明によると、Eloquentは「シームレスなAndroid統合」を約束しており、あらゆるテキスト入力フィールドでシステム全体に使用できるよう、デフォルトのキーボードとして設定可能です。さらに、このアプリは、Android版Wispr Flowの実装と同様に、どこからでも簡単に文字起こしにアクセスできるフローティングボタン機能もサポートする予定です。
音声認識モデルの精度向上に伴い、AIを活用した文字起こしアプリの人気が高まっています。今回の実験的なリリースにより、Googleはこの競争の激しい分野に参入することになります。テストが成功すれば、強化された文字起こし機能がAndroid本体にも統合される可能性があります。
関連記事
Google I/O 2026で、Gmailの受信トレイとの音声操作機能が発表された
Googleは引き続き、AIをメール受信トレイに組み込んでいます。火曜日に開催された開発者向けカンファレンス「IO 2026」で、同社はGmailの「AI Inbox」機能を対話型AIで拡張し、ユーザーが検索語句だけに頼るのではなく、受信トレイの内容について質問できるようになりました。Googleによると、Gmail Liveと名付けられたこのGemini AI搭載ツールは、受信トレイの奥深くに埋
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
関連特集おすすめ
コメント (0)
0/500
【 更新(4月7日 午後10時30分 PT)】同社は アプリストアの掲載情報を更新し、Android版に関する記述を削除した。ただし、iOS向けキーボード機能がまもなく提供されることも併せて明記している。
月曜日、Googleは「Google AI Edge Eloquent」というiOS向けの新オフライン優先音声入力アプリをひっそりとリリースし、Wispr Flow、SuperWhisper、Willowといった競合サービスに対抗する位置づけとした。
この無料アプリでは、Gemmaベースの自動音声認識(ASR)モデルをダウンロードすれば、すぐに音声入力を開始できます。入力内容はリアルタイムで文字起こし表示され、一時停止すると「えー」や「あー」といった間投詞が自動的に削除され、文章が整えられます。
文字起こしの下には、「Key points(要点)」、「Formal(フォーマル)」、「Short(短文)」、「Long(長文)」といった、テキストの書式を変更するためのオプションが用意されている。

画像クレジット:TechCrunchによるスクリーンショット
クラウド接続をオフにすることで、ローカルのみでの処理モードを有効にできます。(クラウドモードがオンの場合、アプリはテキストの精緻化のためにクラウド上のGeminiモデルを使用します。)Google AI Edge Eloquentでは、オプションでGmailアカウントから特定のキーワード、名前、専門用語を取り込むことができます。また、辞書に独自の単語を追加することも可能です。
このアプリはすべての文字起こしセッションの履歴を保持しており、検索が可能です。前回のセッションのメトリクス(口述した単語数、1分あたりの入力速度、総単語数など)も表示されます。
「Google AI Edge Eloquentは、自然な話し言葉を洗練されたプロフェッショナルなテキストに変換するように設計された高度なディクテーションアプリです。つまずきやつなぎ言葉をすべて文字起こししてしまう基本的なソフトウェアとは異なり、EloquentはAIを活用してユーザーの意図を理解します。『えー』や『あー』といった言葉、文中の訂正を自動的に編集して削除し、クリーンで正確な文章を提供します」と、同社のApp Storeの説明文には記載されています。

「文字起こし」と言おうとしていました。このアプリはまだ開発初期段階にあります。画像クレジット:TechCrunchによるスクリーンショット
現在はiOS限定ですが、App Storeの説明文にはAndroid版についても言及されています。(詳細についてはGoogleに問い合わせており、情報が入り次第、この記事を更新する予定です。)
説明によると、Eloquentは「シームレスなAndroid統合」を約束しており、あらゆるテキスト入力フィールドでシステム全体に使用できるよう、デフォルトのキーボードとして設定可能です。さらに、このアプリは、Android版Wispr Flowの実装と同様に、どこからでも簡単に文字起こしにアクセスできるフローティングボタン機能もサポートする予定です。
音声認識モデルの精度向上に伴い、AIを活用した文字起こしアプリの人気が高まっています。今回の実験的なリリースにより、Googleはこの競争の激しい分野に参入することになります。テストが成功すれば、強化された文字起こし機能がAndroid本体にも統合される可能性があります。
Google I/O 2026で、Gmailの受信トレイとの音声操作機能が発表された
Googleは引き続き、AIをメール受信トレイに組み込んでいます。火曜日に開催された開発者向けカンファレンス「IO 2026」で、同社はGmailの「AI Inbox」機能を対話型AIで拡張し、ユーザーが検索語句だけに頼るのではなく、受信トレイの内容について質問できるようになりました。Googleによると、Gmail Liveと名付けられたこのGemini AI搭載ツールは、受信トレイの奥深くに埋
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し





家






