AndroidとChromeのAIおよびアクセシビリティ強化
2025年5月22日
JustinWilliams
0
グローバルアクセシビリティ認知デーを祝うにあたり、AndroidとChromeの製品に大幅な更新を発表するとともに、音声認識ツールを開発する開発者向けの新しいリソースを提供することを嬉しく思います。これらのAIの進歩により、デジタル世界はよりアクセスしやすく、包括的になっています。
AndroidでのAIパワードのさらなるイノベーション
私たちは、視覚や聴覚に特に焦点を当てたモバイル体験の中にGoogle AIとGeminiを組み込むことで、アクセシビリティへの取り組みをさらに強化しています。
GeminiとTalkBackで詳細を強化
昨年、Geminiの機能をAndroidのスクリーンリーダーであるTalkBackに統合し、altテキストが欠けている場合でもAIが生成した画像の説明を提供しました。そして今、この機能を拡張しています。ユーザーは受け取った画像について質問できるようになりました。例えば、友人の新しいギターについて、メーカーや色、その他の写真内の要素について尋ねることができます。また、全画面についての説明や質問も可能です。例えば、ショッピングアプリでセールを探しているとき、アイテムの素材や利用可能な割引についてGeminiに尋ねることができます。

キャプションの背後にある感情をより理解
Expressive Captionsにより、Androidデバイスはほとんどのアプリでリアルタイムのキャプションを提供し、何が言われているだけでなく、それがどのように言われているかも捉えます。新しい持続時間機能を追加し、言葉が引き伸ばされているときを強調します。スポーツ放送での「amaaazing shot」やビデオメッセージでの引き伸ばされた「nooooo」のように。さらに、口笛や喉を鳴らすなどの音に対するラベルも増えました。この更新は、米国、英国、カナダ、オーストラリアでAndroid 15以上を実行するデバイス向けに英語で利用可能です。

世界中の音声認識の改善
2019年にProject Euphoniaを開始して以来、非標準的なスピーチパターンを持つ人々に対する音声認識の改善を目指してきました。現在、世界中の開発者や組織をサポートし、この技術をより多くの言語や文化的文脈に適応させる手助けをしています。
新しい開発者リソース
アクセス可能なツールのグローバルなエコシステムを育むために、Project EuphoniaのGitHubページを通じて、開発者が私たちのオープンソースリポジトリにアクセスできるようにしています。これにより、彼らは研究用のパーソナライズドなオーディオツールを開発したり、多様なスピーチパターンを認識するためのモデルを訓練したりすることができます。
アフリカでの新しいプロジェクトのサポート
今年初め、Google.orgと協力して、University College Londonがデジタル言語包摂センター(CDLI)を設立するのを支援しました。CDLIは、アフリカ全土の非英語話者に対する音声認識技術の向上に焦点を当てています。彼らは10のAfrican言語でのオープンソースデータセットを作成し、新しい音声認識モデルを開発し、この分野の組織や開発者のより広いコミュニティをサポートしています。
学生向けのアクセシビリティオプションの拡大
障害を持つ学生にとって、アクセシビリティツールは重要な役割を果たします。Face Controlを使ってChromebookを顔のジェスチャーでナビゲートしたり、Reading Modeで読書体験をカスタマイズしたりすることができます。現在、College BoardのBluebookテストアプリでSATやAdvanced Placement試験を受ける際に、Chromebookを使用すると、ChromeVoxスクリーンリーダーやDictationを含むGoogleの組み込みアクセシビリティ機能すべてにアクセスできるようになりました。さらに、College Board自身のデジタルテストツールも利用可能です。
Chromeをもっとアクセスしやすく
20億人以上の毎日のユーザーを抱える中で、私たちは常にChromeのアクセシビリティの改善に取り組んでいます。スクリーンリーダーユーザー向けのLive Captionや画像の説明などがその一部です。
ChromeでPDFをより簡単にアクセス
以前、デスクトップChromeではスキャンされたPDFはスクリーンリーダーにアクセスできませんでした。現在、光学文字認識(OCR)を使用して、ChromeはこれらのPDFを認識し、ハイライト、コピー、テキストの検索、スクリーンリーダーを使って読み上げることが可能です。
ページズームで読みやすく
Android向けChromeのページズームは、ウェブページのレイアウトやブラウジング体験を変更することなく、テキストのサイズを大きくすることができます。デスクトップChromeと同様に動作します。ズーム設定をすべてのページや特定のページに適用するように設定できます。

この機能を使用するには、Chromeの右上隅にある三点メニューをタップし、ズーム設定を調整してください。
関連記事
Les agents IA d'Adobe améliorent Photoshop et Premiere Pro
Adobe bouleverse le monde de la création en introduisant des agents IA conçus pour révolutionner l'utilisation de Photoshop et Premiere Pro. Dans un récent billet de blog, Ely Gree
no_translate
La réalité troublante d'une IA trop concilianteImaginez un assistant IA qui accepte tout ce que vous dites, peu importe à quel point vos idées peuvent être extravagantes ou nocives
Microsoft dévoile Recall et la recherche améliorée par IA pour les PC Copilot Plus
Microsoft déploie enfin Recall sur tous les PC Copilot Plus aujourd'hui, après une longue attente et plusieurs reports. Cette fonctionnalité, qui capture des captures d'écran de pr
コメント (0)
0/200






グローバルアクセシビリティ認知デーを祝うにあたり、AndroidとChromeの製品に大幅な更新を発表するとともに、音声認識ツールを開発する開発者向けの新しいリソースを提供することを嬉しく思います。これらのAIの進歩により、デジタル世界はよりアクセスしやすく、包括的になっています。
AndroidでのAIパワードのさらなるイノベーション
私たちは、視覚や聴覚に特に焦点を当てたモバイル体験の中にGoogle AIとGeminiを組み込むことで、アクセシビリティへの取り組みをさらに強化しています。
GeminiとTalkBackで詳細を強化
昨年、Geminiの機能をAndroidのスクリーンリーダーであるTalkBackに統合し、altテキストが欠けている場合でもAIが生成した画像の説明を提供しました。そして今、この機能を拡張しています。ユーザーは受け取った画像について質問できるようになりました。例えば、友人の新しいギターについて、メーカーや色、その他の写真内の要素について尋ねることができます。また、全画面についての説明や質問も可能です。例えば、ショッピングアプリでセールを探しているとき、アイテムの素材や利用可能な割引についてGeminiに尋ねることができます。
キャプションの背後にある感情をより理解
Expressive Captionsにより、Androidデバイスはほとんどのアプリでリアルタイムのキャプションを提供し、何が言われているだけでなく、それがどのように言われているかも捉えます。新しい持続時間機能を追加し、言葉が引き伸ばされているときを強調します。スポーツ放送での「amaaazing shot」やビデオメッセージでの引き伸ばされた「nooooo」のように。さらに、口笛や喉を鳴らすなどの音に対するラベルも増えました。この更新は、米国、英国、カナダ、オーストラリアでAndroid 15以上を実行するデバイス向けに英語で利用可能です。
世界中の音声認識の改善
2019年にProject Euphoniaを開始して以来、非標準的なスピーチパターンを持つ人々に対する音声認識の改善を目指してきました。現在、世界中の開発者や組織をサポートし、この技術をより多くの言語や文化的文脈に適応させる手助けをしています。
新しい開発者リソース
アクセス可能なツールのグローバルなエコシステムを育むために、Project EuphoniaのGitHubページを通じて、開発者が私たちのオープンソースリポジトリにアクセスできるようにしています。これにより、彼らは研究用のパーソナライズドなオーディオツールを開発したり、多様なスピーチパターンを認識するためのモデルを訓練したりすることができます。
アフリカでの新しいプロジェクトのサポート
今年初め、Google.orgと協力して、University College Londonがデジタル言語包摂センター(CDLI)を設立するのを支援しました。CDLIは、アフリカ全土の非英語話者に対する音声認識技術の向上に焦点を当てています。彼らは10のAfrican言語でのオープンソースデータセットを作成し、新しい音声認識モデルを開発し、この分野の組織や開発者のより広いコミュニティをサポートしています。
学生向けのアクセシビリティオプションの拡大
障害を持つ学生にとって、アクセシビリティツールは重要な役割を果たします。Face Controlを使ってChromebookを顔のジェスチャーでナビゲートしたり、Reading Modeで読書体験をカスタマイズしたりすることができます。現在、College BoardのBluebookテストアプリでSATやAdvanced Placement試験を受ける際に、Chromebookを使用すると、ChromeVoxスクリーンリーダーやDictationを含むGoogleの組み込みアクセシビリティ機能すべてにアクセスできるようになりました。さらに、College Board自身のデジタルテストツールも利用可能です。
Chromeをもっとアクセスしやすく
20億人以上の毎日のユーザーを抱える中で、私たちは常にChromeのアクセシビリティの改善に取り組んでいます。スクリーンリーダーユーザー向けのLive Captionや画像の説明などがその一部です。
ChromeでPDFをより簡単にアクセス
以前、デスクトップChromeではスキャンされたPDFはスクリーンリーダーにアクセスできませんでした。現在、光学文字認識(OCR)を使用して、ChromeはこれらのPDFを認識し、ハイライト、コピー、テキストの検索、スクリーンリーダーを使って読み上げることが可能です。
ページズームで読みやすく
Android向けChromeのページズームは、ウェブページのレイアウトやブラウジング体験を変更することなく、テキストのサイズを大きくすることができます。デスクトップChromeと同様に動作します。ズーム設定をすべてのページや特定のページに適用するように設定できます。
この機能を使用するには、Chromeの右上隅にある三点メニューをタップし、ズーム設定を調整してください。












