AndroidとChromeのAIおよびアクセシビリティ強化
グローバルアクセシビリティ認知デーを祝うにあたり、AndroidとChromeの製品に大幅な更新を発表するとともに、音声認識ツールを開発する開発者向けの新しいリソースを提供することを嬉しく思います。これらのAIの進歩により、デジタル世界はよりアクセスしやすく、包括的になっています。
AndroidでのAIパワードのさらなるイノベーション
私たちは、視覚や聴覚に特に焦点を当てたモバイル体験の中にGoogle AIとGeminiを組み込むことで、アクセシビリティへの取り組みをさらに強化しています。
GeminiとTalkBackで詳細を強化
昨年、Geminiの機能をAndroidのスクリーンリーダーであるTalkBackに統合し、altテキストが欠けている場合でもAIが生成した画像の説明を提供しました。そして今、この機能を拡張しています。ユーザーは受け取った画像について質問できるようになりました。例えば、友人の新しいギターについて、メーカーや色、その他の写真内の要素について尋ねることができます。また、全画面についての説明や質問も可能です。例えば、ショッピングアプリでセールを探しているとき、アイテムの素材や利用可能な割引についてGeminiに尋ねることができます。

キャプションの背後にある感情をより理解
Expressive Captionsにより、Androidデバイスはほとんどのアプリでリアルタイムのキャプションを提供し、何が言われているだけでなく、それがどのように言われているかも捉えます。新しい持続時間機能を追加し、言葉が引き伸ばされているときを強調します。スポーツ放送での「amaaazing shot」やビデオメッセージでの引き伸ばされた「nooooo」のように。さらに、口笛や喉を鳴らすなどの音に対するラベルも増えました。この更新は、米国、英国、カナダ、オーストラリアでAndroid 15以上を実行するデバイス向けに英語で利用可能です。

世界中の音声認識の改善
2019年にProject Euphoniaを開始して以来、非標準的なスピーチパターンを持つ人々に対する音声認識の改善を目指してきました。現在、世界中の開発者や組織をサポートし、この技術をより多くの言語や文化的文脈に適応させる手助けをしています。
新しい開発者リソース
アクセス可能なツールのグローバルなエコシステムを育むために、Project EuphoniaのGitHubページを通じて、開発者が私たちのオープンソースリポジトリにアクセスできるようにしています。これにより、彼らは研究用のパーソナライズドなオーディオツールを開発したり、多様なスピーチパターンを認識するためのモデルを訓練したりすることができます。
アフリカでの新しいプロジェクトのサポート
今年初め、Google.orgと協力して、University College Londonがデジタル言語包摂センター(CDLI)を設立するのを支援しました。CDLIは、アフリカ全土の非英語話者に対する音声認識技術の向上に焦点を当てています。彼らは10のAfrican言語でのオープンソースデータセットを作成し、新しい音声認識モデルを開発し、この分野の組織や開発者のより広いコミュニティをサポートしています。
学生向けのアクセシビリティオプションの拡大
障害を持つ学生にとって、アクセシビリティツールは重要な役割を果たします。Face Controlを使ってChromebookを顔のジェスチャーでナビゲートしたり、Reading Modeで読書体験をカスタマイズしたりすることができます。現在、College BoardのBluebookテストアプリでSATやAdvanced Placement試験を受ける際に、Chromebookを使用すると、ChromeVoxスクリーンリーダーやDictationを含むGoogleの組み込みアクセシビリティ機能すべてにアクセスできるようになりました。さらに、College Board自身のデジタルテストツールも利用可能です。
Chromeをもっとアクセスしやすく
20億人以上の毎日のユーザーを抱える中で、私たちは常にChromeのアクセシビリティの改善に取り組んでいます。スクリーンリーダーユーザー向けのLive Captionや画像の説明などがその一部です。
ChromeでPDFをより簡単にアクセス
以前、デスクトップChromeではスキャンされたPDFはスクリーンリーダーにアクセスできませんでした。現在、光学文字認識(OCR)を使用して、ChromeはこれらのPDFを認識し、ハイライト、コピー、テキストの検索、スクリーンリーダーを使って読み上げることが可能です。
ページズームで読みやすく
Android向けChromeのページズームは、ウェブページのレイアウトやブラウジング体験を変更することなく、テキストのサイズを大きくすることができます。デスクトップChromeと同様に動作します。ズーム設定をすべてのページや特定のページに適用するように設定できます。

この機能を使用するには、Chromeの右上隅にある三点メニューをタップし、ズーム設定を調整してください。
関連記事
Metaが高度なLlamaツールでAIセキュリティを強化
Metaは、新たなLlamaセキュリティツールをリリースし、AI開発を強化し、新たな脅威から保護します。これらのアップグレードされたLlama AIモデルのセキュリティツールは、Metaの新しいリソースと組み合わされ、サイバーセキュリティチームがAIを防御に活用することを支援し、すべてのAIステークホルダーの安全性を高めることを目指します。Llamaモデルを使用する開発者は、MetaのLlama
NotebookLMがトップ出版物と専門家からの厳選ノートブックを公開
Googleは、AI駆動の研究およびノート作成ツールであるNotebookLMを強化し、包括的な知識ハブとして提供しています。月曜日、同社は著名な著者、出版物、研究者、非営利団体からの厳選されたノートブックコレクションを導入し、ユーザーが健康、旅行、ファイナンスなどの多様なトピックを探求できるようにしました。初期セットには、The Economist、The Atlantic、著名な教授、著者、さ
AlibabaがWan2.1-VACEを発表:オープンソースAIビデオソリューション
Alibabaは、ビデオ作成および編集プロセスを革新するオープンソースAIモデル、Wan2.1-VACEを発表しました。VACEは、AlibabaのWan2.1ビデオAIモデルファミリーの主要なコンポーネントであり、同社はこれが「業界初の多様なビデオ生成および編集タスクに対応する包括的なソリューションを提供するオープンソースモデル」だと主張しています。もしAlibabaがビデオ制作プロセスを効率化
コメント (6)
0/200
GaryPerez
2025年7月31日 10:41:20 JST
Love how AI is making tech more inclusive! These Android and Chrome updates sound amazing—can't wait to see them in action. 🌟
0
EricAllen
2025年5月24日 16:29:52 JST
Super impressionnant, ces mises à jour pour l’accessibilité ! 🥳 L’IA qui rend le numérique plus inclusif, c’est génial. Mais j’espère que ça ne va pas trop compliquer les choses pour les non-techies.
0
RichardAdams
2025年5月24日 15:31:39 JST
Wow, these AI updates for Android and Chrome sound amazing! 😍 Making tech more inclusive is such a big win. Excited to see how these speech recognition tools evolve!
0
EdwardTaylor
2025年5月22日 21:48:34 JST
アクセシビリティの進化、めっちゃ面白いね!😄 AIがもっと身近になって、AndroidやChromeが使いやすくなるなんて最高!開発者向けリソースも気になるな。
0
TimothyTaylor
2025年5月22日 21:17:01 JST
Классно, что AI делает технологии доступнее! 😎 Обновления для Android и Chrome – это шаг вперед. Но вот вопрос: не будут ли такие новшества слишком сложными для обычных пользователей?
0
グローバルアクセシビリティ認知デーを祝うにあたり、AndroidとChromeの製品に大幅な更新を発表するとともに、音声認識ツールを開発する開発者向けの新しいリソースを提供することを嬉しく思います。これらのAIの進歩により、デジタル世界はよりアクセスしやすく、包括的になっています。
AndroidでのAIパワードのさらなるイノベーション
私たちは、視覚や聴覚に特に焦点を当てたモバイル体験の中にGoogle AIとGeminiを組み込むことで、アクセシビリティへの取り組みをさらに強化しています。
GeminiとTalkBackで詳細を強化
昨年、Geminiの機能をAndroidのスクリーンリーダーであるTalkBackに統合し、altテキストが欠けている場合でもAIが生成した画像の説明を提供しました。そして今、この機能を拡張しています。ユーザーは受け取った画像について質問できるようになりました。例えば、友人の新しいギターについて、メーカーや色、その他の写真内の要素について尋ねることができます。また、全画面についての説明や質問も可能です。例えば、ショッピングアプリでセールを探しているとき、アイテムの素材や利用可能な割引についてGeminiに尋ねることができます。
キャプションの背後にある感情をより理解
Expressive Captionsにより、Androidデバイスはほとんどのアプリでリアルタイムのキャプションを提供し、何が言われているだけでなく、それがどのように言われているかも捉えます。新しい持続時間機能を追加し、言葉が引き伸ばされているときを強調します。スポーツ放送での「amaaazing shot」やビデオメッセージでの引き伸ばされた「nooooo」のように。さらに、口笛や喉を鳴らすなどの音に対するラベルも増えました。この更新は、米国、英国、カナダ、オーストラリアでAndroid 15以上を実行するデバイス向けに英語で利用可能です。
世界中の音声認識の改善
2019年にProject Euphoniaを開始して以来、非標準的なスピーチパターンを持つ人々に対する音声認識の改善を目指してきました。現在、世界中の開発者や組織をサポートし、この技術をより多くの言語や文化的文脈に適応させる手助けをしています。
新しい開発者リソース
アクセス可能なツールのグローバルなエコシステムを育むために、Project EuphoniaのGitHubページを通じて、開発者が私たちのオープンソースリポジトリにアクセスできるようにしています。これにより、彼らは研究用のパーソナライズドなオーディオツールを開発したり、多様なスピーチパターンを認識するためのモデルを訓練したりすることができます。
アフリカでの新しいプロジェクトのサポート
今年初め、Google.orgと協力して、University College Londonがデジタル言語包摂センター(CDLI)を設立するのを支援しました。CDLIは、アフリカ全土の非英語話者に対する音声認識技術の向上に焦点を当てています。彼らは10のAfrican言語でのオープンソースデータセットを作成し、新しい音声認識モデルを開発し、この分野の組織や開発者のより広いコミュニティをサポートしています。
学生向けのアクセシビリティオプションの拡大
障害を持つ学生にとって、アクセシビリティツールは重要な役割を果たします。Face Controlを使ってChromebookを顔のジェスチャーでナビゲートしたり、Reading Modeで読書体験をカスタマイズしたりすることができます。現在、College BoardのBluebookテストアプリでSATやAdvanced Placement試験を受ける際に、Chromebookを使用すると、ChromeVoxスクリーンリーダーやDictationを含むGoogleの組み込みアクセシビリティ機能すべてにアクセスできるようになりました。さらに、College Board自身のデジタルテストツールも利用可能です。
Chromeをもっとアクセスしやすく
20億人以上の毎日のユーザーを抱える中で、私たちは常にChromeのアクセシビリティの改善に取り組んでいます。スクリーンリーダーユーザー向けのLive Captionや画像の説明などがその一部です。
ChromeでPDFをより簡単にアクセス
以前、デスクトップChromeではスキャンされたPDFはスクリーンリーダーにアクセスできませんでした。現在、光学文字認識(OCR)を使用して、ChromeはこれらのPDFを認識し、ハイライト、コピー、テキストの検索、スクリーンリーダーを使って読み上げることが可能です。
ページズームで読みやすく
Android向けChromeのページズームは、ウェブページのレイアウトやブラウジング体験を変更することなく、テキストのサイズを大きくすることができます。デスクトップChromeと同様に動作します。ズーム設定をすべてのページや特定のページに適用するように設定できます。
この機能を使用するには、Chromeの右上隅にある三点メニューをタップし、ズーム設定を調整してください。


Love how AI is making tech more inclusive! These Android and Chrome updates sound amazing—can't wait to see them in action. 🌟




Super impressionnant, ces mises à jour pour l’accessibilité ! 🥳 L’IA qui rend le numérique plus inclusif, c’est génial. Mais j’espère que ça ne va pas trop compliquer les choses pour les non-techies.




Wow, these AI updates for Android and Chrome sound amazing! 😍 Making tech more inclusive is such a big win. Excited to see how these speech recognition tools evolve!




アクセシビリティの進化、めっちゃ面白いね!😄 AIがもっと身近になって、AndroidやChromeが使いやすくなるなんて最高!開発者向けリソースも気になるな。




Классно, что AI делает технологии доступнее! 😎 Обновления для Android и Chrome – это шаг вперед. Но вот вопрос: не будут ли такие новшества слишком сложными для обычных пользователей?












