AndroidとChromeのAIおよびアクセシビリティ強化

家

ニュース

2025年5月22日

JustinWilliams

# ai # Android # Chrome

グローバルアクセシビリティ認知デーを祝うにあたり、AndroidとChromeの製品に大幅な更新を発表するとともに、音声認識ツールを開発する開発者向けの新しいリソースを提供することを嬉しく思います。これらのAIの進歩により、デジタル世界はよりアクセスしやすく、包括的になっています。

AndroidでのAIパワードのさらなるイノベーション

私たちは、視覚や聴覚に特に焦点を当てたモバイル体験の中にGoogle AIとGeminiを組み込むことで、アクセシビリティへの取り組みをさらに強化しています。

GeminiとTalkBackで詳細を強化

昨年、Geminiの機能をAndroidのスクリーンリーダーであるTalkBackに統合し、altテキストが欠けている場合でもAIが生成した画像の説明を提供しました。そして今、この機能を拡張しています。ユーザーは受け取った画像について質問できるようになりました。例えば、友人の新しいギターについて、メーカーや色、その他の写真内の要素について尋ねることができます。また、全画面についての説明や質問も可能です。例えば、ショッピングアプリでセールを探しているとき、アイテムの素材や利用可能な割引についてGeminiに尋ねることができます。

TalkBackのGeminiによる機能を使って、画面に表示されている内容の説明を得る

キャプションの背後にある感情をより理解

Expressive Captionsにより、Androidデバイスはほとんどのアプリでリアルタイムのキャプションを提供し、何が言われているだけでなく、それがどのように言われているかも捉えます。新しい持続時間機能を追加し、言葉が引き伸ばされているときを強調します。スポーツ放送での「amaaazing shot」やビデオメッセージでの引き伸ばされた「nooooo」のように。さらに、口笛や喉を鳴らすなどの音に対するラベルも増えました。この更新は、米国、英国、カナダ、オーストラリアでAndroid 15以上を実行するデバイス向けに英語で利用可能です。

Expressive Captionsの新しい持続時間機能で、電話のオーディオやビデオで何が言われているかの文脈をさらに得る

世界中の音声認識の改善

2019年にProject Euphoniaを開始して以来、非標準的なスピーチパターンを持つ人々に対する音声認識の改善を目指してきました。現在、世界中の開発者や組織をサポートし、この技術をより多くの言語や文化的文脈に適応させる手助けをしています。

新しい開発者リソース

アクセス可能なツールのグローバルなエコシステムを育むために、Project EuphoniaのGitHubページを通じて、開発者が私たちのオープンソースリポジトリにアクセスできるようにしています。これにより、彼らは研究用のパーソナライズドなオーディオツールを開発したり、多様なスピーチパターンを認識するためのモデルを訓練したりすることができます。

アフリカでの新しいプロジェクトのサポート

今年初め、Google.orgと協力して、University College Londonがデジタル言語包摂センター（CDLI）を設立するのを支援しました。CDLIは、アフリカ全土の非英語話者に対する音声認識技術の向上に焦点を当てています。彼らは10のAfrican言語でのオープンソースデータセットを作成し、新しい音声認識モデルを開発し、この分野の組織や開発者のより広いコミュニティをサポートしています。

学生向けのアクセシビリティオプションの拡大

障害を持つ学生にとって、アクセシビリティツールは重要な役割を果たします。Face Controlを使ってChromebookを顔のジェスチャーでナビゲートしたり、Reading Modeで読書体験をカスタマイズしたりすることができます。現在、College BoardのBluebookテストアプリでSATやAdvanced Placement試験を受ける際に、Chromebookを使用すると、ChromeVoxスクリーンリーダーやDictationを含むGoogleの組み込みアクセシビリティ機能すべてにアクセスできるようになりました。さらに、College Board自身のデジタルテストツールも利用可能です。

Chromeをもっとアクセスしやすく

20億人以上の毎日のユーザーを抱える中で、私たちは常にChromeのアクセシビリティの改善に取り組んでいます。スクリーンリーダーユーザー向けのLive Captionや画像の説明などがその一部です。

ChromeでPDFをより簡単にアクセス

以前、デスクトップChromeではスキャンされたPDFはスクリーンリーダーにアクセスできませんでした。現在、光学文字認識（OCR）を使用して、ChromeはこれらのPDFを認識し、ハイライト、コピー、テキストの検索、スクリーンリーダーを使って読み上げることが可能です。

ページズームで読みやすく

Android向けChromeのページズームは、ウェブページのレイアウトやブラウジング体験を変更することなく、テキストのサイズを大きくすることができます。デスクトップChromeと同様に動作します。ズーム設定をすべてのページや特定のページに適用するように設定できます。

ページズームはAndroid向けChromeで動作し、ページの見え方をカスタマイズできます。

この機能を使用するには、Chromeの右上隅にある三点メニューをタップし、ズーム設定を調整してください。

Metaが高度なLlamaツールでAIセキュリティを強化 Metaは、新たなLlamaセキュリティツールをリリースし、AI開発を強化し、新たな脅威から保護します。これらのアップグレードされたLlama AIモデルのセキュリティツールは、Metaの新しいリソースと組み合わされ、サイバーセキュリティチームがAIを防御に活用することを支援し、すべてのAIステークホルダーの安全性を高めることを目指します。Llamaモデルを使用する開発者は、MetaのLlama

NotebookLMがトップ出版物と専門家からの厳選ノートブックを公開 Googleは、AI駆動の研究およびノート作成ツールであるNotebookLMを強化し、包括的な知識ハブとして提供しています。月曜日、同社は著名な著者、出版物、研究者、非営利団体からの厳選されたノートブックコレクションを導入し、ユーザーが健康、旅行、ファイナンスなどの多様なトピックを探求できるようにしました。初期セットには、The Economist、The Atlantic、著名な教授、著者、さ

AlibabaがWan2.1-VACEを発表：オープンソースAIビデオソリューション Alibabaは、ビデオ作成および編集プロセスを革新するオープンソースAIモデル、Wan2.1-VACEを発表しました。VACEは、AlibabaのWan2.1ビデオAIモデルファミリーの主要なコンポーネントであり、同社はこれが「業界初の多様なビデオ生成および編集タスクに対応する包括的なソリューションを提供するオープンソースモデル」だと主張しています。もしAlibabaがビデオ制作プロセスを効率化

コメント (6)

0/200

提出する

GaryPerez

2025年7月31日 10:41:20 JST

Love how AI is making tech more inclusive! These Android and Chrome updates sound amazing—can't wait to see them in action. 🌟

EricAllen

2025年5月24日 16:29:52 JST

Super impressionnant, ces mises à jour pour l’accessibilité ! 🥳 L’IA qui rend le numérique plus inclusif, c’est génial. Mais j’espère que ça ne va pas trop compliquer les choses pour les non-techies.

RichardAdams

2025年5月24日 15:31:39 JST

Wow, these AI updates for Android and Chrome sound amazing! 😍 Making tech more inclusive is such a big win. Excited to see how these speech recognition tools evolve!

CarlCarter

2025年5月23日 18:35:52 JST

AI和无障碍功能的升级真是让人眼前一亮！🤖 感觉未来用安卓和Chrome会更方便，尤其是语音识别这块，期待能帮到更多人！

EdwardTaylor

2025年5月22日 21:48:34 JST

アクセシビリティの進化、めっちゃ面白いね！😄 AIがもっと身近になって、AndroidやChromeが使いやすくなるなんて最高！開発者向けリソースも気になるな。

TimothyTaylor

2025年5月22日 21:17:01 JST

Классно, что AI делает технологии доступнее! 😎 Обновления для Android и Chrome – это шаг вперед. Но вот вопрос: не будут ли такие новшества слишком сложными для обычных пользователей?

トップニュース

Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 Openaiは、より良いチャットのためにAIの音声アシスタントを強化します Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します AIボイスオーバー：リアルな声制作究極ガイド米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます 2026年までに複数のNYCのパワーを消費するAIコンピューティングは、創設者によると AIボイスクローン：音声変換を極めるための完全ガイド AI搭載のI/Oクロスワードを体験する：古典的な単語ゲームのモダンなひねり Nvidia CEOは、Deepseekの市場への影響に関する誤解を明確にしています

もっと

特集