安卓和Chrome的AI及無障礙增強
在慶祝全球無障礙意識日之際,我們興奮地宣布對我們的Android和Chrome產品進行重大更新,同時為開發語音識別工具的開發者提供新資源。這些人工智能的進展正使我們的數位世界變得更加無障礙和包容。
Android上的更多AI驅動創新
我們通過將Google AI和Gemini整合到移動體驗的核心,特別是在視覺和聽覺方面,進一步承諾無障礙。
利用Gemini和TalkBack增強細節
去年,我們將Gemini的能力整合到Android的螢幕閱讀器TalkBack中,為沒有替代文字的圖片提供AI生成的描述。現在,我們正在擴展這項功能。用戶現在可以對收到的圖片提問,例如朋友的新吉他。你可以詢問製造商、顏色或照片中的其他元素。此外,你還可以獲取整個螢幕的描述並提問。例如,當你在一個購物應用中瀏覽折扣時,你可以詢問Gemini物品的材質或檢查是否有可用的折扣。

理解字幕背後的情感
透過Expressive Captions,你的Android設備現在可以跨大多數應用程式提供即時字幕,不僅捕捉到說了什麼,還捕捉到如何說。我們增加了一個新的持續時間功能,當詞語被拉長時會強調,例如在體育廣播中聽到「amaaazing shot」,或在視頻消息中聽到「nooooo」。你還會得到更多聲音的標籤,如口哨聲或清喉嚨聲。此更新適用於在美國、英國、加拿大和澳大利亞運行Android 15及以上版本的設備的英語用戶。

全球改善語音識別
自2019年啟動Project Euphonia以來,我們的目標是使語音識別對於具有非標準語音模式的人更加無障礙。我們現在正在全球擴大對開發者和組織的支持,幫助他們將這項技術適應更多語言和文化背景。
新的開發者資源
為了促進全球無障礙工具的生態系統,我們通過Project Euphonia的GitHub頁面向開發者提供開放原始碼存儲庫的訪問權限。這使他們能夠為研究開發個性化的音頻工具,或訓練他們的模型以識別多樣的語音模式。
支持非洲的新項目
今年早些時候,我們與Google.org合作,支持倫敦大學學院成立數位語言包容中心(CDLI)。CDLI專注於增強非英語使用者在非洲的語音識別技術。他們正在創建10種非洲語言的開放原始碼數據集,開發新的語音識別模型,並支持該領域更廣泛的組織和開發者社群。
擴展學生的無障礙選項
無障礙工具對於有障礙的學生起著至關重要的作用,從使用面部手勢來導航Chromebook的Face Control,到使用Reading Mode自定義閱讀體驗。現在,當使用Chromebook與College Board的Bluebook測試應用進行SAT和進階放置考試時,學生將能夠訪問所有Google內建的無障礙功能,包括ChromeVox螢幕閱讀器和聽寫功能,以及College Board自己的數位測試工具。
使Chrome更加無障礙
隨著每天超過20億用戶,我們不斷努力改善Chrome的無障礙功能。像Live Caption和螢幕閱讀器用戶的圖片描述都是這一努力的部分。
在Chrome上更容易訪問PDF
之前,在桌面版Chrome中,掃描的PDF對螢幕閱讀器來說是無法訪問的。現在,透過光學字符識別(OCR),Chrome能夠識別這些PDF,讓你可以高亮、複製、搜尋文字,並使用你的螢幕閱讀器閱讀它們。
透過頁面縮放輕鬆閱讀
Android版Chrome上的頁面縮放現在讓你可以增加文字大小,而不改變網頁佈局或你的瀏覽體驗,類似於桌面版Chrome上的工作方式。你可以設置你的縮放偏好,適用於所有頁面或特定頁面。

要使用此功能,只需點擊Chrome右上角的三點選單並調整你的縮放設置即可。
相關文章
Meta增強AI安全以先進Llama工具
Meta已發布全新Llama安全工具,以強化AI開發並防範新興威脅。這些升級的Llama AI模型安全工具與Meta的新資源搭配,旨在賦能網路安全團隊利用AI進行防禦,提升所有AI利益相關者的安全性。使用Llama模型的開發者現可直接在Meta的Llama Protections頁面、Hugging Face及GitHub上獲得增強工具。Llama Guard 4引入多模態功能,支持文字與圖像的安
NotebookLM推出頂尖出版物與專家精選筆記本
Google正在增強其AI驅動的研究與筆記工具NotebookLM,使其成為一個全面的知識中心。週一,該公司推出了一個由知名作者、出版物、研究人員和非營利組織提供的精選筆記本集合,讓使用者能夠探索健康、旅遊、財經等多樣化主題。首批內容包括來自《經濟學人》、《大西洋月刊》、知名教授、作者,甚至莎士比亞作品的貢獻,展示NotebookLM在深入主題探索中的實際應用。Google解釋說,使用者可以存取原
阿里巴巴推出Wan2.1-VACE:開源AI視頻解決方案
阿里巴巴推出了Wan2.1-VACE,一款開源AI模型,旨在改變視頻創作與編輯流程。VACE是阿里巴巴Wan2.1視頻AI模型系列的關鍵組成部分,公司宣稱這是「業界首個為多樣化視頻生成與編輯任務提供全面解決方案的開源模型」。如果阿里巴巴能夠簡化視頻製作流程,將多種工具整合到單一平台,可能會重新定義行業標準。VACE能做什麼?它可以從多種輸入生成視頻,例如文字提示、靜態圖像或短視頻片段。除了視頻創作
評論 (6)
0/200
GaryPerez
2025-07-31 09:41:20
Love how AI is making tech more inclusive! These Android and Chrome updates sound amazing—can't wait to see them in action. 🌟
0
EricAllen
2025-05-24 15:29:52
Super impressionnant, ces mises à jour pour l’accessibilité ! 🥳 L’IA qui rend le numérique plus inclusif, c’est génial. Mais j’espère que ça ne va pas trop compliquer les choses pour les non-techies.
0
RichardAdams
2025-05-24 14:31:39
Wow, these AI updates for Android and Chrome sound amazing! 😍 Making tech more inclusive is such a big win. Excited to see how these speech recognition tools evolve!
0
EdwardTaylor
2025-05-22 20:48:34
アクセシビリティの進化、めっちゃ面白いね!😄 AIがもっと身近になって、AndroidやChromeが使いやすくなるなんて最高!開発者向けリソースも気になるな。
0
TimothyTaylor
2025-05-22 20:17:01
Классно, что AI делает технологии доступнее! 😎 Обновления для Android и Chrome – это шаг вперед. Но вот вопрос: не будут ли такие новшества слишком сложными для обычных пользователей?
0
在慶祝全球無障礙意識日之際,我們興奮地宣布對我們的Android和Chrome產品進行重大更新,同時為開發語音識別工具的開發者提供新資源。這些人工智能的進展正使我們的數位世界變得更加無障礙和包容。
Android上的更多AI驅動創新
我們通過將Google AI和Gemini整合到移動體驗的核心,特別是在視覺和聽覺方面,進一步承諾無障礙。
利用Gemini和TalkBack增強細節
去年,我們將Gemini的能力整合到Android的螢幕閱讀器TalkBack中,為沒有替代文字的圖片提供AI生成的描述。現在,我們正在擴展這項功能。用戶現在可以對收到的圖片提問,例如朋友的新吉他。你可以詢問製造商、顏色或照片中的其他元素。此外,你還可以獲取整個螢幕的描述並提問。例如,當你在一個購物應用中瀏覽折扣時,你可以詢問Gemini物品的材質或檢查是否有可用的折扣。
理解字幕背後的情感
透過Expressive Captions,你的Android設備現在可以跨大多數應用程式提供即時字幕,不僅捕捉到說了什麼,還捕捉到如何說。我們增加了一個新的持續時間功能,當詞語被拉長時會強調,例如在體育廣播中聽到「amaaazing shot」,或在視頻消息中聽到「nooooo」。你還會得到更多聲音的標籤,如口哨聲或清喉嚨聲。此更新適用於在美國、英國、加拿大和澳大利亞運行Android 15及以上版本的設備的英語用戶。
全球改善語音識別
自2019年啟動Project Euphonia以來,我們的目標是使語音識別對於具有非標準語音模式的人更加無障礙。我們現在正在全球擴大對開發者和組織的支持,幫助他們將這項技術適應更多語言和文化背景。
新的開發者資源
為了促進全球無障礙工具的生態系統,我們通過Project Euphonia的GitHub頁面向開發者提供開放原始碼存儲庫的訪問權限。這使他們能夠為研究開發個性化的音頻工具,或訓練他們的模型以識別多樣的語音模式。
支持非洲的新項目
今年早些時候,我們與Google.org合作,支持倫敦大學學院成立數位語言包容中心(CDLI)。CDLI專注於增強非英語使用者在非洲的語音識別技術。他們正在創建10種非洲語言的開放原始碼數據集,開發新的語音識別模型,並支持該領域更廣泛的組織和開發者社群。
擴展學生的無障礙選項
無障礙工具對於有障礙的學生起著至關重要的作用,從使用面部手勢來導航Chromebook的Face Control,到使用Reading Mode自定義閱讀體驗。現在,當使用Chromebook與College Board的Bluebook測試應用進行SAT和進階放置考試時,學生將能夠訪問所有Google內建的無障礙功能,包括ChromeVox螢幕閱讀器和聽寫功能,以及College Board自己的數位測試工具。
使Chrome更加無障礙
隨著每天超過20億用戶,我們不斷努力改善Chrome的無障礙功能。像Live Caption和螢幕閱讀器用戶的圖片描述都是這一努力的部分。
在Chrome上更容易訪問PDF
之前,在桌面版Chrome中,掃描的PDF對螢幕閱讀器來說是無法訪問的。現在,透過光學字符識別(OCR),Chrome能夠識別這些PDF,讓你可以高亮、複製、搜尋文字,並使用你的螢幕閱讀器閱讀它們。
透過頁面縮放輕鬆閱讀
Android版Chrome上的頁面縮放現在讓你可以增加文字大小,而不改變網頁佈局或你的瀏覽體驗,類似於桌面版Chrome上的工作方式。你可以設置你的縮放偏好,適用於所有頁面或特定頁面。
要使用此功能,只需點擊Chrome右上角的三點選單並調整你的縮放設置即可。


Love how AI is making tech more inclusive! These Android and Chrome updates sound amazing—can't wait to see them in action. 🌟




Super impressionnant, ces mises à jour pour l’accessibilité ! 🥳 L’IA qui rend le numérique plus inclusif, c’est génial. Mais j’espère que ça ne va pas trop compliquer les choses pour les non-techies.




Wow, these AI updates for Android and Chrome sound amazing! 😍 Making tech more inclusive is such a big win. Excited to see how these speech recognition tools evolve!




アクセシビリティの進化、めっちゃ面白いね!😄 AIがもっと身近になって、AndroidやChromeが使いやすくなるなんて最高!開発者向けリソースも気になるな。




Классно, что AI делает технологии доступнее! 😎 Обновления для Android и Chrome – это шаг вперед. Но вот вопрос: не будут ли такие новшества слишком сложными для обычных пользователей?












