安卓和Chrome的AI及无障碍增强
在全球无障碍意识日之际,我们很高兴宣布我们对Android和Chrome产品的重大更新,同时为致力于语音识别工具开发的开发者提供新的资源。这些人工智能领域的进步正在使我们的数字世界变得更加无障碍和包容。
Android上的更多AI创新
我们通过将Google AI和Gemini融入移动体验,特别是在视觉和听觉方面,进一步加强了我们对无障碍的承诺。
利用Gemini和TalkBack增强细节
去年,我们将Gemini的功能集成到Android的屏幕阅读器TalkBack中,为图像提供了AI生成的描述,即使没有替代文本。现在,我们正在扩展这一功能。用户现在可以对收到的图像提问,比如朋友的新吉他。你可以询问制作、颜色或照片中的其他元素。此外,你还可以获取整个屏幕的描述并提问。例如,在购物应用中浏览促销时,你可以询问Gemini关于某件商品的材质或检查是否有可用的折扣。

理解字幕背后的更多情感
通过表达性字幕,你的Android设备现在可以在大多数应用中提供实时字幕,不仅捕捉所说的话,还捕捉表达方式。我们添加了一个新的持续时间功能,突出显示单词被拉长的时刻,比如在体育广播中听到的“amaaazing shot”,或视频消息中的拖长的“nooooo”。你还会得到更多声音标签,如口哨声或清嗓子声。此更新适用于在美国、英国、加拿大和澳大利亚运行Android 15及以上版本的设备,仅限英语。

全球范围内改进语音识别
自2019年启动Euphonia项目以来,我们的目标是使非标准语音模式的人士更容易使用语音识别。现在,我们正在为全球的开发者和组织提供支持,帮助他们将这项技术适应更多的语言和文化背景。
新的开发者资源
为了培养一个全球性的无障碍工具生态系统,我们通过Euphonia项目的GitHub页面向开发者开放我们的开源存储库。这允许他们开发个性化的音频工具进行研究,或训练他们的模型识别多样化的语音模式。
支持非洲的新项目
今年早些时候,我们与Google.org合作,支持伦敦大学学院建立数字语言包容中心(CDLI)。CDLI专注于为非洲的非英语使用者提升语音识别技术。他们正在创建10种非洲语言的开源数据集,开发新的语音识别模型,并支持该领域的更广泛的组织和开发者社区。
为学生扩展无障碍选项
无障碍工具对有残疾的学生至关重要,从使用面部手势通过面部控制导航Chromebook,到通过阅读模式定制他们的阅读体验。现在,使用Chromebook进行SAT和高级课程考试的学生将可以访问所有Google内置的无障碍功能,包括ChromeVox屏幕阅读器和听写功能,以及大学理事会自己的数字考试工具。
让Chrome更无障碍
随着每天超过20亿的用户,我们不断努力改进Chrome的无障碍功能。实时字幕和为屏幕阅读器用户提供的图像描述都是这项努力的组成部分。
更轻松地访问Chrome上的PDF
以前,扫描的PDF在桌面版Chrome中对屏幕阅读器不友好。现在,通过光学字符识别(OCR),Chrome可以识别这些PDF,允许你高亮、复制、搜索文本,并使用你的屏幕阅读器来阅读它们。
通过页面缩放轻松阅读
Chrome for Android上的页面缩放现在允许你增大文本大小,而不改变网页布局或你的浏览体验,类似于桌面版Chrome的工作方式。你可以设置你的缩放偏好以应用于所有页面或特定页面。

要使用此功能,只需点击Chrome右上角的三点菜单并调整你的缩放设置。
相关文章
Meta 增强人工智能安全,推出高级 Llama 工具
Meta 发布了新的 Llama 安全工具,以加强人工智能开发并防御新兴威胁。这些升级的 Llama 人工智能模型安全工具与 Meta 的新资源相结合,旨在增强网络安全团队利用人工智能进行防御的能力,提升所有人工智能利益相关者的安全性。使用 Llama 模型的开发者现在可以直接在 Meta 的 Llama Protections 页面、Hugging Face 和 GitHub 上访问增强的工具。
NotebookLM推出顶级出版物和专家精选笔记本
谷歌正在增强其人工智能驱动的研究和笔记工具NotebookLM,使其成为一个综合知识中心。周一,该公司推出了一套由知名作者、出版物、研究人员和非营利组织精心策划的笔记本集合,使用户能够探索健康、旅行、财务等多样化主题。首批内容包括《经济学人》、《大西洋月刊》、知名教授、作者以及莎士比亚作品的贡献,展示了NotebookLM在深入主题探索中的实际应用。谷歌解释说,用户可以访问原始资料,提出问题,深入
阿里巴巴发布Wan2.1-VACE:开源AI视频解决方案
阿里巴巴推出了Wan2.1-VACE,这是一个开源AI模型,有望改变视频创作和编辑流程。VACE是阿里巴巴Wan2.1视频AI模型系列的关键组成部分,公司宣称这是“业内首个为多样化视频生成和编辑任务提供全面解决方案的开源模型。”如果阿里巴巴能够简化视频制作流程,将多种工具整合到一个单一平台上,可能会重新定义行业标准。VACE能做什么?它可以从多种输入生成视频,例如文本提示、静态图像或短视频片段。除
评论 (6)
0/200
GaryPerez
2025-07-31 09:41:20
Love how AI is making tech more inclusive! These Android and Chrome updates sound amazing—can't wait to see them in action. 🌟
0
EricAllen
2025-05-24 15:29:52
Super impressionnant, ces mises à jour pour l’accessibilité ! 🥳 L’IA qui rend le numérique plus inclusif, c’est génial. Mais j’espère que ça ne va pas trop compliquer les choses pour les non-techies.
0
RichardAdams
2025-05-24 14:31:39
Wow, these AI updates for Android and Chrome sound amazing! 😍 Making tech more inclusive is such a big win. Excited to see how these speech recognition tools evolve!
0
EdwardTaylor
2025-05-22 20:48:34
アクセシビリティの進化、めっちゃ面白いね!😄 AIがもっと身近になって、AndroidやChromeが使いやすくなるなんて最高!開発者向けリソースも気になるな。
0
TimothyTaylor
2025-05-22 20:17:01
Классно, что AI делает технологии доступнее! 😎 Обновления для Android и Chrome – это шаг вперед. Но вот вопрос: не будут ли такие новшества слишком сложными для обычных пользователей?
0
在全球无障碍意识日之际,我们很高兴宣布我们对Android和Chrome产品的重大更新,同时为致力于语音识别工具开发的开发者提供新的资源。这些人工智能领域的进步正在使我们的数字世界变得更加无障碍和包容。
Android上的更多AI创新
我们通过将Google AI和Gemini融入移动体验,特别是在视觉和听觉方面,进一步加强了我们对无障碍的承诺。
利用Gemini和TalkBack增强细节
去年,我们将Gemini的功能集成到Android的屏幕阅读器TalkBack中,为图像提供了AI生成的描述,即使没有替代文本。现在,我们正在扩展这一功能。用户现在可以对收到的图像提问,比如朋友的新吉他。你可以询问制作、颜色或照片中的其他元素。此外,你还可以获取整个屏幕的描述并提问。例如,在购物应用中浏览促销时,你可以询问Gemini关于某件商品的材质或检查是否有可用的折扣。
理解字幕背后的更多情感
通过表达性字幕,你的Android设备现在可以在大多数应用中提供实时字幕,不仅捕捉所说的话,还捕捉表达方式。我们添加了一个新的持续时间功能,突出显示单词被拉长的时刻,比如在体育广播中听到的“amaaazing shot”,或视频消息中的拖长的“nooooo”。你还会得到更多声音标签,如口哨声或清嗓子声。此更新适用于在美国、英国、加拿大和澳大利亚运行Android 15及以上版本的设备,仅限英语。
全球范围内改进语音识别
自2019年启动Euphonia项目以来,我们的目标是使非标准语音模式的人士更容易使用语音识别。现在,我们正在为全球的开发者和组织提供支持,帮助他们将这项技术适应更多的语言和文化背景。
新的开发者资源
为了培养一个全球性的无障碍工具生态系统,我们通过Euphonia项目的GitHub页面向开发者开放我们的开源存储库。这允许他们开发个性化的音频工具进行研究,或训练他们的模型识别多样化的语音模式。
支持非洲的新项目
今年早些时候,我们与Google.org合作,支持伦敦大学学院建立数字语言包容中心(CDLI)。CDLI专注于为非洲的非英语使用者提升语音识别技术。他们正在创建10种非洲语言的开源数据集,开发新的语音识别模型,并支持该领域的更广泛的组织和开发者社区。
为学生扩展无障碍选项
无障碍工具对有残疾的学生至关重要,从使用面部手势通过面部控制导航Chromebook,到通过阅读模式定制他们的阅读体验。现在,使用Chromebook进行SAT和高级课程考试的学生将可以访问所有Google内置的无障碍功能,包括ChromeVox屏幕阅读器和听写功能,以及大学理事会自己的数字考试工具。
让Chrome更无障碍
随着每天超过20亿的用户,我们不断努力改进Chrome的无障碍功能。实时字幕和为屏幕阅读器用户提供的图像描述都是这项努力的组成部分。
更轻松地访问Chrome上的PDF
以前,扫描的PDF在桌面版Chrome中对屏幕阅读器不友好。现在,通过光学字符识别(OCR),Chrome可以识别这些PDF,允许你高亮、复制、搜索文本,并使用你的屏幕阅读器来阅读它们。
通过页面缩放轻松阅读
Chrome for Android上的页面缩放现在允许你增大文本大小,而不改变网页布局或你的浏览体验,类似于桌面版Chrome的工作方式。你可以设置你的缩放偏好以应用于所有页面或特定页面。
要使用此功能,只需点击Chrome右上角的三点菜单并调整你的缩放设置。


Love how AI is making tech more inclusive! These Android and Chrome updates sound amazing—can't wait to see them in action. 🌟




Super impressionnant, ces mises à jour pour l’accessibilité ! 🥳 L’IA qui rend le numérique plus inclusif, c’est génial. Mais j’espère que ça ne va pas trop compliquer les choses pour les non-techies.




Wow, these AI updates for Android and Chrome sound amazing! 😍 Making tech more inclusive is such a big win. Excited to see how these speech recognition tools evolve!




アクセシビリティの進化、めっちゃ面白いね!😄 AIがもっと身近になって、AndroidやChromeが使いやすくなるなんて最高!開発者向けリソースも気になるな。




Классно, что AI делает технологии доступнее! 😎 Обновления для Android и Chrome – это шаг вперед. Но вот вопрос: не будут ли такие новшества слишком сложными для обычных пользователей?












