选项
首页
新闻
安卓和Chrome的AI及无障碍增强

安卓和Chrome的AI及无障碍增强

2025-05-22
92

在我们庆祝全球无障碍意识日之际,我们兴奋地宣布对Android和Chrome产品的重大更新,同时为开发语音识别工具的开发者提供新资源。这些人工智能的进步使我们的数字世界更加无障碍和包容。

Android带来更多人工智能驱动的创新

我们通过将Google AI和Gemini融入移动体验的结构中,进一步深化了对无障碍的承诺,特别是在视觉和听觉方面。

通过Gemini和TalkBack增强细节

去年,我们将Gemini的功能集成到Android的屏幕阅读器TalkBack中,即使缺少替代文本,也能提供人工智能生成的图片描述。现在,我们正在扩展这一功能。用户现在可以询问收到的图片相关问题,例如朋友的新吉他。你可以询问吉他的品牌、颜色或照片中的其他元素。此外,你还可以获取整个屏幕的描述并提出问题。例如,在购物应用上浏览促销时,你可以询问Gemini关于商品材质的信息或检查是否有折扣。

使用TalkBack的Gemini驱动功能获取屏幕上内容的描述。

理解字幕背后的更多情感

通过表情字幕,你的Android设备现在可以在大多数应用中提供实时字幕,不仅捕捉所说内容,还捕捉说话的方式。我们添加了一个新的持续时间功能,突出显示单词被拉长的情况,例如在体育直播中听到“太棒的射门”或视频消息中拉长的“不”。你还会获得更多声音标签,例如口哨或清喉咙。这一更新适用于在美国、英国、加拿大和澳大利亚运行Android 15及以上版本的设备的英语版本。

通过表情字幕的新持续时间功能,获取手机上音频和视频内容的更多上下文。

改善全球语音识别

自2019年启动Euphonia项目以来,我们的目标是使语音识别对非标准语音模式的用户更加无障碍。我们现在正在扩展对全球开发者和组织的支持,帮助他们将这项技术适配到更多语言和文化背景中。

新开发者资源

为了促进全球无障碍工具生态系统的发展,我们通过Euphonia项目的GitHub页面为开发者提供开源存储库的访问权限。这使他们能够为研究开发个性化音频工具或训练模型以识别多样化的语音模式。

支持非洲新项目

今年早些时候,我们与Google.org合作,支持伦敦大学学院建立数字语言包容中心(CDLI)。CDLI专注于增强非英语使用者的语音识别技术。他们正在创建10种非洲语言的开源数据集,开发新的语音识别模型,并支持该领域的更广泛的组织和开发者社区。

为学生扩展无障碍选项

无障碍工具对残疾学生至关重要,从使用面部手势通过Face Control导航Chromebook到使用阅读模式自定义阅读体验。现在,在使用Chromebook上的College Board Bluebook测试应用进行SAT和高级 placement考试时,学生将能够访问Google的所有内置无障碍功能,包括ChromeVox屏幕阅读器和语音输入,以及College Board自己的数字测试工具。

使Chrome更加无障碍

拥有超过20亿日活跃用户,我们不断努力改善Chrome的无障碍性。实时字幕和屏幕阅读器用户的图片描述等功能是这一努力的一部分。

在Chrome上更轻松访问PDF

之前,桌面版Chrome中的扫描PDF对屏幕阅读器不可访问。现在,通过光学字符识别(OCR),Chrome可以识别这些PDF,允许你高亮、复制、搜索文本,并使用屏幕阅读器阅读它们。

通过页面缩放轻松阅读

Android版Chrome的页面缩放现在允许你增大文本大小,而不改变网页布局或浏览体验,类似于桌面版Chrome的运作方式。你可以设置缩放偏好,应用于所有页面或特定页面。

页面缩放适用于Android版Chrome,让你自定义页面显示方式。

要使用此功能,只需点击Chrome右上角的三点菜单并调整缩放设置。

相关文章
YouTube 将 Veo 3 人工智能视频工具直接整合到短片平台中 YouTube 将 Veo 3 人工智能视频工具直接整合到短片平台中 今年夏天,YouTube 短片将采用 Veo 3 人工智能视频模式YouTube 首席执行官尼尔-莫汉(Neal Mohan)在戛纳国际电影节主题演讲中透露,该平台最先进的 Veo 3 人工智能视频生成技术将于今年夏天晚些时候在 YouTube Shorts 上首次亮相。此前,艾利森-约翰逊(Allison Johnson)在评论中将 Veo 3 描述为人工智能辅助内容创作的革命。目前,短片创作者
谷歌云为科学研究和发现的突破提供动力 谷歌云为科学研究和发现的突破提供动力 数字革命正在通过前所未有的计算能力改变科学方法。现在,尖端技术增强了理论框架和实验室实验,通过复杂的模拟和大数据分析推动了各学科的突破。通过对基础研究、可扩展云架构和人工智能开发的战略性投资,我们建立了一个加速科学进步的生态系统。我们在制药研究、气候建模和纳米技术等领域做出了突破性创新,并辅之以世界一流的计算基础设施、云原生软件解决方案和新一代生成式人工智能平台。谷歌 DeepMind 的研究实力
埃隆-马斯克的 Grok 人工智能在处理复杂问题之前会征求主人的意见 埃隆-马斯克的 Grok 人工智能在处理复杂问题之前会征求主人的意见 最近发布的由埃隆-马斯克(Elon Musk)宣传为 "最大限度寻求真相 "系统的Grok人工智能,因其在回应政治敏感话题前倾向于参考马斯克的公开声明而备受关注。观察家们注意到,在讨论以色列-巴勒斯坦冲突、美国移民政策或堕胎辩论等有争议的问题时,聊天机器人似乎会优先考虑与马斯克记录在案的观点保持一致。Grok的决策过程数据科学家杰里米-霍华德(Jeremy Howard)通过屏幕录音记录了这
评论 (9)
0/200
DonaldRoberts
DonaldRoberts 2025-08-26 11:01:14

Wow, these AI updates for Android and Chrome sound like a game-changer for accessibility! I'm curious how the speech recognition tools will evolve—could they finally keep up with my fast-talking friends? 😄

OliverAnderson
OliverAnderson 2025-08-22 17:01:17

Wow, these AI updates for Android and Chrome sound like a game-changer for accessibility! 🥳 Curious how the speech recognition tools will evolve—hope they’re as intuitive as they claim!

AndrewAllen
AndrewAllen 2025-08-11 11:01:00

C'est génial de voir des progrès en accessibilité ! Les mises à jour pour Android et Chrome vont vraiment aider plus de monde à naviguer facilement. Mais, est-ce que ces outils seront assez intuitifs pour les novices ? 😊 J’espère qu’on verra plus d’innovations comme ça !

GaryPerez
GaryPerez 2025-07-31 09:41:20

Love how AI is making tech more inclusive! These Android and Chrome updates sound amazing—can't wait to see them in action. 🌟

EricAllen
EricAllen 2025-05-24 15:29:52

Super impressionnant, ces mises à jour pour l’accessibilité ! 🥳 L’IA qui rend le numérique plus inclusif, c’est génial. Mais j’espère que ça ne va pas trop compliquer les choses pour les non-techies.

RichardAdams
RichardAdams 2025-05-24 14:31:39

Wow, these AI updates for Android and Chrome sound amazing! 😍 Making tech more inclusive is such a big win. Excited to see how these speech recognition tools evolve!

返回顶部
OR