谷歌双子座推出文档朗读功能
谷歌文档(Google Docs)推出了一项创新的人工智能文本到语音(text-to-speech)功能,可将书面文档转化为可定制的音频体验。新发布的功能允许用户从文本内容中生成声音自然的配音,并可调整声音和播放速度。
创建者和协作者都可以使用这种音频转换功能,它显示在共享文档中的 "工具">"音频">"收听 "选项卡下。作者还可以通过 "插入">"音频 "直接在文件中嵌入专用音频播放器,进一步提高文件的可访问性,为读者提供一键收听的便利。

虽然谷歌最初在四月份预览了文档到播客的转换功能,但目前的实施重点是实用的按需收听体验。该功能目前仅限于桌面平台上的英文文档,代表了谷歌对人工智能驱动的生产力工具的持续投资。
音频生成功能目前正在向使用商业、企业或教育计划的 Workspace 用户,以及持有 AI 专业版和超级版的个人用户推出。这一推出策略将该功能定位为专业和教育用户的高级增强功能,他们可以从多模式文档交互中获益最多。
值得注意的是,这项开发将 Google Docs 转变为一个功能更全面的书面内容消费平台,尤其使以下用户受益匪浅:
- 需要在多任务处理的同时审阅文档的繁忙专业人士
- 通过听觉输入理解能力更强的视觉学习者
- 视觉障碍读者的无障碍使用案例
- 提高发音和听力技能的语言学习者
继 "Help Me Write "等其他人工智能功能成功整合之后,此次实施表明谷歌的战略重点是将人工智能生成功能直接整合到核心生产力工作流程中。随着技术的成熟,用户可以期待在未来的更新中将其扩展到更多的语言和移动平台。
相关文章
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
相关专题推荐
评论 (0)
0/500
谷歌文档(Google Docs)推出了一项创新的人工智能文本到语音(text-to-speech)功能,可将书面文档转化为可定制的音频体验。新发布的功能允许用户从文本内容中生成声音自然的配音,并可调整声音和播放速度。
创建者和协作者都可以使用这种音频转换功能,它显示在共享文档中的 "工具">"音频">"收听 "选项卡下。作者还可以通过 "插入">"音频 "直接在文件中嵌入专用音频播放器,进一步提高文件的可访问性,为读者提供一键收听的便利。

虽然谷歌最初在四月份预览了文档到播客的转换功能,但目前的实施重点是实用的按需收听体验。该功能目前仅限于桌面平台上的英文文档,代表了谷歌对人工智能驱动的生产力工具的持续投资。
音频生成功能目前正在向使用商业、企业或教育计划的 Workspace 用户,以及持有 AI 专业版和超级版的个人用户推出。这一推出策略将该功能定位为专业和教育用户的高级增强功能,他们可以从多模式文档交互中获益最多。
值得注意的是,这项开发将 Google Docs 转变为一个功能更全面的书面内容消费平台,尤其使以下用户受益匪浅:
- 需要在多任务处理的同时审阅文档的繁忙专业人士
- 通过听觉输入理解能力更强的视觉学习者
- 视觉障碍读者的无障碍使用案例
- 提高发音和听力技能的语言学习者
继 "Help Me Write "等其他人工智能功能成功整合之后,此次实施表明谷歌的战略重点是将人工智能生成功能直接整合到核心生产力工作流程中。随着技术的成熟,用户可以期待在未来的更新中将其扩展到更多的语言和移动平台。
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟





首页






