谷歌云增强AI媒体工具,新增音乐和视频功能

周三,谷歌公布了其Vertex AI云平台的升级,增强了多个专有媒体生成AI模型。
Lyria,谷歌的文本转音乐AI,现已对部分用户开放预览,而Veo 2视频模型新增了高级编辑和视觉效果选项。此外,谷歌推出了由Chirp 3音频处理模型支持的语音克隆功能,供获批用户使用。据谷歌称,Imagen 3图像生成器的性能现已显著提升。
在Cloud Next上宣布的这些更新加强了谷歌在企业生成式AI市场的领导地位,与亚马逊的Bedrock平台展开激烈竞争,后者提供类似的AI工具。
谷歌将Lyria定位为免版税音乐库的替代品,使用户能够生成从爵士钢琴独奏到低保真节拍等多种风格的歌曲。
Chirp 3支持约35种语言的语音合成。今年早些时候首次预览,它为即时自定义语音功能提供支持,该功能仅需10秒音频即可复制语音,现已广泛可用。Chirp 3还支持新的预览工具——带分割的转录,可在多人录音中区分并标记发言者。
谷歌表示,为防止滥用,即时自定义语音功能需经过验证流程以确保语音使用权限合规。
Veo 2现允许用户移除视频中的背景、标志或物体,并扩展视频框架,例如将横向镜头转换为纵向。它还支持调整AI生成场景的摄像机角度和节奏,创建类似延时摄影或无人机风格的镜头效果,并可在指定的起始和结束框架之间进行插值。
这些Veo 2功能目前处于预览阶段。
谷歌指出,Imagen 3的增强改善了其移除物体和修复缺失或损坏图像区域的能力。
由Imagen、Veo和Lyria(但不包括Chirp)创建的所有媒体均带有谷歌的SynthID水印。谷歌强调,其生成式AI模型包含防止创建有害内容的防护措施。
谷歌未披露其模型的训练数据,这一话题因知识产权问题常引发争议。一些公司未经许可使用受版权保护的材料训练AI,声称受美国公平使用保护,尽管创作者常对此提起诉讼。
谷歌此前向TechCrunch表示,它为模型训练提供退出选项,并提供赔偿政策,以保护谷歌云和Vertex AI用户免受与AI相关的版权索赔。
相关文章
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
YouTube 测试基于人工智能的搜索功能,提供引导式答案
许多用户在搜索食谱或旅行计划时会转向YouTube,寻找相关视频。如今,该平台推出了一款由人工智能驱动的交互式搜索工具,能够提供融合文字和视频内容的分步搜索结果。借助全新的“Ask YouTube”功能,用户可以提出诸如“规划从旧金山到圣巴巴拉的3天自驾游”之类的问题,并获得结合了文字、短视频片段和长视频的分步结果——而非仅显示视频结果。YouTube表示,该功能将展示视频及相关片段,同时提供标题
相关专题推荐
评论 (6)
0/500
Ces outils de génération musicale et vidéo par IA sont fascinants, mais je m'inquiète un peu de l'impact potentiel sur les artistes... Les capacités de Lyria semblent impressionnantes, j'espère qu'il ne s'agira pas juste d'une autre technologie réservée à une élite. 🎵
Wow, Google's Vertex AI upgrades sound wild! Text-to-music with Lyria? I’m curious if it can whip up a catchy tune for my next TikTok. But, man, I hope they’re careful with copyright issues on this stuff. 😎
Wow, Google's Vertex AI upgrades sound like a game-changer for creators! Text-to-music with Lyria? That's like giving my playlists a sci-fi twist. Can't wait to see how this shakes up the content game! 🎶
Lyria sounds like a game-changer for music creation! 🎵 I’m curious if it can nail niche genres like lo-fi jazz. Google’s pushing hard against Amazon’s Bedrock, but I wonder how user-friendly this is for non-techies.
Google's new AI music and video tools sound like a game-changer! I'm stoked to see how Lyria creates tunes from just text prompts. Wonder if it can nail my favorite lo-fi vibes? 😎

周三,谷歌公布了其Vertex AI云平台的升级,增强了多个专有媒体生成AI模型。
Lyria,谷歌的文本转音乐AI,现已对部分用户开放预览,而Veo 2视频模型新增了高级编辑和视觉效果选项。此外,谷歌推出了由Chirp 3音频处理模型支持的语音克隆功能,供获批用户使用。据谷歌称,Imagen 3图像生成器的性能现已显著提升。
在Cloud Next上宣布的这些更新加强了谷歌在企业生成式AI市场的领导地位,与亚马逊的Bedrock平台展开激烈竞争,后者提供类似的AI工具。
谷歌将Lyria定位为免版税音乐库的替代品,使用户能够生成从爵士钢琴独奏到低保真节拍等多种风格的歌曲。
Chirp 3支持约35种语言的语音合成。今年早些时候首次预览,它为即时自定义语音功能提供支持,该功能仅需10秒音频即可复制语音,现已广泛可用。Chirp 3还支持新的预览工具——带分割的转录,可在多人录音中区分并标记发言者。
谷歌表示,为防止滥用,即时自定义语音功能需经过验证流程以确保语音使用权限合规。
Veo 2现允许用户移除视频中的背景、标志或物体,并扩展视频框架,例如将横向镜头转换为纵向。它还支持调整AI生成场景的摄像机角度和节奏,创建类似延时摄影或无人机风格的镜头效果,并可在指定的起始和结束框架之间进行插值。
这些Veo 2功能目前处于预览阶段。
谷歌指出,Imagen 3的增强改善了其移除物体和修复缺失或损坏图像区域的能力。
由Imagen、Veo和Lyria(但不包括Chirp)创建的所有媒体均带有谷歌的SynthID水印。谷歌强调,其生成式AI模型包含防止创建有害内容的防护措施。
谷歌未披露其模型的训练数据,这一话题因知识产权问题常引发争议。一些公司未经许可使用受版权保护的材料训练AI,声称受美国公平使用保护,尽管创作者常对此提起诉讼。
谷歌此前向TechCrunch表示,它为模型训练提供退出选项,并提供赔偿政策,以保护谷歌云和Vertex AI用户免受与AI相关的版权索赔。
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
YouTube 测试基于人工智能的搜索功能,提供引导式答案
许多用户在搜索食谱或旅行计划时会转向YouTube,寻找相关视频。如今,该平台推出了一款由人工智能驱动的交互式搜索工具,能够提供融合文字和视频内容的分步搜索结果。借助全新的“Ask YouTube”功能,用户可以提出诸如“规划从旧金山到圣巴巴拉的3天自驾游”之类的问题,并获得结合了文字、短视频片段和长视频的分步结果——而非仅显示视频结果。YouTube表示,该功能将展示视频及相关片段,同时提供标题
Ces outils de génération musicale et vidéo par IA sont fascinants, mais je m'inquiète un peu de l'impact potentiel sur les artistes... Les capacités de Lyria semblent impressionnantes, j'espère qu'il ne s'agira pas juste d'une autre technologie réservée à une élite. 🎵
Wow, Google's Vertex AI upgrades sound wild! Text-to-music with Lyria? I’m curious if it can whip up a catchy tune for my next TikTok. But, man, I hope they’re careful with copyright issues on this stuff. 😎
Wow, Google's Vertex AI upgrades sound like a game-changer for creators! Text-to-music with Lyria? That's like giving my playlists a sci-fi twist. Can't wait to see how this shakes up the content game! 🎶
Lyria sounds like a game-changer for music creation! 🎵 I’m curious if it can nail niche genres like lo-fi jazz. Google’s pushing hard against Amazon’s Bedrock, but I wonder how user-friendly this is for non-techies.
Google's new AI music and video tools sound like a game-changer! I'm stoked to see how Lyria creates tunes from just text prompts. Wonder if it can nail my favorite lo-fi vibes? 😎





首页






