释放你的艺术潜力以先进的生成媒体工具

我们很高兴推出我们最新的生成媒体模型,带来突破性的进步。这些模型生成令人惊叹的图片、视频和音乐,使艺术家能够将他们的创意想法转化为现实。它们还为每个人提供创新工具,以表达他们独特的愿景。
Veo 3 和 Imagen 4,我们尖端的视频和图像生成模型,以其革命性的功能重新定义了媒体创作。我们还在扩大对 Lyria 2 的访问权限,为音乐家提供增强的音乐创作工具。此外,我们邀请视觉故事讲述者探索 Flow,我们新的 AI 驱动的电影制作工具。利用 Google DeepMind 的最先进模型,Flow 使你能够精确控制角色、场景和风格,创作电影般的影片,将你的叙事带入生活。
我们与创意产业——电影制作人、音乐家、艺术家和 YouTube 创作者——密切合作,负责任地开发这些模型和工具,赋予创作者在工作中利用 AI 的潜力。
Veo 3:通过音频整合提升视频
Veo 3,我们最先进的视频生成模型,超越了 Veo 2 的质量,并首次引入了音频生成——捕捉城市交通、公园鸟鸣或角色对话等环境声音。
Veo 3 在文本和图像提示、现实世界的物理效果以及精确的唇部同步方面表现出色。在你的提示中描述一个短篇故事,Veo 3 将生成一个生动的片段,让它栩栩如生。今天起在美国通过 Gemini 应用和 Flow 为 Ultra 订阅者提供,以及在 Vertex AI 上为企业用户提供。
Veo 2 增强功能:为电影制作人量身定制的功能
根据创作者和电影制作人的反馈,我们增强了广受欢迎的 Veo 2 模型,新增功能包括:
- 先进的参考视频功能,让你提供角色、场景、物体或风格的图像,以获得更大的创意控制和一致性。
- 相机控制功能支持精确的移动,如旋转、推拉和缩放,以获得完美的镜头。
- 外延画扩展你的画面,智能地将视频从纵向无缝转换为横向,添加场景内容。
- 物体添加和移除功能允许你在视频中插入或擦除元素,Veo 确保自然的比例、交互和阴影。
参考视频和相机控制功能现已在 Flow 中提供。这些功能将在未来几周内推广到 Vertex AI API,并在未来几个月内扩展到其他产品。
https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Veo2-CameraControls-Keyword-250519-r03.mp4 "],"alt": "Veo 2 相机控制","isVideo": true,"videoTitle": "veo2controls"},{"src": [" https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/comp_wm_us_genmedia_keyword_refernce2video_cap-000000-final.mp4 "],"alt": "使用 Veo2 制作的女子在走廊行走的视频","isVideo": true,"videoTitle": "veo2"},{"src": [" https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/us_wm_961d999b-860d-45d1-b9bd-6ca3ae960e9b_8fb2c1bc-fa94-433f-9426-96db830ca5c0.webm "],"alt": "由 Veo 制作的编织场景","isVideo": true,"videoTitle": "Knit veo"},{"src": [" https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/us_wm_e36d3cd7-863b-4e52-aba1-966dbd062da0_36176986-0863-4322-a518-41d4251c66d1_.mp4 "],"alt": "由 Veo 制作的编织场景","isVideo": true,"videoTitle": "Outpainting"},{"src": [" https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/us_wm_veo_2_792c9917-dcad-4272-bf7d-1ccf7ce1081d_bab3dce1-35d4-4c3d-b0f4-c6e819.webm "],"alt": "使用 Veo 制作的宇航员场景","isVideo": true,"videoTitle": "outer space"},{"src": [" https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/us_wm_2b963087-a227-4984-b333-88eabb35553e_a46aa06d-c14f-4c85-a428-05332_QgLmCGP.mp4 "],"alt": "使用 Veo 制作的宇航员场景","isVideo": true,"videoTitle": "Image removal"}]'>原始
外延画
原始
移除飞船
Flow:为创意人士打造的 AI 驱动电影制作
专为创意人士设计,Flow 是一款 AI 电影制作工具,无缝整合了 Google DeepMind 的先进模型——Veo、Imagen 和 Gemini——以创建电影般的片段、场景和故事。使用自然语言描述你的镜头,在一个地方管理演员、地点、物体和风格,让 Flow 将你的叙事转化为引人入胜的场景。
Flow 现已在美国为 Google AI Pro 和 Ultra 计划订阅者提供,将很快扩展到更多国家。
" aria-label="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/Flow_Sizzle_Thumbnail_1280_x_720_.width-100.format-webp.webp"video-image-url-mobile="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/Flow_Sizzle_Thumbnail_1280_x_720_.width-700.format-webp.webp"video-image-url-desktop="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/Flow_Sizzle_Thumbnail_1280_x_720.width-1000.format-webp.webp">">https://storage.googleapis.com/gweb-uniblog-publish-prod/images/Flow_Sizzle_Thumbnail_1280_x_720_.width-100.format-webp.webp"video-image-url-mobile="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/Flow_Sizzle_Thumbnail_1280_x_720_.width-700.format-webp.webp"video-image-url-desktop="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/Flow_Sizzle_Thumbnail_1280_x_720.width-1000.format-webp.webp">Imagen 4:卓越的清晰度和排版
我们最新的 Imagen 模型提供无与伦比的精度和速度,创造出令人叹为观止的图像,细节生动,如复杂织物、水滴和动物毛皮。Imagen 4 在写实和抽象风格中表现出色,支持多种纵横比,提供高达 2k 分辨率——非常适合打印或演示。它还增强了拼写和排版,简化了贺卡、海报和漫画的创作。
https://storage.googleapis.com/gweb-uniblog-publish-prod/images/wm_us_extra_batch_16_05_2015_.max-1536x1536.format-webp.webp","https://storage.googleapis.com/gweb-uniblog-publish-prod/images/wm_us_extra_batch_16_05_2015_.max-1536x1536.format-webp.webp"],"alt": "由 Imagen 4 创建的鲸鱼图像","isVideo": false,"videoTitle": ""},{"src": ["https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_0_ComicCrocodile.max-1536x1536.format-webp.webp","https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_0_ComicCrocodile.max-1536x1536.format-webp.webp"],"alt": "由 Imagen 4 创建的漫画条","isVideo": false,"videoTitle": ""},{"src": ["https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_47.max-1536x1536.format-webp.webp","https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_47.max-1536x1536.format-webp.webp"],"alt": "由 Imagen 4 创建的图形","isVideo": false,"videoTitle": ""},{"src": ["https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_14.max-1536x1536.format-webp.webp","https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_14.max-1536x1536.format-webp.webp"],"alt": "由 Imagen 4 创建的狗图像","isVideo": false,"videoTitle": ""},{"src": ["https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_79.max-1536x1536.format-webp.webp","https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_79.max-1536x1536.format-webp.webp"],"alt": "由 Imagen 4 创建的女子图像","isVideo": false,"videoTitle": ""},{"src": ["https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_44.max-1536x1536.format-webp.webp","https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_44.max-1536x1536.format-webp.webp"],"alt": "由 Imagen 4 创建的湖泊画作","isVideo": false,"videoTitle": ""},{"src": ["https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_57.max-1536x1536.format-webp.webp","https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_57.max-1536x1536.format-webp.webp"],"alt": "由 Imagen 4 创建的田野照片","isVideo": false,"videoTitle": ""},{"src": ["https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_7_Eggs.max-1536x1536.format-webp.webp","https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WM_7_Eggs.max-1536x1536.format-webp.webp"],"alt": "由 Imagen 4 创建的蛋盒照片","isVideo": false,"videoTitle": ""}]'>
相关文章
IBM Power11 提升企业AI,保障不间断性能
IBM的Power11企业服务器解决企业计算关键问题:在部署AI工作负载的同时,保持关键任务应用所需的高可靠性。2025年7月8日发布,Power11凸显IBM对统一解决方案的关注,摆脱许多组织目前面临的专用AI硬件与传统服务器的碎片化组合。核心创新揭晓Power11服务器确保企业无停机时间,具备惊人的“99.9999%正常运行时间”,相当于每年不到32秒的意外停机。IBM称其为“Power平台历
AI驱动的零售实验在Anthropic惨败
想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:
新图像库添加到ChatGPT以便轻松访问AI生成艺术
OpenAI为ChatGPT引入了图像库功能,简化了对AI生成图像的访问,公司今日透露。此更新现已对移动和网页平台上的所有免费、Plus和Pro用户可用。在一段简短的视频中,OpenAI展示了该功能。从ChatGPT侧边栏中,可以访问一个新的“库”部分。点击它会显示一个此前创建图像的网格。视频还突出显示了屏幕底部的生成新图像按钮。该库已在ChatGPT iOS应用中运行,如OpenAI视频中所示。
评论 (0)
0/200
我们很高兴推出我们最新的生成媒体模型,带来突破性的进步。这些模型生成令人惊叹的图片、视频和音乐,使艺术家能够将他们的创意想法转化为现实。它们还为每个人提供创新工具,以表达他们独特的愿景。
Veo 3 和 Imagen 4,我们尖端的视频和图像生成模型,以其革命性的功能重新定义了媒体创作。我们还在扩大对 Lyria 2 的访问权限,为音乐家提供增强的音乐创作工具。此外,我们邀请视觉故事讲述者探索 Flow,我们新的 AI 驱动的电影制作工具。利用 Google DeepMind 的最先进模型,Flow 使你能够精确控制角色、场景和风格,创作电影般的影片,将你的叙事带入生活。
我们与创意产业——电影制作人、音乐家、艺术家和 YouTube 创作者——密切合作,负责任地开发这些模型和工具,赋予创作者在工作中利用 AI 的潜力。
Veo 3:通过音频整合提升视频
Veo 3,我们最先进的视频生成模型,超越了 Veo 2 的质量,并首次引入了音频生成——捕捉城市交通、公园鸟鸣或角色对话等环境声音。
Veo 3 在文本和图像提示、现实世界的物理效果以及精确的唇部同步方面表现出色。在你的提示中描述一个短篇故事,Veo 3 将生成一个生动的片段,让它栩栩如生。今天起在美国通过 Gemini 应用和 Flow 为 Ultra 订阅者提供,以及在 Vertex AI 上为企业用户提供。
Veo 2 增强功能:为电影制作人量身定制的功能
根据创作者和电影制作人的反馈,我们增强了广受欢迎的 Veo 2 模型,新增功能包括:
- 先进的参考视频功能,让你提供角色、场景、物体或风格的图像,以获得更大的创意控制和一致性。
- 相机控制功能支持精确的移动,如旋转、推拉和缩放,以获得完美的镜头。
- 外延画扩展你的画面,智能地将视频从纵向无缝转换为横向,添加场景内容。
- 物体添加和移除功能允许你在视频中插入或擦除元素,Veo 确保自然的比例、交互和阴影。
参考视频和相机控制功能现已在 Flow 中提供。这些功能将在未来几周内推广到 Vertex AI API,并在未来几个月内扩展到其他产品。
原始
外延画
原始
移除飞船
Flow:为创意人士打造的 AI 驱动电影制作
专为创意人士设计,Flow 是一款 AI 电影制作工具,无缝整合了 Google DeepMind 的先进模型——Veo、Imagen 和 Gemini——以创建电影般的片段、场景和故事。使用自然语言描述你的镜头,在一个地方管理演员、地点、物体和风格,让 Flow 将你的叙事转化为引人入胜的场景。
Flow 现已在美国为 Google AI Pro 和 Ultra 计划订阅者提供,将很快扩展到更多国家。
Imagen 4:卓越的清晰度和排版
我们最新的 Imagen 模型提供无与伦比的精度和速度,创造出令人叹为观止的图像,细节生动,如复杂织物、水滴和动物毛皮。Imagen 4 在写实和抽象风格中表现出色,支持多种纵横比,提供高达 2k 分辨率——非常适合打印或演示。它还增强了拼写和排版,简化了贺卡、海报和漫画的创作。












