阿里巴巴发布Wan2.1-VACE:开源AI视频解决方案
阿里巴巴推出了Wan2.1-VACE,这是一个开源AI模型,有望改变视频创作和编辑流程。
VACE是阿里巴巴Wan2.1视频AI模型系列的关键组成部分,公司宣称这是“业内首个为多样化视频生成和编辑任务提供全面解决方案的开源模型。”
如果阿里巴巴能够简化视频制作流程,将多种工具整合到一个单一平台上,可能会重新定义行业标准。
VACE能做什么?它可以从多种输入生成视频,例如文本提示、静态图像或短视频片段。
除了视频创作,其编辑功能包括使用参考图像或帧来引导AI,高级视频“重绘”功能,修改特定视频片段,以及延长视频时长。阿里巴巴表示,这些工具“赋予用户灵活组合任务的能力,提升创作潜力。”

想象一下,基于你提供的照片创建一个包含特定角色的视频。VACE据说可以实现这一点。有一张想让它动起来的静态图像?这个开源AI模型可以为其添加逼真的动态。
为了精准编辑,VACE提供“视频重绘”工具,支持主体之间的姿态转换、详细的运动控制、深度调整和颜色修改。
一个突出功能是其“添加、修改或删除特定视频区域而不影响周围环境”的能力。这是精准编辑的重大突破,确保背景不受影响。它还可以扩展视频画布,用与上下文相关的内容填充新区域,打造更丰富、更沉浸式的效果。
使用VACE,你可以将静态照片转化为视频,通过定义路径控制物体运动,使用参考替换角色或物体,动画化这些参考,或精确控制它们的姿态。
阿里巴巴强调VACE能够将高而窄的图像转换为宽屏视频,通过结合参考图像或提示中的额外元素智能扩展。
VACE的功能由复杂的技术支持,旨在应对视频编辑的复杂性。视频条件单元(VCU)“支持文本、图像、视频和蒙版等多模态输入的统一处理。”
此外,“上下文适配器结构”整合了“时间和空间维度的形式化表示”,使AI对视频中的时间和空间有深入理解。
阿里巴巴设想VACE在社交媒体内容创作、动态广告、影视专业后期制作以及定制教育或培训视频等应用中表现出色。
阿里巴巴将Wan2.1-VACE开源以赋能创作者
开发高级AI模型通常需要大量资源,包括强大的计算能力和数据。阿里巴巴决定将Wan2.1-VACE开源是一个重要举措。
“开放访问降低了门槛,使更多企业能够利用AI高效、经济地创建定制化、高质量的视觉内容,”阿里巴巴指出。
这一举措旨在通过提供无需高成本的尖端AI工具,赋能小型企业和个人创作者,促进更广泛的创新。
阿里巴巴提供了两个版本:一个是适用于高性能系统的140亿参数模型,另一个是适用于较低要求系统的13亿参数轻量模型。两者均可在Hugging Face、GitHub和阿里巴巴云的ModelScope社区免费获取。
另见:美国收紧AI扩散规则,加强芯片出口限制
在阿姆斯特丹、加利福尼亚和伦敦的AI & Big Data Expo上,从行业专家那里了解更多关于AI和大数据的信息。该活动与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举行。
探索TechForge主办的即将举办的企业技术活动和网络研讨会。
相关文章
IBM Power11 提升企业AI,保障不间断性能
IBM的Power11企业服务器解决企业计算关键问题:在部署AI工作负载的同时,保持关键任务应用所需的高可靠性。2025年7月8日发布,Power11凸显IBM对统一解决方案的关注,摆脱许多组织目前面临的专用AI硬件与传统服务器的碎片化组合。核心创新揭晓Power11服务器确保企业无停机时间,具备惊人的“99.9999%正常运行时间”,相当于每年不到32秒的意外停机。IBM称其为“Power平台历
AI驱动的零售实验在Anthropic惨败
想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:
释放你的艺术潜力以先进的生成媒体工具
我们很高兴推出我们最新的生成媒体模型,带来突破性的进步。这些模型生成令人惊叹的图片、视频和音乐,使艺术家能够将他们的创意想法转化为现实。它们还为每个人提供创新工具,以表达他们独特的愿景。Veo 3 和 Imagen 4,我们尖端的视频和图像生成模型,以其革命性的功能重新定义了媒体创作。我们还在扩大对 Lyria 2 的访问权限,为音乐家提供增强的音乐创作工具。此外,我们邀请视觉故事讲述者探索 Fl
评论 (0)
0/200
阿里巴巴推出了Wan2.1-VACE,这是一个开源AI模型,有望改变视频创作和编辑流程。
VACE是阿里巴巴Wan2.1视频AI模型系列的关键组成部分,公司宣称这是“业内首个为多样化视频生成和编辑任务提供全面解决方案的开源模型。”
如果阿里巴巴能够简化视频制作流程,将多种工具整合到一个单一平台上,可能会重新定义行业标准。
VACE能做什么?它可以从多种输入生成视频,例如文本提示、静态图像或短视频片段。
除了视频创作,其编辑功能包括使用参考图像或帧来引导AI,高级视频“重绘”功能,修改特定视频片段,以及延长视频时长。阿里巴巴表示,这些工具“赋予用户灵活组合任务的能力,提升创作潜力。”

想象一下,基于你提供的照片创建一个包含特定角色的视频。VACE据说可以实现这一点。有一张想让它动起来的静态图像?这个开源AI模型可以为其添加逼真的动态。
为了精准编辑,VACE提供“视频重绘”工具,支持主体之间的姿态转换、详细的运动控制、深度调整和颜色修改。
一个突出功能是其“添加、修改或删除特定视频区域而不影响周围环境”的能力。这是精准编辑的重大突破,确保背景不受影响。它还可以扩展视频画布,用与上下文相关的内容填充新区域,打造更丰富、更沉浸式的效果。
使用VACE,你可以将静态照片转化为视频,通过定义路径控制物体运动,使用参考替换角色或物体,动画化这些参考,或精确控制它们的姿态。
阿里巴巴强调VACE能够将高而窄的图像转换为宽屏视频,通过结合参考图像或提示中的额外元素智能扩展。
VACE的功能由复杂的技术支持,旨在应对视频编辑的复杂性。视频条件单元(VCU)“支持文本、图像、视频和蒙版等多模态输入的统一处理。”
此外,“上下文适配器结构”整合了“时间和空间维度的形式化表示”,使AI对视频中的时间和空间有深入理解。
阿里巴巴设想VACE在社交媒体内容创作、动态广告、影视专业后期制作以及定制教育或培训视频等应用中表现出色。
阿里巴巴将Wan2.1-VACE开源以赋能创作者
开发高级AI模型通常需要大量资源,包括强大的计算能力和数据。阿里巴巴决定将Wan2.1-VACE开源是一个重要举措。
“开放访问降低了门槛,使更多企业能够利用AI高效、经济地创建定制化、高质量的视觉内容,”阿里巴巴指出。
这一举措旨在通过提供无需高成本的尖端AI工具,赋能小型企业和个人创作者,促进更广泛的创新。
阿里巴巴提供了两个版本:一个是适用于高性能系统的140亿参数模型,另一个是适用于较低要求系统的13亿参数轻量模型。两者均可在Hugging Face、GitHub和阿里巴巴云的ModelScope社区免费获取。
另见:美国收紧AI扩散规则,加强芯片出口限制
在阿姆斯特丹、加利福尼亚和伦敦的AI & Big Data Expo上,从行业专家那里了解更多关于AI和大数据的信息。该活动与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举行。
探索TechForge主办的即将举办的企业技术活动和网络研讨会。












