选项
首页
新闻
阿里巴巴发布Wan2.1-VACE:开源AI视频解决方案

阿里巴巴发布Wan2.1-VACE:开源AI视频解决方案

2025-08-01
83

阿里巴巴推出了Wan2.1-VACE,这是一个开源AI模型,有望改变视频创作和编辑流程。

VACE是阿里巴巴Wan2.1视频AI模型系列的关键组成部分,公司宣称这是“业内首个为多样化视频生成和编辑任务提供全面解决方案的开源模型。”

如果阿里巴巴能够简化视频制作流程,将多种工具整合到一个单一平台上,可能会重新定义行业标准。

VACE能做什么?它可以从多种输入生成视频,例如文本提示、静态图像或短视频片段。

除了视频创作,其编辑功能包括使用参考图像或帧来引导AI,高级视频“重绘”功能,修改特定视频片段,以及延长视频时长。阿里巴巴表示,这些工具“赋予用户灵活组合任务的能力,提升创作潜力。”

想象一下,基于你提供的照片创建一个包含特定角色的视频。VACE据说可以实现这一点。有一张想让它动起来的静态图像?这个开源AI模型可以为其添加逼真的动态。

为了精准编辑,VACE提供“视频重绘”工具,支持主体之间的姿态转换、详细的运动控制、深度调整和颜色修改。

一个突出功能是其“添加、修改或删除特定视频区域而不影响周围环境”的能力。这是精准编辑的重大突破,确保背景不受影响。它还可以扩展视频画布,用与上下文相关的内容填充新区域,打造更丰富、更沉浸式的效果。

使用VACE,你可以将静态照片转化为视频,通过定义路径控制物体运动,使用参考替换角色或物体,动画化这些参考,或精确控制它们的姿态。

阿里巴巴强调VACE能够将高而窄的图像转换为宽屏视频,通过结合参考图像或提示中的额外元素智能扩展。

VACE的功能由复杂的技术支持,旨在应对视频编辑的复杂性。视频条件单元(VCU)“支持文本、图像、视频和蒙版等多模态输入的统一处理。”

此外,“上下文适配器结构”整合了“时间和空间维度的形式化表示”,使AI对视频中的时间和空间有深入理解。

阿里巴巴设想VACE在社交媒体内容创作、动态广告、影视专业后期制作以及定制教育或培训视频等应用中表现出色。

阿里巴巴将Wan2.1-VACE开源以赋能创作者

开发高级AI模型通常需要大量资源,包括强大的计算能力和数据。阿里巴巴决定将Wan2.1-VACE开源是一个重要举措。

“开放访问降低了门槛,使更多企业能够利用AI高效、经济地创建定制化、高质量的视觉内容,”阿里巴巴指出。

这一举措旨在通过提供无需高成本的尖端AI工具,赋能小型企业和个人创作者,促进更广泛的创新。

阿里巴巴提供了两个版本:一个是适用于高性能系统的140亿参数模型,另一个是适用于较低要求系统的13亿参数轻量模型。两者均可在Hugging Face、GitHub和阿里巴巴云的ModelScope社区免费获取。

另见:美国收紧AI扩散规则,加强芯片出口限制

在阿姆斯特丹、加利福尼亚和伦敦的AI & Big Data Expo上,从行业专家那里了解更多关于AI和大数据的信息。该活动与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举行。

探索TechForge主办的即将举办的企业技术活动和网络研讨会。

相关文章
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要 巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要 尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者 YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者 周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
真正的区别:不在于某一点,而在于另一点 真正的区别:不在于某一点,而在于另一点 有时,事物不仅具有一种属性,还兼具另一种属性。在人工智能生成的文本中,“这不仅是……,更是……”这一句式已变得如此常见,以至于它不再仅仅是合成内容的暗示——几乎可以断定就是如此。正因如此,当我看到《巴伦周刊》的一篇报道,指出这种句式在企业沟通中激增时,我不仅感到好奇——更觉得颇为有趣。该报道不仅评论了这种句式的使用频率,还通过搜索市场情报公司AlphaSense的数据库,量化了其在企业新闻稿、财报
相关专题推荐
写作 最佳AI仙侠与武侠助手:创作史诗般的修仙历程与武打场面
最佳AI仙侠与武侠助手:创作史诗般的修仙历程与武打场面

探索2026年最优秀的AI助手,助您创作史诗级的仙侠与武侠故事。XIX.AI精心整理的这份清单汇集了广受好评、能彻底改变创作格局的工具,助您驾驭修仙进阶与武术动作设计。通过实际测试对比免费与付费选项。释放您的创作潜能,今天就开始写作吧!

10 个工具
xix.ai
代码 AI移动应用开发工具:根据提示生成跨平台的Flutter与React Native代码
AI移动应用开发工具:根据提示生成跨平台的Flutter与React Native代码

探索2026年最适合Flutter和React Native的最佳AI移动应用开发工具。我们精心挑选的这些高评分工具能够提供强大的功能,帮助您根据提示生成跨平台代码。通过实际测试来对比免费选项和付费选项,让开发更加高效,从而打造出更出色的应用程序。现在就访问XIX.AI查看排名吧!

10 个工具
xix.ai
代码 最佳 AI Chrome 扩展程序生成工具:无需编程经验即可创建自定义浏览器插件
最佳 AI Chrome 扩展程序生成工具:无需编程经验即可创建自定义浏览器插件

在 XIX.AI 上探索 2026 年最佳 AI Chrome 扩展程序生成器。我们精心挑选的这份清单汇集了广受好评、不容错过的工具,让您无需编写代码即可创建自定义浏览器插件。对比免费与付费选项,查看实际测试结果,并释放您的工作效率。立即查看最新排行榜,找到最适合您的工具!

10 个工具
xix.ai
文字转语音 最佳人工智能多语言文本转语音技术:能够生成50多种语言的逼真原声发音
最佳人工智能多语言文本转语音技术:能够生成50多种语言的逼真原声发音

探索2026年最优秀的人工智能多语言文本转语音工具,这些工具能够生成50多种语言中具有真实母语口音的语音。查看我们精心挑选的排名榜单,了解免费版本与付费版本的差异,并通过实际测试来验证它们的效果。在XIX.AI上找到最适合你的语音工具,立即开启全球交流的新篇章吧。

10 个工具
xix.ai
会议助理 最适合提升协作效率的最佳人工智能会议自动化工具
最适合提升协作效率的最佳人工智能会议自动化工具

探索2026年最新评选出的顶级AI会议自动化工具,让协作变得更智能、更高效。我们精心挑选的这些工具能够有效实现笔记、总结和待办事项的自动化处理。通过实际测试和每周更新的排名,您可以了解免费选项与付费选项的差异。立即访问XIX.AI,发现最适合您需求的工具,提升团队生产力吧。

10 个工具
xix.ai
提示词 适用于基础设施即代码的 AI 提示:安全部署 Terraform 和 Docker 配置
适用于基础设施即代码的 AI 提示:安全部署 Terraform 和 Docker 配置

探索 2026 年最新、评价最高的“基础设施即代码”(Infrastructure-as-Code)AI 提示词。XIX.AI 精心挑选的提示词集可助您安全部署 Terraform 和 Docker 配置、自动化云环境搭建,并提升 DevOps 工作效率。通过实际测试对比免费与付费选项。立即探索,释放您的 AI 优势。

10 个工具
xix.ai
评论 (1)
0/500
BruceBrown
BruceBrown 2025-08-08 17:00:59

This open-source video AI from Alibaba sounds like a game-changer! I'm curious if it can really outdo Sora in quality, but free access is a huge win for creators. 🎥 Anyone tried it yet?

OR