阿里巴巴发布Wan2.1-VACE:开源AI视频解决方案
阿里巴巴推出了Wan2.1-VACE,这是一个开源AI模型,有望改变视频创作和编辑流程。
VACE是阿里巴巴Wan2.1视频AI模型系列的关键组成部分,公司宣称这是“业内首个为多样化视频生成和编辑任务提供全面解决方案的开源模型。”
如果阿里巴巴能够简化视频制作流程,将多种工具整合到一个单一平台上,可能会重新定义行业标准。
VACE能做什么?它可以从多种输入生成视频,例如文本提示、静态图像或短视频片段。
除了视频创作,其编辑功能包括使用参考图像或帧来引导AI,高级视频“重绘”功能,修改特定视频片段,以及延长视频时长。阿里巴巴表示,这些工具“赋予用户灵活组合任务的能力,提升创作潜力。”

想象一下,基于你提供的照片创建一个包含特定角色的视频。VACE据说可以实现这一点。有一张想让它动起来的静态图像?这个开源AI模型可以为其添加逼真的动态。
为了精准编辑,VACE提供“视频重绘”工具,支持主体之间的姿态转换、详细的运动控制、深度调整和颜色修改。
一个突出功能是其“添加、修改或删除特定视频区域而不影响周围环境”的能力。这是精准编辑的重大突破,确保背景不受影响。它还可以扩展视频画布,用与上下文相关的内容填充新区域,打造更丰富、更沉浸式的效果。
使用VACE,你可以将静态照片转化为视频,通过定义路径控制物体运动,使用参考替换角色或物体,动画化这些参考,或精确控制它们的姿态。
阿里巴巴强调VACE能够将高而窄的图像转换为宽屏视频,通过结合参考图像或提示中的额外元素智能扩展。
VACE的功能由复杂的技术支持,旨在应对视频编辑的复杂性。视频条件单元(VCU)“支持文本、图像、视频和蒙版等多模态输入的统一处理。”
此外,“上下文适配器结构”整合了“时间和空间维度的形式化表示”,使AI对视频中的时间和空间有深入理解。
阿里巴巴设想VACE在社交媒体内容创作、动态广告、影视专业后期制作以及定制教育或培训视频等应用中表现出色。
阿里巴巴将Wan2.1-VACE开源以赋能创作者
开发高级AI模型通常需要大量资源,包括强大的计算能力和数据。阿里巴巴决定将Wan2.1-VACE开源是一个重要举措。
“开放访问降低了门槛,使更多企业能够利用AI高效、经济地创建定制化、高质量的视觉内容,”阿里巴巴指出。
这一举措旨在通过提供无需高成本的尖端AI工具,赋能小型企业和个人创作者,促进更广泛的创新。
阿里巴巴提供了两个版本:一个是适用于高性能系统的140亿参数模型,另一个是适用于较低要求系统的13亿参数轻量模型。两者均可在Hugging Face、GitHub和阿里巴巴云的ModelScope社区免费获取。
另见:美国收紧AI扩散规则,加强芯片出口限制
在阿姆斯特丹、加利福尼亚和伦敦的AI & Big Data Expo上,从行业专家那里了解更多关于AI和大数据的信息。该活动与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举行。
探索TechForge主办的即将举办的企业技术活动和网络研讨会。
相关文章
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
真正的区别:不在于某一点,而在于另一点
有时,事物不仅具有一种属性,还兼具另一种属性。在人工智能生成的文本中,“这不仅是……,更是……”这一句式已变得如此常见,以至于它不再仅仅是合成内容的暗示——几乎可以断定就是如此。正因如此,当我看到《巴伦周刊》的一篇报道,指出这种句式在企业沟通中激增时,我不仅感到好奇——更觉得颇为有趣。该报道不仅评论了这种句式的使用频率,还通过搜索市场情报公司AlphaSense的数据库,量化了其在企业新闻稿、财报
相关专题推荐
评论 (1)
0/500
阿里巴巴推出了Wan2.1-VACE,这是一个开源AI模型,有望改变视频创作和编辑流程。
VACE是阿里巴巴Wan2.1视频AI模型系列的关键组成部分,公司宣称这是“业内首个为多样化视频生成和编辑任务提供全面解决方案的开源模型。”
如果阿里巴巴能够简化视频制作流程,将多种工具整合到一个单一平台上,可能会重新定义行业标准。
VACE能做什么?它可以从多种输入生成视频,例如文本提示、静态图像或短视频片段。
除了视频创作,其编辑功能包括使用参考图像或帧来引导AI,高级视频“重绘”功能,修改特定视频片段,以及延长视频时长。阿里巴巴表示,这些工具“赋予用户灵活组合任务的能力,提升创作潜力。”

想象一下,基于你提供的照片创建一个包含特定角色的视频。VACE据说可以实现这一点。有一张想让它动起来的静态图像?这个开源AI模型可以为其添加逼真的动态。
为了精准编辑,VACE提供“视频重绘”工具,支持主体之间的姿态转换、详细的运动控制、深度调整和颜色修改。
一个突出功能是其“添加、修改或删除特定视频区域而不影响周围环境”的能力。这是精准编辑的重大突破,确保背景不受影响。它还可以扩展视频画布,用与上下文相关的内容填充新区域,打造更丰富、更沉浸式的效果。
使用VACE,你可以将静态照片转化为视频,通过定义路径控制物体运动,使用参考替换角色或物体,动画化这些参考,或精确控制它们的姿态。
阿里巴巴强调VACE能够将高而窄的图像转换为宽屏视频,通过结合参考图像或提示中的额外元素智能扩展。
VACE的功能由复杂的技术支持,旨在应对视频编辑的复杂性。视频条件单元(VCU)“支持文本、图像、视频和蒙版等多模态输入的统一处理。”
此外,“上下文适配器结构”整合了“时间和空间维度的形式化表示”,使AI对视频中的时间和空间有深入理解。
阿里巴巴设想VACE在社交媒体内容创作、动态广告、影视专业后期制作以及定制教育或培训视频等应用中表现出色。
阿里巴巴将Wan2.1-VACE开源以赋能创作者
开发高级AI模型通常需要大量资源,包括强大的计算能力和数据。阿里巴巴决定将Wan2.1-VACE开源是一个重要举措。
“开放访问降低了门槛,使更多企业能够利用AI高效、经济地创建定制化、高质量的视觉内容,”阿里巴巴指出。
这一举措旨在通过提供无需高成本的尖端AI工具,赋能小型企业和个人创作者,促进更广泛的创新。
阿里巴巴提供了两个版本:一个是适用于高性能系统的140亿参数模型,另一个是适用于较低要求系统的13亿参数轻量模型。两者均可在Hugging Face、GitHub和阿里巴巴云的ModelScope社区免费获取。
另见:美国收紧AI扩散规则,加强芯片出口限制
在阿姆斯特丹、加利福尼亚和伦敦的AI & Big Data Expo上,从行业专家那里了解更多关于AI和大数据的信息。该活动与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举行。
探索TechForge主办的即将举办的企业技术活动和网络研讨会。
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
真正的区别:不在于某一点,而在于另一点
有时,事物不仅具有一种属性,还兼具另一种属性。在人工智能生成的文本中,“这不仅是……,更是……”这一句式已变得如此常见,以至于它不再仅仅是合成内容的暗示——几乎可以断定就是如此。正因如此,当我看到《巴伦周刊》的一篇报道,指出这种句式在企业沟通中激增时,我不仅感到好奇——更觉得颇为有趣。该报道不仅评论了这种句式的使用频率,还通过搜索市场情报公司AlphaSense的数据库,量化了其在企业新闻稿、财报





首页






