阿里巴巴推出Wan2.1-VACE:開源AI視頻解決方案
阿里巴巴推出了Wan2.1-VACE,一款開源AI模型,旨在改變視頻創作與編輯流程。
VACE是阿里巴巴Wan2.1視頻AI模型系列的關鍵組成部分,公司宣稱這是「業界首個為多樣化視頻生成與編輯任務提供全面解決方案的開源模型」。
如果阿里巴巴能夠簡化視頻製作流程,將多種工具整合到單一平台,可能會重新定義行業標準。
VACE能做什麼?它可以從多種輸入生成視頻,例如文字提示、靜態圖像或短視頻片段。
除了視頻創作,其編輯功能包括使用參考圖像或幀來引導AI、先進的視頻「重繪」功能、修改特定視頻片段,以及延長視頻時長。阿里巴巴表示,這些工具「讓用戶能夠靈活組合任務,提升創作潛力」。

想像根據您提供的照片創建包含特定角色的視頻。據報導,VACE可以實現這一點。有一張想動畫化的靜態圖像?這款開源AI模型可以為其添加逼真的動態效果。
對於精確編輯,VACE提供「視頻重繪」工具,支持主體間的姿勢轉移、詳細的運動控制、深度調整和顏色修改。
一個突出功能是其能夠「添加、修改或移除特定視頻區域而不影響周圍環境」。這對於精確編輯來說是一個改變遊戲規則的功能,確保背景不受影響。它還可以擴展視頻畫布,通過上下文相關的內容填充新區域,創造更豐富、更沉浸的結果。
有了VACE,您可以將靜態照片轉化為視頻,通過定義路徑控制物體運動,使用參考替換角色或物體,動畫化這些參考,或精確控制它們的姿勢。
阿里巴巴強調VACE能夠將高窄圖像轉換為寬屏視頻,通過參考圖像或提示智能擴展,加入額外元素。
VACE的功能由先進的技術支持,旨在應對視頻編輯的複雜性。視頻條件單元(VCU)「實現了文字、圖像、視頻和遮罩等多模態輸入的統一處理」。
此外,「上下文適配器結構」整合了「時間和空間維度的形式化表示」,讓AI對視頻中的時間和空間有深入理解。
阿里巴巴預見VACE在社交媒體內容創作、動態廣告、影視專業後期製作以及定制教育或培訓視頻等應用中表現出色。
阿里巴巴將Wan2.1-VACE開源以賦能創作者
開發先進的AI模型通常需要大量資源,包括巨大的計算能力和數據。阿里巴巴決定將Wan2.1-VACE開源是一個重大舉措。
阿里巴巴指出:「開放存取降低了門檻,讓更多企業能夠利用AI高效且經濟地創建量身定制的高品質視覺內容。」
此舉旨在通過提供無高成本的尖端AI工具,賦能小型企業和個人創作者,促進更廣泛的創新。
阿里巴巴提供兩個版本:一個是適用於高性能系統的140億參數模型,另一個是適用於較低需求配置的13億參數輕量模型。兩者均可在Hugging Face、GitHub和阿里巴巴雲的ModelScope社區免費獲取。
另見:美國收緊AI擴散規則,加強晶片出口限制
在阿姆斯特丹、加州和倫敦的AI與大數據博覽會上,從行業專家那裡了解更多關於AI和大數據的資訊。此活動與智能自動化會議、BlockX、數字轉型週和網絡安全與雲博覽會同期舉辦。
探索TechForge主辦的即將舉行的企業技術活動和網絡研討會。
相關文章
IBM Power11 提升企業AI,實現不間斷性能
IBM的Power11企業伺服器解決了企業運算中的一個關鍵問題:在部署AI工作負載的同時,保持關鍵任務應用程式所需的強大可靠性。Power11於2025年7月8日推出,突顯了IBM專注於統一解決方案,擺脫許多組織目前所面臨的專業AI硬體與傳統伺服器的分散組合。核心創新揭曉Power11伺服器旨在確保企業無停機時間。它們擁有驚人的“99.9999%正常運行時間”,相當於每年不到32秒的意外停機時間。
AI驅動的零售實驗在Anthropic慘敗
想像一下,將一家小商店交給人工智慧,委託它處理從定價到客戶互動的一切。會出什麼問題呢?Anthropic最近的一項研究於週五發布,回答了這個問題:幾乎所有事情都出了問題。他們的AI助手Claude在舊金山辦公室經營了一個月的小商店,結果就像是為商學院學生寫下的警示故事,由一個毫無現實經驗的人撰寫——在這次實驗中,確實如此。Anthropic辦公室的「商店」是一個裝滿飲料和零食的小冰箱,搭配一個用於
釋放您的藝術潛能與先進生成媒體工具
我們很高興推出最新的生成媒體模型,帶來突破性進展。這些模型能生成令人驚嘆的圖像、影片和音樂,讓藝術家將創意理念轉化為現實。它們還為所有人提供創新工具,以表達獨特的視野。Veo 3 和 Imagen 4 是我們尖端的影片和圖像生成模型,以其革命性功能重新定義媒體創作。我們也正在擴大對 Lyria 2 的訪問,為音樂家提供增強的音樂創作工具。此外,我們邀請視覺故事創作者探索 Flow,這是我們的新款
評論 (0)
0/200
阿里巴巴推出了Wan2.1-VACE,一款開源AI模型,旨在改變視頻創作與編輯流程。
VACE是阿里巴巴Wan2.1視頻AI模型系列的關鍵組成部分,公司宣稱這是「業界首個為多樣化視頻生成與編輯任務提供全面解決方案的開源模型」。
如果阿里巴巴能夠簡化視頻製作流程,將多種工具整合到單一平台,可能會重新定義行業標準。
VACE能做什麼?它可以從多種輸入生成視頻,例如文字提示、靜態圖像或短視頻片段。
除了視頻創作,其編輯功能包括使用參考圖像或幀來引導AI、先進的視頻「重繪」功能、修改特定視頻片段,以及延長視頻時長。阿里巴巴表示,這些工具「讓用戶能夠靈活組合任務,提升創作潛力」。

想像根據您提供的照片創建包含特定角色的視頻。據報導,VACE可以實現這一點。有一張想動畫化的靜態圖像?這款開源AI模型可以為其添加逼真的動態效果。
對於精確編輯,VACE提供「視頻重繪」工具,支持主體間的姿勢轉移、詳細的運動控制、深度調整和顏色修改。
一個突出功能是其能夠「添加、修改或移除特定視頻區域而不影響周圍環境」。這對於精確編輯來說是一個改變遊戲規則的功能,確保背景不受影響。它還可以擴展視頻畫布,通過上下文相關的內容填充新區域,創造更豐富、更沉浸的結果。
有了VACE,您可以將靜態照片轉化為視頻,通過定義路徑控制物體運動,使用參考替換角色或物體,動畫化這些參考,或精確控制它們的姿勢。
阿里巴巴強調VACE能夠將高窄圖像轉換為寬屏視頻,通過參考圖像或提示智能擴展,加入額外元素。
VACE的功能由先進的技術支持,旨在應對視頻編輯的複雜性。視頻條件單元(VCU)「實現了文字、圖像、視頻和遮罩等多模態輸入的統一處理」。
此外,「上下文適配器結構」整合了「時間和空間維度的形式化表示」,讓AI對視頻中的時間和空間有深入理解。
阿里巴巴預見VACE在社交媒體內容創作、動態廣告、影視專業後期製作以及定制教育或培訓視頻等應用中表現出色。
阿里巴巴將Wan2.1-VACE開源以賦能創作者
開發先進的AI模型通常需要大量資源,包括巨大的計算能力和數據。阿里巴巴決定將Wan2.1-VACE開源是一個重大舉措。
阿里巴巴指出:「開放存取降低了門檻,讓更多企業能夠利用AI高效且經濟地創建量身定制的高品質視覺內容。」
此舉旨在通過提供無高成本的尖端AI工具,賦能小型企業和個人創作者,促進更廣泛的創新。
阿里巴巴提供兩個版本:一個是適用於高性能系統的140億參數模型,另一個是適用於較低需求配置的13億參數輕量模型。兩者均可在Hugging Face、GitHub和阿里巴巴雲的ModelScope社區免費獲取。
另見:美國收緊AI擴散規則,加強晶片出口限制
在阿姆斯特丹、加州和倫敦的AI與大數據博覽會上,從行業專家那裡了解更多關於AI和大數據的資訊。此活動與智能自動化會議、BlockX、數字轉型週和網絡安全與雲博覽會同期舉辦。
探索TechForge主辦的即將舉行的企業技術活動和網絡研討會。












