옵션
뉴스
Alibaba, Wan2.1-VACE 공개: 오픈소스 AI 비디오 솔루션

Alibaba, Wan2.1-VACE 공개: 오픈소스 AI 비디오 솔루션

2025년 8월 1일
3

Alibaba가 Wan2.1-VACE를 공개, 비디오 제작 및 편집 프로세스를 혁신할 오픈소스 AI 모델.

VACE는 Alibaba의 Wan2.1 비디오 AI 모델 패밀리의 핵심 구성 요소로, 회사는 이를 업계 최초의 다양한 비디오 생성 및 편집 작업을 위한 포괄적 솔루션을 제공하는 오픈소스 모델이라고 주장.

Alibaba가 비디오 제작 프로세스를 간소화하고 여러 도구를 단일 플랫폼으로 통합한다면, 업계 표준을 재정의할 수 있음.

VACE는 무엇을 할 수 있나? 텍스트 프롬프트, 정적 이미지 또는 짧은 비디오 클립과 같은 다양한 입력에서 비디오를 생성.

비디오 제작 외에도, 참조 이미지나 프레임을 사용해 AI를 안내하는 편집 기능, 고급 비디오 “재페인팅” 기능, 특정 비디오 섹션 수정, 비디오 길이 연장을 포함. Alibaba는 이러한 도구가 “사용자들이 작업을 유연하게 결합하여 창의적 잠재력을 높일 수 있게 한다”고 밝힘.

당신이 제공한 사진을 기반으로 특정 캐릭터가 등장하는 비디오를 만드는 것을 상상해 보라. VACE는 이를 실현할 수 있다고 전해짐. 애니메이션화하고 싶은 정적 이미지가 있나? 이 오픈소스 AI 모델은 생동감 있는 움직임을 추가할 수 있음.

정밀 편집을 위해 VACE는 “비디오 재페인팅” 도구를 제공, 피사체 간 포즈 전송, 세부 움직임 제어, 깊이 조정, 색상 수정을 가능하게 함.

특히 주목할 기능은 “주변에 영향을 주지 않고 특정 비디오 영역을 추가, 수정 또는 제거”할 수 있는 능력. 이는 배경을 손대지 않고 정밀 편집을 위한 획기적인 기능. 또한 비디오 캔버스를 확장해 상황에 맞는 새로운 콘텐츠로 채워 더 풍부하고 몰입감 있는 결과를 제공.

VACE를 사용하면 정적 사진을 비디오로 변환하고, 경로를 정의해 객체 움직임을 지정하거나, 참조를 사용해 캐릭터나 객체를 교체하거나, 참조를 애니메이션화하거나, 포즈를 정밀하게 제어할 수 있음.

Alibaba는 VACE가 세로로 긴 이미지를 참조 이미지나 프롬프트에서 추가 요소를 통합해 와이드스크린 비디오로 지능적으로 확장할 수 있다고 강조.

VACE의 기능은 비디오 편집의 복잡성을 해결하도록 설계된 정교한 기술로 뒷받침됨. 비디오 조건 유닛(VCU)은 “텍스트, 이미지, 비디오, 마스크와 같은 멀티모달 입력을 통합 처리” 가능.

또한 “컨텍스트 어댑터 구조”는 “시간적, 공간적 차원의 형식화된 표현”을 통합해 AI가 비디오 내 시간과 공간을 깊이 이해하도록 함.

Alibaba는 VACE가 소셜 미디어 콘텐츠 제작, 동적 광고, 영화 및 TV용 전문 사후 제작, 맞춤형 교육 또는 훈련 비디오와 같은 응용 분야에서 탁월할 것으로 전망.

Alibaba, Wan2.1-VACE를 오픈소스로 공유해 창작자 역량 강화

고급 AI 모델 개발은 일반적으로 막대한 컴퓨팅 파워와 데이터를 포함한 상당한 자원을 요구. Alibaba의 Wan2.1-VACE 오픈소스 결정은 중요한 움직임.

“오픈 액세스는 장벽을 낮춰 더 많은 기업이 AI를 활용해 맞춤형 고품질 시각 콘텐츠를 효율적이고 저렴하게 제작할 수 있게 한다”고 Alibaba는 언급.

이 움직임은 고비용 없이 첨단 AI 도구에 대한 접근을 제공해 소규모 기업과 개인 창작자를 강화하고, 더 넓은 혁신을 촉진하는 것을 목표로 함.

Alibaba는 고성능 시스템을 위한 강력한 140억 파라미터 모델과 덜 까다로운 설정을 위한 가벼운 13억 파라미터 모델, 두 가지 버전을 제공. 둘 다 Hugging Face, GitHub, Alibaba Cloud의 ModelScope 커뮤니티에서 무료로 사용 가능.

참고: 미국, AI 확산 규제 강화, 칩 수출 제한 강화

암스테르담, 캘리포니아, 런던에서 열리는 AI & Big Data Expo에서 업계 전문가들로부터 AI와 빅데이터에 대해 더 알아보세요. 이 행사는 Intelligent Automation Conference, BlockX, Digital Transformation Week, Cyber Security & Cloud Expo와 공동 개최.

TechForge가 주최하는 다가오는 기업 기술 이벤트 및 웨비나를 여기에서 탐색.

관련 기사
IBM Power11, 기업 AI를 위한 지속적인 성능 향상 IBM Power11, 기업 AI를 위한 지속적인 성능 향상 IBM의 Power11 기업용 서버는 기업 컴퓨팅의 핵심 문제인 AI 워크로드를 배포하면서도 중요한 애플리케이션에 필요한 강력한 안정성을 유지하는 것을 해결합니다. 2025년 7월 8일에 출시된 Power11은 전문 AI 하드웨어와 전통적인 서버의 단편화된 혼합에서 벗어나 통합 솔루션에 초점을 맞춘 IBM의 방향성을 강조합니다.핵심 혁신 공개Power11
AI로 구동되는 소매 실험, Anthropic에서 극적으로 실패 AI로 구동되는 소매 실험, Anthropic에서 극적으로 실패 작은 가게를 인공지능에게 맡겨 가격 책정부터 고객 상호작용까지 모든 것을 위임한다고 상상해보세요. 무엇이 잘못될 수 있을까요?최근 Anthropic의 연구, 금요일에 발표된 바에 따르면, 그 대답은 거의 모든 것이었습니다. 그들의 AI 어시스턴트 Claude는 샌프란시스코 사무실에서 한 달간 작은 가게를 운영하며, 실무 경험이 전혀 없는 사람이 쓴 비즈니스
고급 생성 미디어 도구로 예술적 잠재력을 발휘하세요 고급 생성 미디어 도구로 예술적 잠재력을 발휘하세요 최신 생성 미디어 모델을 공개하게 되어 기쁩니다. 이 모델들은 획기적인 발전을 이루며 놀라운 이미지, 비디오, 음악을 생성하여 예술가들이 창의적인 아이디어를 현실로 전환할 수 있게 합니다. 또한 모두가 자신만의 독특한 비전을 표현할 수 있는 혁신적인 도구를 제공합니다.Veo 3와 Imagen 4는 최첨단 비디오 및 이미지 생성 모델로, 혁신적인 기능으로 미
의견 (0)
0/200
위로 돌아갑니다
OR