알리바바의 알리윈, ‘Fun-CineForge’ 공개: 영화급 더빙 모델 및 데이터셋 오픈소스화
최근 알리바바 통이 랩(Alibaba Tongyi Lab)의 음성 처리 팀이 중국과학기술대학과 협력하여 개발한 ‘Fun-CineForge’ 프로젝트가 공식적으로 오픈소스로 공개되었습니다. 이 프로젝트는 포괄적인 엔드투엔드 제작 워크플로우와 대규모 모델 솔루션을 도입하여, 입모양 동기화, 음성 스타일 전이, 감정 표현 등 영화 및 TV 더빙 분야의 핵심 과제를 해결합니다.

핵심 기술 혁신: 영화 더빙의 '립싱크 불일치' 문제 해결
기존 AI 더빙 기술은 입모양의 불일치, 기계적인 감정 전달, 대사와 다중 인물의 음향이 포함된 복잡한 영화 장면에 적응하기 어려운 등의 문제로 종종 어려움을 겪어 왔습니다. Fun-CineForge는 두 가지 핵심 혁신을 통해 획기적인 성과를 달성했습니다:
MLLM 더빙 모델: 단순한 입 주변 영역의 오디오-비디오 정렬을 넘어, 장면 내 캐릭터의 정체성과 감정적 뉘앙스를 깊이 있게 이해할 수 있는 다중 모달 대규모 언어 모델(MLLM) 아키텍처를 활용합니다.
CineDub 대규모 데이터셋: 이 프로젝트는 자동화된 파이프라인을 통해 독백, 내레이션, 대화, 다중 화자 상호작용 등 다양한 시나리오를 아우르는 최초의 풍부한 주석이 달린 중국 TV 프로그램 더빙 데이터셋을 구축했습니다.
프로젝트 업데이트 및 오픈 소스 로드맵
이 프로젝트는 최근 빈번한 업데이트를 통해 높은 수준의 기술적 성숙도를 보여주고 있습니다:
2026년 1월~3월: 중국어(CineDub-CN) 및 영어(CineDub-EN)용 샘플 데이터셋과 데모 버전을 공개했습니다.
2026년 3월 16일: 추론 코드와 모델 가중치(체크포인트)를 공식적으로 오픈소스로 공개하여, 개발자들이 GitHub에서 해당 리소스에 접근할 수 있게 되었습니다.
데이터셋 접근: 중국 드라마 "홍루몽"과 영국 드라마 "다운튼 애비"를 포함한 여러 고전 시리즈 데이터셋을 연구 목적으로 이용할 수 있게 되었습니다.
기술적 적용: "대화"에서 "연기"로
공식 데모에서는 이 모델이 '삼국지'와 같은 고전 시리즈를 재구성하는 데 있어 인상적인 결과를 보여주는 것을 확인할 수 있습니다. 특정 "감정 단서"를 입력함으로써, 모델은 두려움에서 반항으로 이어지는 캐릭터의 감정 변화를 정확하게 포착하여 고품질 음성 복제 및 자연스러운 립싱크를 구현합니다.
Fun-CineForge의 출시는 영화 및 TV AI 더빙이 기본적인 '텍스트-투-스피치(text-to-speech)'에서 예술적 이해력을 갖춘 '자동화된 후반 작업' 도구로 전환되었음을 시사합니다. 이러한 발전은 더빙된 영화 및 TV 콘텐츠의 제작 비용을 크게 절감할 것으로 기대됩니다.
프로젝트: https://funcineforge.github.io/
관련 기사
알리의 대형 모델 확대 전략: ‘Qwen’ 디지털 휴먼 공개, 핵심 생태계 통합
AI 경쟁이 애플리케이션 단계로 접어들면서, 알리바바는 자사의 AI 생태계를 통합하는 중요한 행보를 보였습니다. 4월 22일, 알리바바는 ‘Qwen 샤오지우워(Qwen Xiaojiuwo)’라는 통합 AI 디지털 페르소나를 공식 발표했습니다. 이를 통해 ‘통이 첸원(Tongyi Qianwen)’에 더욱 뚜렷한 브랜드 정체성을 부여하는 동시에 핵심 AI 기술의
알리바바 2026 회계연도 4분기 실적 보고서: AI 매출 급증, 바이리안 플랫폼 연간 반복 매출(ARR) 100억 위안 돌파
알리바바 그룹은 오늘 2026년 4분기 및 연간 실적을 발표하며, AI 기반 클라우드 사업이 폭발적인 성장세를 보이고 있음을 밝혔다. 보고서에 따르면, 매각된 사업을 제외한 4분기 매출은 전년 동기 대비 11% 증가한 2,433억 8천만 위안을 기록했으며, 특히 AI 모델 및 애플리케이션 서비스가 주요 성장 동력으로 부각되었다.알리바바 클라우드의 '바이리안
일론 머스크, 샘 알트먼 및 오픈AI를 상대로 한 소송에서 패소
엘론 머스크가 오픈AI의 공동 창립자들이 자신을 속였다고 주장한 것은 캘리포니아주의 9명의 배심원들이 그의 소송이 너무 늦게 제기되었다고 만장일치로 판결함으로써 무너졌다.머스크는 샘 올트먼, 그렉 브록먼, 오픈AI, 마이크로소프트가 이 고급 AI 연구소의 수익 창출 부서를 설립함으로써 “자선 단체의 자산을 도난했다”고 주장했다. 그러나 배심원들은 머스크가 입었을 수 있는 어떠한 손해도 그가 소송을 제기할 법적 기한 이전에 발생했다고 결정했다.
관련 특별 주제 추천
의견 (0)
0/500
최근 알리바바 통이 랩(Alibaba Tongyi Lab)의 음성 처리 팀이 중국과학기술대학과 협력하여 개발한 ‘Fun-CineForge’ 프로젝트가 공식적으로 오픈소스로 공개되었습니다. 이 프로젝트는 포괄적인 엔드투엔드 제작 워크플로우와 대규모 모델 솔루션을 도입하여, 입모양 동기화, 음성 스타일 전이, 감정 표현 등 영화 및 TV 더빙 분야의 핵심 과제를 해결합니다.

핵심 기술 혁신: 영화 더빙의 '립싱크 불일치' 문제 해결
기존 AI 더빙 기술은 입모양의 불일치, 기계적인 감정 전달, 대사와 다중 인물의 음향이 포함된 복잡한 영화 장면에 적응하기 어려운 등의 문제로 종종 어려움을 겪어 왔습니다. Fun-CineForge는 두 가지 핵심 혁신을 통해 획기적인 성과를 달성했습니다:
MLLM 더빙 모델: 단순한 입 주변 영역의 오디오-비디오 정렬을 넘어, 장면 내 캐릭터의 정체성과 감정적 뉘앙스를 깊이 있게 이해할 수 있는 다중 모달 대규모 언어 모델(MLLM) 아키텍처를 활용합니다.
CineDub 대규모 데이터셋: 이 프로젝트는 자동화된 파이프라인을 통해 독백, 내레이션, 대화, 다중 화자 상호작용 등 다양한 시나리오를 아우르는 최초의 풍부한 주석이 달린 중국 TV 프로그램 더빙 데이터셋을 구축했습니다.
프로젝트 업데이트 및 오픈 소스 로드맵
이 프로젝트는 최근 빈번한 업데이트를 통해 높은 수준의 기술적 성숙도를 보여주고 있습니다:
2026년 1월~3월: 중국어(CineDub-CN) 및 영어(CineDub-EN)용 샘플 데이터셋과 데모 버전을 공개했습니다.
2026년 3월 16일: 추론 코드와 모델 가중치(체크포인트)를 공식적으로 오픈소스로 공개하여, 개발자들이 GitHub에서 해당 리소스에 접근할 수 있게 되었습니다.
데이터셋 접근: 중국 드라마 "홍루몽"과 영국 드라마 "다운튼 애비"를 포함한 여러 고전 시리즈 데이터셋을 연구 목적으로 이용할 수 있게 되었습니다.
기술적 적용: "대화"에서 "연기"로
공식 데모에서는 이 모델이 '삼국지'와 같은 고전 시리즈를 재구성하는 데 있어 인상적인 결과를 보여주는 것을 확인할 수 있습니다. 특정 "감정 단서"를 입력함으로써, 모델은 두려움에서 반항으로 이어지는 캐릭터의 감정 변화를 정확하게 포착하여 고품질 음성 복제 및 자연스러운 립싱크를 구현합니다.
Fun-CineForge의 출시는 영화 및 TV AI 더빙이 기본적인 '텍스트-투-스피치(text-to-speech)'에서 예술적 이해력을 갖춘 '자동화된 후반 작업' 도구로 전환되었음을 시사합니다. 이러한 발전은 더빙된 영화 및 TV 콘텐츠의 제작 비용을 크게 절감할 것으로 기대됩니다.
프로젝트: https://funcineforge.github.io/
알리의 대형 모델 확대 전략: ‘Qwen’ 디지털 휴먼 공개, 핵심 생태계 통합
AI 경쟁이 애플리케이션 단계로 접어들면서, 알리바바는 자사의 AI 생태계를 통합하는 중요한 행보를 보였습니다. 4월 22일, 알리바바는 ‘Qwen 샤오지우워(Qwen Xiaojiuwo)’라는 통합 AI 디지털 페르소나를 공식 발표했습니다. 이를 통해 ‘통이 첸원(Tongyi Qianwen)’에 더욱 뚜렷한 브랜드 정체성을 부여하는 동시에 핵심 AI 기술의
알리바바 2026 회계연도 4분기 실적 보고서: AI 매출 급증, 바이리안 플랫폼 연간 반복 매출(ARR) 100억 위안 돌파
알리바바 그룹은 오늘 2026년 4분기 및 연간 실적을 발표하며, AI 기반 클라우드 사업이 폭발적인 성장세를 보이고 있음을 밝혔다. 보고서에 따르면, 매각된 사업을 제외한 4분기 매출은 전년 동기 대비 11% 증가한 2,433억 8천만 위안을 기록했으며, 특히 AI 모델 및 애플리케이션 서비스가 주요 성장 동력으로 부각되었다.알리바바 클라우드의 '바이리안
일론 머스크, 샘 알트먼 및 오픈AI를 상대로 한 소송에서 패소
엘론 머스크가 오픈AI의 공동 창립자들이 자신을 속였다고 주장한 것은 캘리포니아주의 9명의 배심원들이 그의 소송이 너무 늦게 제기되었다고 만장일치로 판결함으로써 무너졌다.머스크는 샘 올트먼, 그렉 브록먼, 오픈AI, 마이크로소프트가 이 고급 AI 연구소의 수익 창출 부서를 설립함으로써 “자선 단체의 자산을 도난했다”고 주장했다. 그러나 배심원들은 머스크가 입었을 수 있는 어떠한 손해도 그가 소송을 제기할 법적 기한 이전에 발생했다고 결정했다.





집






