옵션
뉴스
알리바바 통이, '프리스타일' 자연어 제어 기능 탑재 음성 모델 공개

알리바바 통이, '프리스타일' 자연어 제어 기능 탑재 음성 모델 공개

2026년 3월 7일
91

오늘 알리바바 통이 연구소 음성 팀은 두 가지 혁신적인 음성 생성 모델인 Fun-CosyVoice3.5와 Fun-AudioGen-VD를 공개했습니다. 이 모델들의 가장 큰 특징은 '자유형(FreeStyle)' 명령어 지원입니다. 복잡한 매개변수 조정 대신, 사용자는 간단한 자연어 설명만으로 보컬 표현 스타일을 정밀하게 제어하거나 복잡한 오디오 장면을 처음부터 구축할 수 있습니다.

image.png

각 모델은 다음과 같은 고유한 목적을 수행합니다:

Fun-CosyVoice3.5: 다국어 복제 및 정밀 제어

CosyVoice의 향상된 버전으로 음성 표현의 미묘한 차이를 이해하는 데 핵심적인 돌파구를 마련했습니다.

명령 기반 생성: "더 자신 있게 말하기" 또는 "감정 변화를 주며 속도를 늦추기"와 같은 지시를 입력하여 실시간 음성 조정 가능

언어 확장: 태국어, 인도네시아어, 포르투갈어, 베트남어 지원이 추가되어 13개 언어에서 업계 최고의 음성 인식 정확도(WER) 및 음성 유사성 성능을 유지합니다.

희귀 문자 최적화: 특수 훈련을 통해 비표준 문자 오류율을 15.2%에서 5.3%로 감소시켰습니다.

성능 향상: 첫 패킷 지연 시간이 35% 감소하여 실시간 상호작용의 유동성이 크게 향상되었습니다.

Fun-AudioGen-VD: 종합 사운드 디자인

이 모델은 "오디오 디렉터" 역할을 수행하며 "캐릭터 + 환경"을 결합한 통합 오디오를 생성합니다.

음성 커스터마이징: 성별, 연령, 억양 및 "쉰 목소리, 깊은 목소리, 낮은 음조"와 같은 세부 특성을 지정할 수 있습니다.

감정 및 역할 연기: 고객 서비스 상담원, 방송인, 어린이 등의 역할을 시뮬레이션하며, "겉으로는 차분하지만 내면은 긴장된" 것과 같은 복잡한 상태도 전달합니다.

몰입형 환경: 배경음(전장의 혼란, 카페의 속삭임)과 공간 효과(대성당의 잔향, 수중 음향)를 추가하여 완전한 공간 시뮬레이션을 구현합니다.

통이 랩은 이 모델들이 고품질 음성 제작을 대중화하여 팟캐스팅, 게임 개발, 영화 후반 작업에 강력한 AI 지원을 제공할 것이라고 밝혔습니다.

관련 기사
AI 전문가 투입: 대형 모델이 공장을 장악하며, 산업 제조가 새로운 진화 단계로 접어들다 AI 전문가 투입: 대형 모델이 공장을 장악하며, 산업 제조가 새로운 진화 단계로 접어들다 생물학적 발효, 건축 설계, 심지어 폐수 처리 분야 최전선에서 새로운 유형의 ‘직원’이 조용히 전통적인 제조업의 모습을 바꾸고 있다. 이들은 땀에 흠뻑 젖은 노동자가 아니라, ‘AI 마스터’로 알려진 산업용 시계열 제어 대규모 모델인 ‘ManuDrive’다.상하이 교통대학교(Shanghai Jiao Tong University)의 인공지능 및 미세구조 연구
구글 포토, AI로 영화 ‘클루리스’의 상징적인 옷장을 재현하다 구글 포토, AI로 영화 ‘클루리스’의 상징적인 옷장을 재현하다 구글 포토는 수요일, 곧 출시될 새로운 AI 기반 기능을 발표했습니다. 이 기능은 사용자의 옷 사진을 디지털 옷장으로 변환해 주어, 새로운 코디를 구성하고 가상으로 입어볼 수도 있게 해줍니다. 이 개념은 영화 ‘클루리스’에서 셰어가 입을 옷을 고르며 수많은 의상들을 둘러보던 그 상징적인 가상 옷장에서 영감을 받은 것이 분명합니다.구글은 이 기능이 AI 기술
단편 드라마 ‘레드 프루트’, AI를 이용해 일반인의 얼굴을 도용했다는 의혹… 공식 입장 없어 단편 드라마 ‘레드 프루트’, AI를 이용해 일반인의 얼굴을 도용했다는 의혹… 공식 입장 없어 현재 단편 영상 업계는 AI 관련 저작권 침해 논란에 휩싸여 있다. '레드 프루트 숏 드라마'의 작품인 "복숭아 비녀"가 AI를 이용해 일반인의 초상을 무단으로 도용했다는 '얼굴 도용' 혐의를 받으며 대중의 우려를 불러일으키고 있다. 이 문제는 한 소셜 미디어 사용자가 자신의 개인 사진이 AI 생성 콘텐츠에 무단으로 사용되었다고 주장하면서 시작되었다.비교
관련 특별 주제 추천
생산력 AI 아키텍처 설계자: 자연어를 활용하여 확장 가능한 시스템 아키텍처 구축하기
AI 아키텍처 설계자: 자연어를 활용하여 확장 가능한 시스템 아키텍처 구축하기

XIX.AI에서 2026년 최고의 AI 아키텍처 설계 도구를 만나보세요. 엄선된 최고 평점 목록에는 자연어를 활용해 확장 가능한 시스템 아키텍처를 구축할 수 있는 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 사용 사례를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 AI 경쟁력을 강화하고 개발 프로세스를 간소화하세요.

10 도구
xix.ai
만화 창작 AI 캐릭터 프로필 생성 도구: 만화 캐릭터를 위한 상세한 배경 이야기 및 시각적 참고 자료를 제공합니다.
AI 캐릭터 프로필 생성 도구: 만화 캐릭터를 위한 상세한 배경 이야기 및 시각적 참고 자료를 제공합니다.

2026년 최신 최고의 AI 캐릭터 프로필 생성 도구: 만화 캐릭터들을 위한 상세한 배경 이야기와 시각적 참조 자료를 생성하는 데 사용할 수 있는 최고 평가를 받은 도구들을 발견해 보세요. 저희가 매주 업데이트하는 이 목록은 실제 사용 테스트를 기반으로 무료 및 유료 옵션들을 비교합니다. 강력하고 혁신적인 도구들을 활용하여 매력적인 캐릭터를 만들고 창작 작업 흐름을 효율화해 보세요. XIX.AI에서 순위를 확인하고 오늘 바로 완벽한 스토리텔링 도구를 확보하세요.

10 도구
xix.ai
건강과 웰니스 AI 임신 코파일럿: 임신 기간별 안전한 운동 및 영양 계획 생성
AI 임신 코파일럿: 임신 기간별 안전한 운동 및 영양 계획 생성

임신 기간별 안전하고 맞춤형 운동 및 영양 계획을 위한 2026년 최고의 AI 임신 관리 도우미를 만나보세요. 무료 및 유료 서비스 비교와 실제 사용 후기를 바탕으로 엄선된 최고 평점의 추천 서비스를 확인해 보세요. XIX.AI의 전문가 가이드를 통해 가장 건강한 임신 여정을 시작해 보세요. 지금 바로 확인해 보세요.

10 도구
xix.ai
글쓰기 최고의 무료 AI 탐지 방지 글쓰기 도구: 기계적인 초안을 자연스럽고 사람처럼 읽히는 문장으로 바꿔보세요
최고의 무료 AI 탐지 방지 글쓰기 도구: 기계적인 초안을 자연스럽고 사람처럼 읽히는 문장으로 바꿔보세요

XIX.AI에서 2026년 최고의 무료 AI 글쓰기 도구를 만나보세요. 엄선된 최고 평점 목록을 통해 기계적인 초안을 자연스럽고 사람처럼 읽히는 문장으로 다듬을 수 있습니다. 실제 테스트와 매주 업데이트되는 순위를 통해 무료 및 유료 옵션을 비교해 보세요. 지금 바로 AI 글쓰기의 경쟁력을 확보하세요.

10 도구
xix.ai
이미지 편집 단편 드라마 스토리보드를 위한 AI 아트 제너레이터: 판타지 및 도시 로맨스 캐릭터들
단편 드라마 스토리보드를 위한 AI 아트 제너레이터: 판타지 및 도시 로맨스 캐릭터들

2026 최신 정보: 단편 드라마 스토리보드 제작에 가장 적합한 AI 아트 생성 도구를 만나보세요. 저희가 엄선한 이 목록에는 매력적인 판타지 및 도시 로맨스 캐릭터를 제작하는 데 유용한 최고의 도구들이 포함되어 있습니다. 무료 옵션과 유료 옵션을 비교하고, 실제 사용 결과를 확인하여 자신에게 가장 맞는 창작 도구를 찾아보세요. XIX.AI에서 제공하는 주간 업데이트 순위와 전문가의 조언도 함께 확인해 보세요. 오늘 바로 여러분의 이야기를 시각적으로 구현해 보세요!

10 도구
xix.ai
글쓰기 라디오 및 팟캐스팅을 위한 최고의 AI 스크립팅 도구들: 매력적인 오디오 광고를 제작하기
라디오 및 팟캐스팅을 위한 최고의 AI 스크립팅 도구들: 매력적인 오디오 광고를 제작하기

XIX.AI에서 2026년 최고의 라디오 및 팟캐스팅용 AI 스크립팅 도구들을 발견해 보세요. 저희가 엄선하여 선정한 이 목록에는 매력적인 오디오 광고를 빠르게 제작할 수 있도록 해주는 강력하고 혁신적인 도구들이 포함되어 있습니다. 무료 옵션과 유료 옵션을 실제 사용 사례를 통해 비교해 보고, 매주 업데이트되는 순위를 확인해 보세요. 오늘 바로 여러분의 창의성을 발휘해 보세요!

10 도구
xix.ai
의견 (0)
0/500
OR