阿里巴巴 Tongyi 推出支持自由风格自然语言控制的语音模型
今日,阿里巴巴同译实验室语音团队发布了两款突破性语音生成模型:Fun-CosyVoice3.5与Fun-AudioGen-VD。其核心亮点在于支持"自由风格"指令——用户无需复杂参数调整,仅通过自然语言描述即可精准操控声线表现风格,或从零构建复杂音频场景。

两款模型各具专长:
Fun-CosyVoice3.5:多语言复现与精细化控制
作为CosyVoice的增强版,该模型在理解语音表达细微差异方面实现核心突破。
指令驱动生成:用户可输入"说话更自信"或"放慢语速并加入情感变化"等指令实现实时语音调整。
语言扩展:新增泰语、印尼语、葡萄牙语及越南语支持,在13种语言中保持行业领先的转写准确率(WER)与语音相似度。
罕见字符优化:专项训练将非常用字符错误率从15.2%降至5.3%。
性能提升:首包延迟降低35%,显著增强实时交互流畅度。
Fun-AudioGen-VD:全面声音设计
该模型作为"音频导演",生成融合"角色+环境"的整合音频。
声音定制:可指定性别、年龄、口音及"沙哑/低沉/低音调"等精细特征。
情感与角色扮演:模拟客服专员、播音员、儿童等角色,甚至能传达"表面平静内心紧张"等复杂状态。
沉浸式环境:添加背景音效(战场喧嚣、咖啡馆低语)与空间特效(教堂混响、水下声学),实现全空间模拟。
同益实验室指出,这些模型将推动高质量语音创作的普及化,为播客制作、游戏开发及影视后期提供强大的AI支持。
相关文章
OpenAI与美国国防部合作,ChatGPT的卸载数量激增了295%
公众愤怒:OpenAI的军事合作引发“卸载潮”近日,人工智能领域的领头羊OpenAI宣布与美国国防部建立了深度合作关系,将其人工智能模型整合到高度机密的军事网络中。这一消息在美国引发了广泛的用户抗议,“抵制ChatGPT”运动势头日益强劲。根据市场分析机构Sensor Tower的数据,2026年2月28日——OpenAI正式宣布这一合作的当天——美国市场上ChatGPT移动应用的卸载率比前一天激增了295%,而此前该应用的平均每日卸载率约为9%。用户们对人工智能被用于军事目的表示强烈担忧,
OpenAI 推出“Sites”功能,以基于文本的网站标志着“无代码时代”的终结
OpenAI 推出了 Sites,这是其面向软件工程的人工智能平台 Codex 的一项新功能。该功能目前处于预览阶段,仅向付费的“商业版”和“企业版”订阅用户开放,旨在消除网页和应用程序开发中的传统障碍。从本质上讲,Sites 是一个将抽象概念转化为实用工具的平台。用户可以输入概念、数据分析或项目计划,Codex 会自动将这些静态内容重构为仪表盘、日程规划器、评审工作区、项目看板以及轻量级应用程序
OpenAI 收购人工智能个人理财初创公司 Hiro
OpenAI已收购个人理财初创公司Hiro Finance,创始人伊桑·布洛克(Ethan Bloch)于周一宣布了这一消息,OpenAI也向TechCrunch证实了这笔交易。该初创公司曾获得顶级金融科技风投公司Ribbit以及General Catalyst和Restive的投资。收购条款未予披露,且Hiro此前从未透露过其融资规模。鉴于Hiro已宣布将于4月20日停止运营,并于5月13日前从
相关专题推荐
评论 (0)
0/500
今日,阿里巴巴同译实验室语音团队发布了两款突破性语音生成模型:Fun-CosyVoice3.5与Fun-AudioGen-VD。其核心亮点在于支持"自由风格"指令——用户无需复杂参数调整,仅通过自然语言描述即可精准操控声线表现风格,或从零构建复杂音频场景。

两款模型各具专长:
Fun-CosyVoice3.5:多语言复现与精细化控制
作为CosyVoice的增强版,该模型在理解语音表达细微差异方面实现核心突破。
指令驱动生成:用户可输入"说话更自信"或"放慢语速并加入情感变化"等指令实现实时语音调整。
语言扩展:新增泰语、印尼语、葡萄牙语及越南语支持,在13种语言中保持行业领先的转写准确率(WER)与语音相似度。
罕见字符优化:专项训练将非常用字符错误率从15.2%降至5.3%。
性能提升:首包延迟降低35%,显著增强实时交互流畅度。
Fun-AudioGen-VD:全面声音设计
该模型作为"音频导演",生成融合"角色+环境"的整合音频。
声音定制:可指定性别、年龄、口音及"沙哑/低沉/低音调"等精细特征。
情感与角色扮演:模拟客服专员、播音员、儿童等角色,甚至能传达"表面平静内心紧张"等复杂状态。
沉浸式环境:添加背景音效(战场喧嚣、咖啡馆低语)与空间特效(教堂混响、水下声学),实现全空间模拟。
同益实验室指出,这些模型将推动高质量语音创作的普及化,为播客制作、游戏开发及影视后期提供强大的AI支持。
OpenAI与美国国防部合作,ChatGPT的卸载数量激增了295%
公众愤怒:OpenAI的军事合作引发“卸载潮”近日,人工智能领域的领头羊OpenAI宣布与美国国防部建立了深度合作关系,将其人工智能模型整合到高度机密的军事网络中。这一消息在美国引发了广泛的用户抗议,“抵制ChatGPT”运动势头日益强劲。根据市场分析机构Sensor Tower的数据,2026年2月28日——OpenAI正式宣布这一合作的当天——美国市场上ChatGPT移动应用的卸载率比前一天激增了295%,而此前该应用的平均每日卸载率约为9%。用户们对人工智能被用于军事目的表示强烈担忧,
OpenAI 推出“Sites”功能,以基于文本的网站标志着“无代码时代”的终结
OpenAI 推出了 Sites,这是其面向软件工程的人工智能平台 Codex 的一项新功能。该功能目前处于预览阶段,仅向付费的“商业版”和“企业版”订阅用户开放,旨在消除网页和应用程序开发中的传统障碍。从本质上讲,Sites 是一个将抽象概念转化为实用工具的平台。用户可以输入概念、数据分析或项目计划,Codex 会自动将这些静态内容重构为仪表盘、日程规划器、评审工作区、项目看板以及轻量级应用程序
OpenAI 收购人工智能个人理财初创公司 Hiro
OpenAI已收购个人理财初创公司Hiro Finance,创始人伊桑·布洛克(Ethan Bloch)于周一宣布了这一消息,OpenAI也向TechCrunch证实了这笔交易。该初创公司曾获得顶级金融科技风投公司Ribbit以及General Catalyst和Restive的投资。收购条款未予披露,且Hiro此前从未透露过其融资规模。鉴于Hiro已宣布将于4月20日停止运营,并于5月13日前从





首页






