阿里巴巴 Tongyi 推出具備「自由風格」自然語言控制功能的語音模型
今日,阿里巴巴同義實驗室語音團隊推出兩款突破性語音生成模型:Fun-CosyVoice3.5 與 Fun-AudioGen-VD。其核心特色在於支援「自由風格」指令,使用者無需繁複參數調整,僅需透過自然語言描述,即可精準操控聲線表現風格,或從零構建複雜音頻場景。

兩款模型各具特色:
Fun-CosyVoice3.5:多語種複製與細粒度控制
此為CosyVoice的強化版本,在理解語音細微表達方面實現核心突破。
指令驅動生成:使用者可輸入「語氣更自信」、「放慢語速並加入情感變化」等指令,實現即時聲線調整。
語言擴展:新增泰語、印尼語、葡萄牙語及越南語支援,於13種語言中維持業界領先的轉錄準確度(WER)與語音相似度表現。
罕見字元優化:透過專項訓練,罕見字元錯誤率從15.2%降至5.3%。
效能提升:首封封包延遲降低35%,顯著強化即時互動流暢度。
Fun-AudioGen-VD:全方位音效設計
此模型扮演「音效導演」角色,能整合生成「角色+環境」的沉浸式音效。
語音客製化:可指定性別、年齡、口音及「沙啞、低沉、低音」等細部特徵。
情緒與角色扮演:模擬客服專員、播音員、孩童等角色,甚至能傳達「外表平靜內心緊繃」等複雜狀態。
沉浸式環境:添加背景音效(戰場喧囂、咖啡廳低語)與空間特效(教堂混響、水下聲學),實現完整空間模擬。
統一實驗室指出,這些模型將使高品質語音創作普及化,為播客製作、遊戲開發及電影後期製作提供強大的AI支援。
相關文章
杭州市上城區推出了浙江省首個基於AIGC技術的視聽產業“黃金十項措施”,並設立了50億規模的產業發展基金。
16日,AIGC視聽產業創新生態大會在杭州上城區舉行。會議期間,該省推出了針對AIGC視聽產業的的首項專項政策——“黃金十項措施”。這項政策涵蓋了技術創新、成本降低、內容質量提升、人才培養以及全球發展等多個方面。這些政策提供了強有力的激勵措施。對於技術創新領域,凡是專注於AIGC工具、AI虛擬拍攝和AI互動敘事系統的研究開發專案,均可獲得最高300萬元的補貼。而對於高質量的內容創作,那些在年內透過知名平臺釋出的AIGC視聽作品,每部可獲得最高30萬元的獎勵,每家企業的年度獎勵總額上限為100萬
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見
中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295%
公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
相關專題推薦
評論 (0)
0/500
今日,阿里巴巴同義實驗室語音團隊推出兩款突破性語音生成模型:Fun-CosyVoice3.5 與 Fun-AudioGen-VD。其核心特色在於支援「自由風格」指令,使用者無需繁複參數調整,僅需透過自然語言描述,即可精準操控聲線表現風格,或從零構建複雜音頻場景。

兩款模型各具特色:
Fun-CosyVoice3.5:多語種複製與細粒度控制
此為CosyVoice的強化版本,在理解語音細微表達方面實現核心突破。
指令驅動生成:使用者可輸入「語氣更自信」、「放慢語速並加入情感變化」等指令,實現即時聲線調整。
語言擴展:新增泰語、印尼語、葡萄牙語及越南語支援,於13種語言中維持業界領先的轉錄準確度(WER)與語音相似度表現。
罕見字元優化:透過專項訓練,罕見字元錯誤率從15.2%降至5.3%。
效能提升:首封封包延遲降低35%,顯著強化即時互動流暢度。
Fun-AudioGen-VD:全方位音效設計
此模型扮演「音效導演」角色,能整合生成「角色+環境」的沉浸式音效。
語音客製化:可指定性別、年齡、口音及「沙啞、低沉、低音」等細部特徵。
情緒與角色扮演:模擬客服專員、播音員、孩童等角色,甚至能傳達「外表平靜內心緊繃」等複雜狀態。
沉浸式環境:添加背景音效(戰場喧囂、咖啡廳低語)與空間特效(教堂混響、水下聲學),實現完整空間模擬。
統一實驗室指出,這些模型將使高品質語音創作普及化,為播客製作、遊戲開發及電影後期製作提供強大的AI支援。
杭州市上城區推出了浙江省首個基於AIGC技術的視聽產業“黃金十項措施”,並設立了50億規模的產業發展基金。
16日,AIGC視聽產業創新生態大會在杭州上城區舉行。會議期間,該省推出了針對AIGC視聽產業的的首項專項政策——“黃金十項措施”。這項政策涵蓋了技術創新、成本降低、內容質量提升、人才培養以及全球發展等多個方面。這些政策提供了強有力的激勵措施。對於技術創新領域,凡是專注於AIGC工具、AI虛擬拍攝和AI互動敘事系統的研究開發專案,均可獲得最高300萬元的補貼。而對於高質量的內容創作,那些在年內透過知名平臺釋出的AIGC視聽作品,每部可獲得最高30萬元的獎勵,每家企業的年度獎勵總額上限為100萬
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見
中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295%
公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,





首頁






