同益實驗室推出 Fun-CosyVoice 3.5 與 Fun-AudioGen-VD 語音模型
今日,同益實驗室 正式推出兩款支援 FreeStyle 技術的語音生成模型:Fun-CosyVoice3.5與Fun-AudioGen-VD。此次發布標誌著語音合成領域的範式轉移,從依賴預設標籤轉向基於自然語言指令的新框架,實現了深度互動體驗,讓使用者能夠「僅憑一句話自由生成語音」。


在技術架構與功能升級方面,Fun-CosyVoice3.5 著重於多語言語音克隆與細膩的語感表現,現已新增對泰語及印尼語等四種語言的支持。透過整合 DiffRO 與 GRPO 強化的學習技術,該模型在語調及音質相似度方面均取得顯著提升。 其罕見字元錯誤率從 15.2% 降至 5.3%,初始封包延遲亦減少了 35%。與此相輔相成,Fun-AudioGen-VD 專注於聲音設計與場景建模。它支援透過指令精確控制性別、情緒及空間聲學,能模擬從「瘋狂反派」到「喧鬧咖啡廳」氛圍等複雜的整合場景。
從產業趨勢來看,同益實驗室的 這項創舉將語音生成從單純的轉換工具提升為功能完備的創作工具。這種具描述性且可編程的數位表達能力,直接賦能電影、遊戲及 AI 虛擬化身等領域,不僅降低內容創作成本,更大幅擴展人機互動的語義豐富度。
API:https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP
文件:https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2
相關文章
StrictlyVC 舊金山站將匯聚 TDK Ventures、Replit 等企業的領導者
今年首場 StrictlyVC 活動即將在舊金山登場,時間比你想像的還要快。 4月30日於菲律賓文化中心(Sentro Filipino Cultural Center)舉辦的聚會門票現仍開放購買,現場將有陣容強大的講者陣容。除了StrictlyVC一貫以人脈拓展與社群互動著稱外,這場舊金山活動對於尋求最新募資洞見的人工智慧創新者與創辦人而言,將具有特別的價值。誰將登上舞台門票現已開售,但若您尚未
Notion 將其工作區轉變為人工智慧代理的樞紐
生產力軟體公司 Notion 正邁入「代理時代」。在週三的直播產品發布會上,以協作式筆記應用程式聞名的 Notion 揭曉了一套全新的開發者平台,該平台不僅擴展了其自訂 AI 代理程式的能力,還能與外部代理程式串接,並讓團隊建立自動化多步驟工作流程,從任何資料庫中擷取資料。透過建立一個「協調層」——一個能在多個工具和資料來源之間協調 AI 工作的系統——Notion 將自身定位為不僅僅是一款具備
請問能否提供要改寫的文章標題?
過去要拍一張專業的頭像照,意味著必須聘請攝影師、租用攝影棚,並預留至少一個小時的時間。如今,越來越多由人工智慧驅動的平台聲稱,您可以省去這些步驟,依然能獲得一張精緻且可直接發布的影像。有些平台確實兌現了承諾,但更多則不然。究竟什麼樣的AI人像值得投資,哪些只是浪費金錢?關鍵往往取決於一個問題:最終成像是否真的像你本人?解析度、背景和處理速度固然重要,但如果螢幕上凝視著你的那個人,只是個與你膚色相近
相關專題推薦
評論 (0)
0/500
今日


在技術架構與功能升級
從產業趨勢來看,
API:https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP
文件:https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2
StrictlyVC 舊金山站將匯聚 TDK Ventures、Replit 等企業的領導者
今年首場 StrictlyVC 活動即將在舊金山登場,時間比你想像的還要快。 4月30日於菲律賓文化中心(Sentro Filipino Cultural Center)舉辦的聚會門票現仍開放購買,現場將有陣容強大的講者陣容。除了StrictlyVC一貫以人脈拓展與社群互動著稱外,這場舊金山活動對於尋求最新募資洞見的人工智慧創新者與創辦人而言,將具有特別的價值。誰將登上舞台門票現已開售,但若您尚未
Notion 將其工作區轉變為人工智慧代理的樞紐
生產力軟體公司 Notion 正邁入「代理時代」。在週三的直播產品發布會上,以協作式筆記應用程式聞名的 Notion 揭曉了一套全新的開發者平台,該平台不僅擴展了其自訂 AI 代理程式的能力,還能與外部代理程式串接,並讓團隊建立自動化多步驟工作流程,從任何資料庫中擷取資料。透過建立一個「協調層」——一個能在多個工具和資料來源之間協調 AI 工作的系統——Notion 將自身定位為不僅僅是一款具備
請問能否提供要改寫的文章標題?
過去要拍一張專業的頭像照,意味著必須聘請攝影師、租用攝影棚,並預留至少一個小時的時間。如今,越來越多由人工智慧驅動的平台聲稱,您可以省去這些步驟,依然能獲得一張精緻且可直接發布的影像。有些平台確實兌現了承諾,但更多則不然。究竟什麼樣的AI人像值得投資,哪些只是浪費金錢?關鍵往往取決於一個問題:最終成像是否真的像你本人?解析度、背景和處理速度固然重要,但如果螢幕上凝視著你的那個人,只是個與你膚色相近





首頁






