Tongyi Lab stellt die Sprachmodelle „Fun-CosyVoice 3.5“ und „Fun-AudioGen-VD“ vor
Heute hat Tongyi Lab offiziell zwei FreeStyle-fähige Sprachgenerierungsmodelle vorgestellt: Fun-CosyVoice3.5 und Fun-AudioGen-VD. Diese Einführung markiert einen Paradigmenwechsel in der Sprachsynthese: weg von der Abhängigkeit von voreingestellten Tags hin zu einem neuen Framework, das auf Anweisungen in natürlicher Sprache basiert. Damit wird ein hochgradig interaktives Erlebnis erreicht, das es Nutzern ermöglicht, „mit einem einzigen Satz frei Sprache zu generieren“.


Was die technische Architektur und funktionale Verbesserungen betrifft, legt Fun-CosyVoice3.5 den Schwerpunkt auf mehrsprachiges Stimmklonen und nuancierten Ausdruck und unterstützt nun vier neue Sprachen, darunter Thai und Indonesisch. Durch die Integration der Reinforcement-Learning-Technologien DiffRO und GRPO erzielt das Modell erhebliche Verbesserungen bei der Prosodie und der Ähnlichkeit der Audioqualität. Die Fehlerquote bei seltenen Zeichen ist von 15,2 % auf 5,3 % gesunken, und die anfängliche Paketverzögerung wurde um 35 % reduziert. Ergänzend dazu konzentriert sich Fun-AudioGen-VD auf Sounddesign und Szenariomodellierung. Es unterstützt eine präzise, anweisungsbasierte Steuerung von Geschlecht, Emotion und räumlicher Akustik und ermöglicht so die Simulation komplexer, integrierter Szenarien – von einem „verrückten Bösewicht“ bis hin zur Atmosphäre eines „lauten Cafés“.
Aus Sicht der Branchentrends hebt die Initiative von Tongyi Lab die Sprachgenerierung von einem einfachen Konvertierungstool zu einem vollwertigen Kreativwerkzeug. Diese beschreibende und programmierbare digitale Ausdrucksfähigkeit stärkt direkt Branchen wie Film, Gaming und KI-Avatare. Sie senkt die Kosten für die Erstellung von Inhalten und erweitert gleichzeitig die semantische Vielfalt der Mensch-Computer-Interaktion erheblich.
API: https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP
Dokumentation: https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2
Verwandter Artikel
Lei Jun bestätigt, dass Xiaomis Desktop-KI-Agent MiClaw in der Entwicklung ist; MiMo-V2-Pro wird auf allen Plattformen eingeführt
Auf dem „China Development High-Level Forum 2026“ bestätigte Lei Jun von der Xiaomi Group, dass die lang erwartete Desktop-Version des KI-Agenten „MiClaw“ (Krabbe) nun auf der Entwicklungs-Roadmap ste
OpenAI nimmt sein Robotikgeschäft wieder auf, Automan sucht Ingenieure für die Forschung und Entwicklung im Bereich Infrastruktur
Am 1. Juni gab Sam Altman, CEO von OpenAI, in den sozialen Medien bekannt, dass das Unternehmen wieder in den Bereich Robotik einsteigt, und veröffentlichte Stellenangebote für das OpenAI-Robotikteam.
Bain prognostiziert einen SaaS-Markt im Wert von 100 Milliarden US-Dollar im Bereich der agentenbasierten KI-Automatisierung
Bain & Company schätzt den Markt für SaaS-Unternehmen, die agentische KI nutzen, in den USA auf 100 Milliarden US-Dollar. Das Unternehmen erklärte, dieser Markt entstamme der Automatisierung von Koord
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Heute hat


Was die technische Architektur und funktionale Verbesserungen betrifft, legt
Aus Sicht der Branchentrends hebt die Initiative
API: https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP
Dokumentation: https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2
Lei Jun bestätigt, dass Xiaomis Desktop-KI-Agent MiClaw in der Entwicklung ist; MiMo-V2-Pro wird auf allen Plattformen eingeführt
Auf dem „China Development High-Level Forum 2026“ bestätigte Lei Jun von der Xiaomi Group, dass die lang erwartete Desktop-Version des KI-Agenten „MiClaw“ (Krabbe) nun auf der Entwicklungs-Roadmap ste
OpenAI nimmt sein Robotikgeschäft wieder auf, Automan sucht Ingenieure für die Forschung und Entwicklung im Bereich Infrastruktur
Am 1. Juni gab Sam Altman, CEO von OpenAI, in den sozialen Medien bekannt, dass das Unternehmen wieder in den Bereich Robotik einsteigt, und veröffentlichte Stellenangebote für das OpenAI-Robotikteam.





Heim






