Option
Heim
Nachricht
Tongyi Lab stellt die Sprachmodelle „Fun-CosyVoice 3.5“ und „Fun-AudioGen-VD“ vor

Tongyi Lab stellt die Sprachmodelle „Fun-CosyVoice 3.5“ und „Fun-AudioGen-VD“ vor

27. März 2026
110

Heute hat Tongyi Lab offiziell zwei FreeStyle-fähige Sprachgenerierungsmodelle vorgestellt: Fun-CosyVoice3.5 und Fun-AudioGen-VD. Diese Einführung markiert einen Paradigmenwechsel in der Sprachsynthese: weg von der Abhängigkeit von voreingestellten Tags hin zu einem neuen Framework, das auf Anweisungen in natürlicher Sprache basiert. Damit wird ein hochgradig interaktives Erlebnis erreicht, das es Nutzern ermöglicht, „mit einem einzigen Satz frei Sprache zu generieren“.

QQ20260302-113700.png

QQ20260302-113713.png

Was die technische Architektur und funktionale Verbesserungen betrifft, legt Fun-CosyVoice3.5 den Schwerpunkt auf mehrsprachiges Stimmklonen und nuancierten Ausdruck und unterstützt nun vier neue Sprachen, darunter Thai und Indonesisch. Durch die Integration der Reinforcement-Learning-Technologien DiffRO und GRPO erzielt das Modell erhebliche Verbesserungen bei der Prosodie und der Ähnlichkeit der Audioqualität. Die Fehlerquote bei seltenen Zeichen ist von 15,2 % auf 5,3 % gesunken, und die anfängliche Paketverzögerung wurde um 35 % reduziert. Ergänzend dazu konzentriert sich Fun-AudioGen-VD auf Sounddesign und Szenariomodellierung. Es unterstützt eine präzise, anweisungsbasierte Steuerung von Geschlecht, Emotion und räumlicher Akustik und ermöglicht so die Simulation komplexer, integrierter Szenarien – von einem „verrückten Bösewicht“ bis hin zur Atmosphäre eines „lauten Cafés“.

Aus Sicht der Branchentrends hebt die Initiative von Tongyi Lab die Sprachgenerierung von einem einfachen Konvertierungstool zu einem vollwertigen Kreativwerkzeug. Diese beschreibende und programmierbare digitale Ausdrucksfähigkeit stärkt direkt Branchen wie Film, Gaming und KI-Avatare. Sie senkt die Kosten für die Erstellung von Inhalten und erweitert gleichzeitig die semantische Vielfalt der Mensch-Computer-Interaktion erheblich.

API: https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP

Dokumentation: https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2

Verwandter Artikel
Lei Jun bestätigt, dass Xiaomis Desktop-KI-Agent MiClaw in der Entwicklung ist; MiMo-V2-Pro wird auf allen Plattformen eingeführt Lei Jun bestätigt, dass Xiaomis Desktop-KI-Agent MiClaw in der Entwicklung ist; MiMo-V2-Pro wird auf allen Plattformen eingeführt Auf dem „China Development High-Level Forum 2026“ bestätigte Lei Jun von der Xiaomi Group, dass die lang erwartete Desktop-Version des KI-Agenten „MiClaw“ (Krabbe) nun auf der Entwicklungs-Roadmap ste
OpenAI nimmt sein Robotikgeschäft wieder auf, Automan sucht Ingenieure für die Forschung und Entwicklung im Bereich Infrastruktur OpenAI nimmt sein Robotikgeschäft wieder auf, Automan sucht Ingenieure für die Forschung und Entwicklung im Bereich Infrastruktur Am 1. Juni gab Sam Altman, CEO von OpenAI, in den sozialen Medien bekannt, dass das Unternehmen wieder in den Bereich Robotik einsteigt, und veröffentlichte Stellenangebote für das OpenAI-Robotikteam.
Bain prognostiziert einen SaaS-Markt im Wert von 100 Milliarden US-Dollar im Bereich der agentenbasierten KI-Automatisierung Bain prognostiziert einen SaaS-Markt im Wert von 100 Milliarden US-Dollar im Bereich der agentenbasierten KI-Automatisierung Bain & Company schätzt den Markt für SaaS-Unternehmen, die agentische KI nutzen, in den USA auf 100 Milliarden US-Dollar. Das Unternehmen erklärte, dieser Markt entstamme der Automatisierung von Koord
Empfehlungen zu verwandten Spezialthemen
Code Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys
Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys

Entdecken Sie die besten KI-Code-Reviewer des Jahres 2026 auf XIX.AI. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools zur Automatisierung der Einhaltung von Clean-Code-Standards und zur Refaktorisierung von Dateien in älteren Repositorys. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Sichern Sie sich noch heute Ihren KI-Vorsprung.

10 Tools
xix.ai
Text-zu-Sprache Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern
Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern

Entdecken Sie die besten KI-TTS-Apps des Jahres 2026, die speziell zur Unterstützung bei Legasthenie ausgewählt wurden. In unseren Experten-Rankings vergleichen wir kostenlose und kostenpflichtige Tools und stellen leistungsstarke Funktionen für mehr Leseeffizienz und besseren Lernerfolg vor. Entdecken Sie bahnbrechende Lösungen, die Sie unbedingt ausprobieren sollten, um das Potenzial Ihrer Schüler voll auszuschöpfen. Beginnen Sie Ihre Reise bei XIX.AI.

10 Tools
xix.ai
Comic-Erstellung Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte
Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte

Entdecken Sie bei XIX.AI die besten KI-Generatoren für Shonen-Manga des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools zur Erstellung actiongeladener Sequenzen und dynamischer Energieeffekte. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie Ihr kreatives Potenzial und beginnen Sie noch heute mit der Gestaltung epischer Manga!

15 Tools
xix.ai
Geschäft Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren
Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools
xix.ai
Geschäft Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren
Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools
xix.ai
Produktivität KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern
KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern

Entdecken Sie auf XIX.AI die besten KI-basierten Coaches für persönliches Wohlbefinden und Konzentration des Jahres 2026. Unsere sorgfältig zusammengestellte Rangliste umfasst erstklassige, bahnbrechende Tools zur Bewältigung von Burnout und zur Steigerung der mentalen Energie. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schlagen Sie noch heute den Weg zu höchster Produktivität und Wohlbefinden ein.

10 Tools
xix.ai
Kommentare (0)
0/500
OR