Alibaba Tongyi stellt Sprachmodell mit „FreeStyle”-Steuerung in natürlicher Sprache vor

Heim

Nachricht

7. März 2026

RogerLee

Heute stellte das Speech Team von Alibaba Tongyi Lab zwei bahnbrechende Sprachgenerierungsmodelle vor: Fun-CosyVoice3.5 und Fun-AudioGen-VD. Das herausragende Merkmal dieser Modelle ist ihre Unterstützung für „FreeStyle”-Befehle. Anstelle komplexer Parametereinstellungen können Benutzer mit einfachen Beschreibungen in natürlicher Sprache den Ausdruck der Stimme präzise steuern oder komplexe Audioszenen von Grund auf neu erstellen.

Jedes Modell dient unterschiedlichen Zwecken:

Fun-CosyVoice3.5: Mehrsprachige Replikation und fein abgestimmte Steuerung

Diese verbesserte Version von CosyVoice erzielt grundlegende Durchbrüche beim Verständnis der Nuancen des Sprachausdrucks.

Befehlgesteuerte Generierung: Benutzer können Anweisungen wie „sprich selbstbewusster” oder „verlangsame mit emotionaler Variation” eingeben, um die Stimme in Echtzeit anzupassen.

Spracherweiterung: Durch die zusätzliche Unterstützung für Thai, Indonesisch, Portugiesisch und Vietnamesisch bleibt die branchenführende Leistung in Bezug auf Transkriptionsgenauigkeit (WER) und Stimmähnlichkeit in 13 Sprachen erhalten.

Optimierung seltener Zeichen: Durch spezielles Training wurde die Fehlerquote für ungewöhnliche Zeichen von 15,2 % auf 5,3 %reduziert.

Leistungssteigerung: Die Latenz des ersten Pakets wurde um 35 % verringert, was die Flüssigkeit der Echtzeit-Interaktion erheblich verbessert.

Fun-AudioGen-VD: Umfassendes Sounddesign

Dieses Modell fungiert als „Audio-Regisseur“ und erzeugt integrierte Audiodaten, die „Charaktere + Umgebungen“ kombinieren.

Stimmenanpassung: Legen Sie Geschlecht, Alter, Akzent und detaillierte Eigenschaften wie „heisere, tiefe oder tiefe” Stimmen fest.

Emotionen und Rollenspiel: Simuliert Rollen wie Kundendienstmitarbeiter, Rundfunksprecher und Kinder und vermittelt sogar komplexe Zustände wie „äußerlich ruhig, innerlich angespannt“.

Immersive Umgebungen: Fügt Hintergrundgeräusche (Chaos auf dem Schlachtfeld, Gemurmel im Café) und räumliche Effekte (Kathedralenhall, Unterwasserakustik) für eine vollständige räumliche Simulation hinzu.

Tongyi Lab merkt an, dass diese Modelle die Erstellung hochwertiger Stimmen demokratisieren und leistungsstarke KI-Unterstützung für Podcasting, Spieleentwicklung und Film-Postproduktion bieten werden.

Verwandter Artikel

Ein Überblick über den neuen ETSI-Sicherheitsstandard für KI Die Norm ETSI EN 304 223 legt grundlegende Sicherheitsanforderungen für künstliche Intelligenz fest, die Organisationen in ihre Governance-Strukturen integrieren sollten.Da Unternehmen maschinelles Le

Gmail führt einen personalisierten KI-Posteingang, KI-Übersichten in der Suche und weitere Funktionen ein Google hat einen neuen, KI-gestützten Posteingang für Gmail eingeführt, der Ihnen einen personalisierten Überblick über Ihre Aufgaben bietet und Sie über wichtige Neuigkeiten auf dem Laufenden hält. D

Erste Baidu-Basis für die Erstellung von KI-Comic-Dramen in Shandong in Zibo eröffnet Am 27. April erreichte die Provinz Shandong mit der offiziellen Eröffnung ihrer ersten Baidu-KI-Produktionsstätte für Comic-Dramen am Pädagogischen College Zibo einen Meilenstein im Bereich der digita

Empfehlungen zu verwandten Spezialthemen

Comic-Erstellung

AI-Charakterprofiler: Erstellen detaillierte Hintergrundgeschichten und visuelle Referenzen für Manga-Hauptfiguren

2026: Die besten Tools für die Erstellung von AI-Charakterprofilen – Entdecken Sie hochbewertete Werkzeuge, mit denen Sie detaillierte Hintergrundgeschichten und visuelle Referenzen für Ihre Manga-Charaktere erstellen können. Unsere wöchentlich aktualisierte Liste vergleicht kostenlose und kostenpflichtige Optionen anhand tatsächlicher Tests. Finden Sie leistungsstarke Lösungen, die Ihr kreatives Arbeitsfluss optimieren und Ihnen helfen, fesselnde Charaktere zu entwickeln. Erfahren Sie mehr in den Rankings auf XIX.AI und nutzen Sie noch heute Ihren perfekten Helfer für Ihre Geschichtenerzählung.

10 Tools

xix.ai

Gesundheit Wellness

KI-Schwangerschaftsbegleiter: Erstellen Sie sichere Trainings- und Ernährungspläne für jedes einzelne Trimester

Entdecken Sie die besten KI-Schwangerschaftsbegleiter für 2026 und erhalten Sie sichere, individuell abgestimmte Trainings- und Ernährungspläne für jedes Trimester. Erhalten Sie erstklassige, sorgfältig ausgewählte Empfehlungen mit Vergleichen zwischen kostenlosen und kostenpflichtigen Angeboten sowie Einblicken aus der Praxis. Gestalten Sie Ihre Schwangerschaft so gesund wie möglich – mit dem Expertenratgeber von XIX.AI. Jetzt entdecken.

10 Tools

xix.ai

Schreiben

Die besten kostenlosen KI-Generatoren, die nicht als solche erkennbar sind: Verwandeln Sie roboterhafte Entwürfe in natürliche, menschenähnliche Texte

Entdecken Sie bei XIX.AI die besten kostenlosen, nicht nachweisbaren KI-Schreibassistenten des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter hilft Ihnen dabei, maschinell erstellte Entwürfe in natürliche, menschenähnliche Texte umzuwandeln. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Sichern Sie sich noch heute Ihren Vorsprung beim KI-Schreiben.

10 Tools

xix.ai

Bildbearbeitung

KI-gestützte Kunstgeneratoren für Kurzdramen-Storyboarding: Charaktere aus Fantasy- und Stadtliebesgeschichten

2026 Neuestes: Entdecken Sie die besten KI-Kunstgeneratoren für Storyboards zu Kurzgeschichten. Unsere sorgfältig ausgewählte Liste enthält hochbewertete Tools zur Erstellung fesselnder Charaktere in Fantasy- und Urban-Romance-Geschichten. Vergleichen Sie kostenlose und kostenpflichtige Optionen, sehen Sie sich tatsächliche Testergebnisse an und finden Sie den perfekten kreativen Partner für Ihre Projekte. Erhalten Sie wöchentlich aktualisierte Rankings sowie Expertenmeinungen von XIX.AI. Beginnen Sie noch heute, Ihre Geschichten visuell zu gestalten!

10 Tools

xix.ai

Schreiben

Die besten AI-Skripting-Tools für Radio und Podcasting: Erstellen Sie ansprechende Audowerbung.

Entdecken Sie die besten KI-Skripting-Tools für Radio und Podcasting im Jahr 2026 bei XIX.AI. Unsere sorgfältig ausgewählte, hochbewertete Liste bietet leistungsstarke Lösungen, mit denen Sie ansprechende Audio-Werbespots schnell erstellen können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von tatsächlichen Tests sowie wöchentlich aktualisierten Rankings. Entfalten Sie noch heute Ihr kreatives Potenzial!

10 Tools

xix.ai

Geschäft

Die beste KI-Software zur Vertragsprüfung: Erkennen Sie rechtliche Lücken und Compliance-Risiken sofort

Entdecken Sie auf XIX.AI die beste KI-Software zur Vertragsprüfung für 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools, die rechtliche Lücken und Compliance-Risiken sofort aufdecken. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihre bahnbrechende Lösung für eine sichere und effiziente Vertragsanalyse. Entdecken Sie jetzt den ultimativen Leitfaden.

10 Tools

xix.ai