Option
Heim
Nachricht
Alibaba Tongyi stellt Sprachmodell mit „FreeStyle”-Steuerung in natürlicher Sprache vor

Alibaba Tongyi stellt Sprachmodell mit „FreeStyle”-Steuerung in natürlicher Sprache vor

7. März 2026
91

Heute stellte das Speech Team von Alibaba Tongyi Lab zwei bahnbrechende Sprachgenerierungsmodelle vor: Fun-CosyVoice3.5 und Fun-AudioGen-VD. Das herausragende Merkmal dieser Modelle ist ihre Unterstützung für „FreeStyle”-Befehle. Anstelle komplexer Parametereinstellungen können Benutzer mit einfachen Beschreibungen in natürlicher Sprache den Ausdruck der Stimme präzise steuern oder komplexe Audioszenen von Grund auf neu erstellen.

image.png

Jedes Modell dient unterschiedlichen Zwecken:

Fun-CosyVoice3.5: Mehrsprachige Replikation und fein abgestimmte Steuerung

Diese verbesserte Version von CosyVoice erzielt grundlegende Durchbrüche beim Verständnis der Nuancen des Sprachausdrucks.

Befehlgesteuerte Generierung: Benutzer können Anweisungen wie „sprich selbstbewusster” oder „verlangsame mit emotionaler Variation” eingeben, um die Stimme in Echtzeit anzupassen.

Spracherweiterung: Durch die zusätzliche Unterstützung für Thai, Indonesisch, Portugiesisch und Vietnamesisch bleibt die branchenführende Leistung in Bezug auf Transkriptionsgenauigkeit (WER) und Stimmähnlichkeit in 13 Sprachen erhalten.

Optimierung seltener Zeichen: Durch spezielles Training wurde die Fehlerquote für ungewöhnliche Zeichen von 15,2 % auf 5,3 %reduziert.

Leistungssteigerung: Die Latenz des ersten Pakets wurde um 35 % verringert, was die Flüssigkeit der Echtzeit-Interaktion erheblich verbessert.

Fun-AudioGen-VD: Umfassendes Sounddesign

Dieses Modell fungiert als „Audio-Regisseur“ und erzeugt integrierte Audiodaten, die „Charaktere + Umgebungen“ kombinieren.

Stimmenanpassung: Legen Sie Geschlecht, Alter, Akzent und detaillierte Eigenschaften wie „heisere, tiefe oder tiefe” Stimmen fest.

Emotionen und Rollenspiel: Simuliert Rollen wie Kundendienstmitarbeiter, Rundfunksprecher und Kinder und vermittelt sogar komplexe Zustände wie „äußerlich ruhig, innerlich angespannt“.

Immersive Umgebungen: Fügt Hintergrundgeräusche (Chaos auf dem Schlachtfeld, Gemurmel im Café) und räumliche Effekte (Kathedralenhall, Unterwasserakustik) für eine vollständige räumliche Simulation hinzu.

Tongyi Lab merkt an, dass diese Modelle die Erstellung hochwertiger Stimmen demokratisieren und leistungsstarke KI-Unterstützung für Podcasting, Spieleentwicklung und Film-Postproduktion bieten werden.

Verwandter Artikel
Ein Überblick über den neuen ETSI-Sicherheitsstandard für KI Ein Überblick über den neuen ETSI-Sicherheitsstandard für KI Die Norm ETSI EN 304 223 legt grundlegende Sicherheitsanforderungen für künstliche Intelligenz fest, die Organisationen in ihre Governance-Strukturen integrieren sollten.Da Unternehmen maschinelles Le
Gmail führt einen personalisierten KI-Posteingang, KI-Übersichten in der Suche und weitere Funktionen ein Gmail führt einen personalisierten KI-Posteingang, KI-Übersichten in der Suche und weitere Funktionen ein Google hat einen neuen, KI-gestützten Posteingang für Gmail eingeführt, der Ihnen einen personalisierten Überblick über Ihre Aufgaben bietet und Sie über wichtige Neuigkeiten auf dem Laufenden hält. D
Erste Baidu-Basis für die Erstellung von KI-Comic-Dramen in Shandong in Zibo eröffnet Erste Baidu-Basis für die Erstellung von KI-Comic-Dramen in Shandong in Zibo eröffnet Am 27. April erreichte die Provinz Shandong mit der offiziellen Eröffnung ihrer ersten Baidu-KI-Produktionsstätte für Comic-Dramen am Pädagogischen College Zibo einen Meilenstein im Bereich der digita
Empfehlungen zu verwandten Spezialthemen
Comic-Erstellung AI-Charakterprofiler: Erstellen detaillierte Hintergrundgeschichten und visuelle Referenzen für Manga-Hauptfiguren
AI-Charakterprofiler: Erstellen detaillierte Hintergrundgeschichten und visuelle Referenzen für Manga-Hauptfiguren

2026: Die besten Tools für die Erstellung von AI-Charakterprofilen – Entdecken Sie hochbewertete Werkzeuge, mit denen Sie detaillierte Hintergrundgeschichten und visuelle Referenzen für Ihre Manga-Charaktere erstellen können. Unsere wöchentlich aktualisierte Liste vergleicht kostenlose und kostenpflichtige Optionen anhand tatsächlicher Tests. Finden Sie leistungsstarke Lösungen, die Ihr kreatives Arbeitsfluss optimieren und Ihnen helfen, fesselnde Charaktere zu entwickeln. Erfahren Sie mehr in den Rankings auf XIX.AI und nutzen Sie noch heute Ihren perfekten Helfer für Ihre Geschichtenerzählung.

10 Tools
xix.ai
Gesundheit Wellness KI-Schwangerschaftsbegleiter: Erstellen Sie sichere Trainings- und Ernährungspläne für jedes einzelne Trimester
KI-Schwangerschaftsbegleiter: Erstellen Sie sichere Trainings- und Ernährungspläne für jedes einzelne Trimester

Entdecken Sie die besten KI-Schwangerschaftsbegleiter für 2026 und erhalten Sie sichere, individuell abgestimmte Trainings- und Ernährungspläne für jedes Trimester. Erhalten Sie erstklassige, sorgfältig ausgewählte Empfehlungen mit Vergleichen zwischen kostenlosen und kostenpflichtigen Angeboten sowie Einblicken aus der Praxis. Gestalten Sie Ihre Schwangerschaft so gesund wie möglich – mit dem Expertenratgeber von XIX.AI. Jetzt entdecken.

10 Tools
xix.ai
Schreiben Die besten kostenlosen KI-Generatoren, die nicht als solche erkennbar sind: Verwandeln Sie roboterhafte Entwürfe in natürliche, menschenähnliche Texte
Die besten kostenlosen KI-Generatoren, die nicht als solche erkennbar sind: Verwandeln Sie roboterhafte Entwürfe in natürliche, menschenähnliche Texte

Entdecken Sie bei XIX.AI die besten kostenlosen, nicht nachweisbaren KI-Schreibassistenten des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter hilft Ihnen dabei, maschinell erstellte Entwürfe in natürliche, menschenähnliche Texte umzuwandeln. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Sichern Sie sich noch heute Ihren Vorsprung beim KI-Schreiben.

10 Tools
xix.ai
Bildbearbeitung KI-gestützte Kunstgeneratoren für Kurzdramen-Storyboarding: Charaktere aus Fantasy- und Stadtliebesgeschichten
KI-gestützte Kunstgeneratoren für Kurzdramen-Storyboarding: Charaktere aus Fantasy- und Stadtliebesgeschichten

2026 Neuestes: Entdecken Sie die besten KI-Kunstgeneratoren für Storyboards zu Kurzgeschichten. Unsere sorgfältig ausgewählte Liste enthält hochbewertete Tools zur Erstellung fesselnder Charaktere in Fantasy- und Urban-Romance-Geschichten. Vergleichen Sie kostenlose und kostenpflichtige Optionen, sehen Sie sich tatsächliche Testergebnisse an und finden Sie den perfekten kreativen Partner für Ihre Projekte. Erhalten Sie wöchentlich aktualisierte Rankings sowie Expertenmeinungen von XIX.AI. Beginnen Sie noch heute, Ihre Geschichten visuell zu gestalten!

10 Tools
xix.ai
Schreiben Die besten AI-Skripting-Tools für Radio und Podcasting: Erstellen Sie ansprechende Audowerbung.
Die besten AI-Skripting-Tools für Radio und Podcasting: Erstellen Sie ansprechende Audowerbung.

Entdecken Sie die besten KI-Skripting-Tools für Radio und Podcasting im Jahr 2026 bei XIX.AI. Unsere sorgfältig ausgewählte, hochbewertete Liste bietet leistungsstarke Lösungen, mit denen Sie ansprechende Audio-Werbespots schnell erstellen können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von tatsächlichen Tests sowie wöchentlich aktualisierten Rankings. Entfalten Sie noch heute Ihr kreatives Potenzial!

10 Tools
xix.ai
Geschäft Die beste KI-Software zur Vertragsprüfung: Erkennen Sie rechtliche Lücken und Compliance-Risiken sofort
Die beste KI-Software zur Vertragsprüfung: Erkennen Sie rechtliche Lücken und Compliance-Risiken sofort

Entdecken Sie auf XIX.AI die beste KI-Software zur Vertragsprüfung für 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools, die rechtliche Lücken und Compliance-Risiken sofort aufdecken. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihre bahnbrechende Lösung für eine sichere und effiziente Vertragsanalyse. Entdecken Sie jetzt den ultimativen Leitfaden.

10 Tools
xix.ai
Kommentare (0)
0/500
OR