Option
Heim
Nachricht
Hume AI veröffentlicht TADA: eine Open-Source-Sprachausgabe für Mobilgeräte mit fünffacher Geschwindigkeit und ohne Halluzinationen

Hume AI veröffentlicht TADA: eine Open-Source-Sprachausgabe für Mobilgeräte mit fünffacher Geschwindigkeit und ohne Halluzinationen

18. März 2026
109

Hume AI veröffentlicht TADA: eine Open-Source-Sprachausgabe für Mobilgeräte mit fünffacher Geschwindigkeit und ohne Halluzinationen

Hume AI hat sein neuestes Sprachgenerierungsmodell, TADA (Text-Acoustic Dual Alignment), als Open-Source-Software veröffentlicht. Dieses Text-to-Speech-System (TTS), das auf einem großen Sprachmodell basiert, nutzt eine innovative Architektur mit doppelter Ausrichtung für Text und Akustik. Dieser Ansatz steigert die Effizienz und Zuverlässigkeit der Generierung erheblich und erweitert das Spektrum der praktischen Anwendungsmöglichkeiten.

Wie offiziell dargelegt, stellt TADA eine strikte 1:1-Synchronisation zwischen Text-Tokens und akustischen Darstellungen her. Diese Architektur löst das häufige Problem der Halluzination von Inhalten auf Token-Ebene, das bei herkömmlichen LLM-basierten TTS-Systemen auftritt, vollständig. In Evaluierungen mit über 1.000 Testbeispielen zeigte das Modell keinerlei Fälle von Inhaltshalluzinationen.

Was die Leistung betrifft, generiert TADA Audio mehr als fünfmal schneller als vergleichbare LLM-TTS-Systeme. Es arbeitet zudem mit bemerkenswerter Ressourceneffizienz und benötigt nur 2–3 Frames an Rechenressourcen pro Sekunde Audio. Im Gegensatz dazu benötigen herkömmliche Lösungen typischerweise zwischen 12,5 und 75 Frames. Diese Effizienz ermöglicht es dem Modell, lokale Inferenz auf Hardware mit geringem Stromverbrauch wie Smartphones und Edge-Geräten auszuführen, wodurch Cloud-Server überflüssig werden.

TADA bietet mehrsprachige Unterstützung, einschließlich Chinesisch, wobei die mehrsprachigen Versionen auf der Parameterskala von Llama3.23B basieren. Die Veröffentlichung umfasst vortrainierte 1B- (hauptsächlich für Englisch) und 3B-Mehrsprachenmodelle. Mit einem Kontextfenster von 2048 Tokens kann das Modell in einem einzigen Durchlauf etwa 700 Sekunden kontinuierlichen Ton generieren. Diese Fähigkeit übertrifft herkömmliche Lösungen bei weitem, die unter denselben Token-Beschränkungen typischerweise auf etwa 70 Sekunden begrenzt sind.

Eine wichtige Neuerung ist die Funktion zur synchronen Transkription. Während der Sprachgenerierung gibt das Modell gleichzeitig die entsprechende Text-Transkription aus. Dieser Prozess macht einen separaten, zusätzlichen Schritt der automatischen Spracherkennung (ASR) überflüssig, was zu einer Latenz von null bei der Textausgabe führt. Diese Funktionalität ist besonders wertvoll für Echtzeit-Untertitelung, Sprachinteraktionssysteme und Tools zur Inhaltserstellung.

In subjektiven Bewertungen durch Menschen belegte TADA sowohl bei der Natürlichkeit als auch bei der Stimmähnlichkeit den zweiten Platz. Es übertraf mehrere Systeme mit einer größeren Anzahl von Parametern und umfangreicheren Trainingsdaten und zeigte dabei eine äußerst wettbewerbsfähige Audioqualität.

Link: https://huggingface.co/collections/HumeAI/tada

Verwandter Artikel
Das MIIT bittet die Öffentlichkeit um Rückmeldungen zu 121 Branchenstandards, darunter auch das Protokoll zum Kontext von KI-Modellen. Das MIIT bittet die Öffentlichkeit um Rückmeldungen zu 121 Branchenstandards, darunter auch das Protokoll zum Kontext von KI-Modellen. Das chinesische Ministerium für Industrie und Informationstechnologie hat offiziell eine Mitteilung veröffentlicht, in der es die Öffentlichkeit um Rückmeldungen zu 121 Standardisierungsprojekten im Industriebereich bittet, darunter auch die „Anforde
OpenAI arbeitet mit dem US-Verteidigungsministerium zusammen – Die Zahl der Deinstallierungen von ChatGPT steigt um 295 Prozent OpenAI arbeitet mit dem US-Verteidigungsministerium zusammen – Die Zahl der Deinstallierungen von ChatGPT steigt um 295 Prozent Öffentliche Empörung: OpenAI’s Militärpartnerschaft löst eine Welle von Abmeldungen ausKürzlich kündigte der führende KI-Anbieter OpenAI eine enge Partnerschaft mit dem US-Verteidigungsministerium an, bei der seine KI-Modelle in hochgeheime militäri
OpenAI führt die „Sites“-Funktion ein und läutet mit den auf Word basierenden Websites das Ende der No-Code-Ära ein OpenAI führt die „Sites“-Funktion ein und läutet mit den auf Word basierenden Websites das Ende der No-Code-Ära ein OpenAI hat „Sites“ vorgestellt, eine neue Funktion für „Codex“, seine KI für die Softwareentwicklung. Die Funktion befindet sich derzeit in der Vorschauphase und steht nur zahlenden Business- und Ente
Empfehlungen zu verwandten Spezialthemen
Videoerstellung Die besten KI-Plattformen für die Umwandlung von Text in Video zum Verfassen von Drehbüchern und für visuelles Storytelling
Die besten KI-Plattformen für die Umwandlung von Text in Video zum Verfassen von Drehbüchern und für visuelles Storytelling

Die besten KI-Plattformen für die Umwandlung von Text in Video im Jahr 2026: Erstklassige Tools für das Verfassen von Drehbüchern und visuelles Storytelling. Entdecken Sie leistungsstarke, bahnbrechende Lösungen, mit denen Sie Ihren Text in fesselnde Videos verwandeln können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand unserer wöchentlich aktualisierten Ranglisten und Praxistests. Finden Sie die perfekte Plattform, um Ihre Kreativität und Produktivität zu steigern. Entdecken Sie die sorgfältig zusammengestellte Auswahl bei XIX.AI.

10 Tools
xix.ai
Chatbot KI-Multi-Agent-Orchestratoren: Gestaltung komplexer automatisierter Arbeitsabläufe mithilfe natürlicher Sprache
KI-Multi-Agent-Orchestratoren: Gestaltung komplexer automatisierter Arbeitsabläufe mithilfe natürlicher Sprache

2026 Neuestes: Entdecken Sie die besten AI-Multi-Agenten-Orchestratoren, um mithilfe natürlicher Sprache komplexe automatisierte Arbeitsabläufe zu gestalten. Unsere sorgfältig ausgewählte Liste enthält hochbewertete, leistungsstarke Plattformen für reibungslose Aufgabenerstellung und intelligente Prozessverwaltung. Vergleichen Sie kostenlose und kostenpflichtige Optionen unter Berücksichtigung praktischer Erfahrungen. Nutzen Sie die wöchentlich aktualisierten Rankings von XIX.AI, um einen Vorsprung durch künstliche Intelligenz zu erlangen.

10 Tools
xix.ai
Bildbearbeitung Die besten AI-Softwarelösungen zur Geräuschreduzierung: Beseitigen Sie Körnchen und Artefakte in Nachtaufnahmen bei schwachem Licht.
Die besten AI-Softwarelösungen zur Geräuschreduzierung: Beseitigen Sie Körnchen und Artefakte in Nachtaufnahmen bei schwachem Licht.

Entdecken Sie die besten KI-basierten Softwarelösungen zur Rauschreduzierung für Nachtfotografie in schwach beleuchteten Umgebungen im Jahr 2026. Unsere hochrangig bewertete, sorgfältig ausgewählte Liste vergleicht kostenlose und kostenpflichtige Tools und enthält Ergebnisse aus realen Tests sowie wöchentlich aktualisierte Ranglisten. Entfernen Sie mühelos Unreinheiten und Artefakte aus Ihren Bildern – eröffnen Sie mit XIX.AI den Vorteil der KI-Technologie für Ihre Fotografie.

10 Tools
xix.ai
Chatbot Die besten Generatoren für individuelle KI-Freundinnen: Entwirf einzigartige Persönlichkeiten, Hobbys und Hintergrundgeschichten
Die besten Generatoren für individuelle KI-Freundinnen: Entwirf einzigartige Persönlichkeiten, Hobbys und Hintergrundgeschichten

Entdecken Sie auf XIX.AI die besten Generatoren für individuelle KI-Freundinnen des Jahres 2026. Stöbern Sie in unserer sorgfältig zusammengestellten Liste der besten Angebote, um einzigartige Persönlichkeiten, Hobbys und tiefgründige Hintergrundgeschichten zu entwerfen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Holen Sie sich noch heute Ihre perfekte kreative Begleiterin.

10 Tools
xix.ai
Produktivität Entwickler von KI-Architekturen: Erstellen Sie skalierbare Systemarchitekturen mithilfe natürlicher Sprache
Entwickler von KI-Architekturen: Erstellen Sie skalierbare Systemarchitekturen mithilfe natürlicher Sprache

Entdecken Sie auf XIX.AI die besten Tools für den Entwurf von KI-Architekturen im Jahr 2026. Unsere sorgfältig zusammengestellte Liste der Top-Bewertungen umfasst leistungsstarke, bahnbrechende Lösungen für die Erstellung skalierbarer Systemarchitekturen mithilfe natürlicher Sprache. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schöpfen Sie das Potenzial Ihrer KI voll aus und optimieren Sie noch heute Ihre Entwicklungsprozesse.

10 Tools
xix.ai
Comic-Erstellung AI-Charakterprofiler: Erstellen detaillierte Hintergrundgeschichten und visuelle Referenzen für Manga-Hauptfiguren
AI-Charakterprofiler: Erstellen detaillierte Hintergrundgeschichten und visuelle Referenzen für Manga-Hauptfiguren

2026: Die besten Tools für die Erstellung von AI-Charakterprofilen – Entdecken Sie hochbewertete Werkzeuge, mit denen Sie detaillierte Hintergrundgeschichten und visuelle Referenzen für Ihre Manga-Charaktere erstellen können. Unsere wöchentlich aktualisierte Liste vergleicht kostenlose und kostenpflichtige Optionen anhand tatsächlicher Tests. Finden Sie leistungsstarke Lösungen, die Ihr kreatives Arbeitsfluss optimieren und Ihnen helfen, fesselnde Charaktere zu entwickeln. Erfahren Sie mehr in den Rankings auf XIX.AI und nutzen Sie noch heute Ihren perfekten Helfer für Ihre Geschichtenerzählung.

10 Tools
xix.ai
Kommentare (1)
0/500
NicholasLee
NicholasLee 29. April 2026 02:00:51 MESZ

TADA的開源真是業界良心!5倍速且無幻覺,這對需要即時語音合成的開發者來說太實用了。不過好奇它在複雜中文聲調的表現如何?有人測試過嗎?🤔

OR