ElevenLabs setzt neue Maßstäbe bei der Sprach-zu-Text-Umwandlung; Google Gemini folgt mit umfassenden Funktionen

Heim

Nachricht

17. März 2026

KennethJones

136

Artificial Analysis hat die neueste Version seines Sprach-zu-Text-Benchmarks, AA-WER v2.0, veröffentlicht. Die Ergebnisse zeigen, dass ElevenLabs und Google bei der Leistung der Audio-Transkription klar an der Spitze liegen.

Gemessen an der Kern-Wortfehlerrate (WER) erreichte ElevenLabs' Scribe v2 mit einer beeindruckend niedrigen Fehlerquote von 2,3 % den ersten Platz. Dicht dahinter lag Googles Gemini3Pro mit 2,9 %. Es ist erwähnenswert, dass Google Gemini nicht speziell für die Transkription optimiert hat; dieses Ergebnis beruht ausschließlich auf seinen robusten multimodalen allgemeinen Fähigkeiten.

Andere führende Modelle erzielten folgende Ergebnisse:

Mistral Voxtral Small: Belegte mit einer Fehlerquote von 3,0 % den dritten Platz.

Google Gemini3Flash: Zeigte mit einer Fehlerquote von 3,1 % eine solide Leistung.

OpenAI Whisper Large v3: Das am weitesten verbreitete Open-Source-Modell landete mit einer Fehlerquote von 4,2 % im Mittelfeld.

Die Schlusslichter: Alibabas Qwen3ASR Flash (5,9 %), Amazons Nova2Omni (6,0 %) und Rev AI (6,1 %) bildeten das Schlusslicht der Rangliste.

Im speziellen AA-AgentTalk-Benchmark für Sprachassistenzbefehle blieb die Rangliste unverändert. ElevenLabs’ Scribe v2 und Googles Gemini3Pro behielten mit Fehlerquoten von 1,6 % bzw. 1,7 % ihre Führung und erwiesen sich als äußerst zuverlässig bei kurzen, direkten Sprachinteraktionen.

Verwandter Artikel

OpenAI-Chef Altman kritisiert Anthropic scharf für panikgetriebene Marketingstrategien Der anhaltende öffentliche Streit zwischen den KI-Marktführern OpenAI und Anthropic hat sich verschärft. Sam Altman, CEO von OpenAI, hat kürzlich in einem Podcast das neueste Sicherheitsmodell seines

Cursor AI, ein Startup im Bereich Programmierung, will nach einer bedeutenden Investition von SpaceX 200 Mitarbeiter im asiatisch-pazifischen Raum einstellen Das KI-Coding-Startup Cursor hat eine umfassende globale Expansion angekündigt und plant, in den nächsten sechs Monaten 200 Mitarbeiter im asiatisch-pazifischen Raum einzustellen. Zu den wichtigsten P

Claude wurde zur Erstellung bösartiger npm-Pakete genutzt: Über 670 kompromittierte Pakete gefährden Open Source Ein kürzlich aufgetretener Cybersicherheitsvorfall zeigt, wie große Sprachmodelle (LLMs) für die Entwicklung von Schadsoftware missbraucht werden. Der Sicherheitsforscher Sibi Moosa entdeckte einen An

Empfehlungen zu verwandten Spezialthemen

Animationserstellung

AI-Anime-Generator für Donghua: Erstellen Sie Charaktere für Web-Romane und Comic-Avatare

Entdecken Sie die besten AI-Anime-Generatoren für Donghua im Jahr 2026. Unsere hochbewertete, sorgfältig ausgewählte Liste bietet leistungsstarke Tools, mit denen Sie atemberaubende Charaktere für Webromane und Comic-Avatare erstellen können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand realer Tests. Finden Sie Ihren perfekten kreativen Partner und bringen Sie Ihre Geschichten noch heute bei XIX.AI zum Leben.

10 Tools

xix.ai

Comic-Erstellung

Die besten KI-Tools zur automatischen Kolorierung von Manga: Flache Farben ohne Konsistenzfehler anwenden

Entdecken Sie bei XIX.AI die besten KI-Tools zur automatischen Kolorierung von Manga für das Jahr 2026. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Lösungen, die flächige Farben ohne Konsistenzfehler auftragen und so Ihre Produktivität steigern. Entdecken Sie Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten, Praxistests und wöchentlich aktualisierte Rankings, um das für Sie perfekte Tool zu finden. Nutzen Sie noch heute Ihren KI-Vorteil.

10 Tools

xix.ai

Schreiben

Die besten KI-Profilersteller: Erstellen Sie konsistente Charaktermotivationen und fatale Schwächen

Entdecken Sie die besten KI-Tools zur Charakterentwicklung für 2026, mit denen Sie facettenreiche Figuren erschaffen können. Die von XIX.AI zusammengestellte Liste enthält erstklassige, bahnbrechende Tools, die konsistente Motivationen und fatale Schwächen generieren. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie jetzt Ihr Potenzial als Geschichtenerzähler.

10 Tools

xix.ai

Geschäft

Die beste Software zur Preisoptimierung mittels KI: Beobachten Sie die Konkurrenz und passen Sie Ihre Shop-Preise automatisch an

Entdecken Sie auf XIX.AI die beste Software zur Preisoptimierung mittels KI für 2026. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools, die Ihre Mitbewerber beobachten und Ihre Shop-Preise automatisch anpassen, um den maximalen Gewinn zu erzielen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Sichern Sie sich jetzt Ihren Preisvorteil.

10 Tools

xix.ai

Code

Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys

Entdecken Sie die besten KI-Code-Reviewer des Jahres 2026 auf XIX.AI. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools zur Automatisierung der Einhaltung von Clean-Code-Standards und zur Refaktorisierung von Dateien in älteren Repositorys. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Sichern Sie sich noch heute Ihren KI-Vorsprung.

10 Tools

xix.ai

Text-zu-Sprache

Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern

Entdecken Sie die besten KI-TTS-Apps des Jahres 2026, die speziell zur Unterstützung bei Legasthenie ausgewählt wurden. In unseren Experten-Rankings vergleichen wir kostenlose und kostenpflichtige Tools und stellen leistungsstarke Funktionen für mehr Leseeffizienz und besseren Lernerfolg vor. Entdecken Sie bahnbrechende Lösungen, die Sie unbedingt ausprobieren sollten, um das Potenzial Ihrer Schüler voll auszuschöpfen. Beginnen Sie Ihre Reise bei XIX.AI.

10 Tools

xix.ai

Kommentare (1)

0/500

Bitte melden Sie sich zuerst an

LiamWalker

14. Mai 2026 14:00:20 MESZ

Just tried ElevenLabs' API and the accuracy is insane for my podcast clips! Gemini being close behind means we're finally getting real competition in this space. Can't wait to see prices drop as they fight it out. 🎧

Top -Nachrichten

AI Builder und Power Automate Revolutionieren die Dokumentenzusammenfassung KI -Hosts des Notebooklm -Podcasts, das jetzt für Interviews verfügbar ist China stellt nationale Standards für humanoide Roboter und verkörperte Intelligenz vor Ramp-Daten zeigen, dass die Akzeptanz von KI in Unternehmen sinkt Bing Image Creator Tutorial: Anleitung zur KI-Kunstgenerierung Lernen Sie, AI-Musik mit Ihrer Stimme zu erstellen: ein Schritt-für-Schritt-Suno-Tutorial iMyFone MagicMic: Echtzeit-AI-Stimmerveränderer Bewertung und Tutorial Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen DeepSeek V4 revolutioniert multimodale KI Embodied Intelligence stellt ersten Branchenstandard zur Eindämmung unkontrollierten Wachstums vor

Mehr

Vorgestellt