ElfLabs enthüllt ein neues Sprach-zu-Text-Modell

Heim

Nachricht

10. April 2025

EllaJohnson

185

# deepgram # Gladia

ElevenLabs, ein KI-Startup, das kürzlich beeindruckende 180 Millionen Dollar an Finanzierung erhalten hat, ist bekannt für seine Fähigkeiten in der Audioerzeugung. Jetzt haben sie einen mutigen Schritt in neues Terrain gewagt, indem sie ihr erstes eigenständiges Sprach-zu-Text-Modell namens Scribe auf den Markt gebracht haben.

Mit einem Wert von 3,3 Milliarden Dollar ist ElevenLabs für viele Unternehmen, die Text-zu-Sprach-Dienste benötigen, eine erste Wahl, dank ihrer riesigen Sammlung von Stimmen. Nun richten sie ihren Fokus auf Spracherkennung und wollen es mit großen Namen wie Gladia, Speechmatics, AssemblyAI, Deepgram und den Whisper-Modellen von OpenAI aufnehmen.

Scribe macht keine halben Sachen – es unterstützt direkt ab Projektstart über 99 Sprachen. ElevenLabs sagt, es biete hervorragende Genauigkeit für über 25 Sprachen mit einer Wortfehlerrate von weniger als 5 %. Dazu gehören Englisch (mit einer angegebenen Genauigkeit von 97 %), Französisch, Deutsch, Hindi, Indonesisch, Japanisch, Kannada, Malayalam, Polnisch, Portugiesisch, Spanisch und Vietnamesisch, unter anderem. Die übrigen Sprachen fallen in verschiedene Genauigkeitskategorien: hoch (5 % bis 10 % Wortfehlerrate), gut (10 % bis 20 % Wortfehlerrate) und moderat (25 % bis 50 %).

Das Unternehmen behauptet, Scribe übertreffe Google Gemini 2.0 Flash und Whisper Large V3 in mehreren Sprachen, laut FLEURS- und Common-Voice-Benchmark-Tests.

Bildnachweis: ElevenLabs

ElevenLabs hat den Sprach-zu-Text-Teil bereits letztes Jahr für ihre KI-Konversationsagentenplattform entwickelt, aber Scribe ist ihr erster Versuch eines eigenständigen Spracherkennungsmodells. In einem Gespräch mit TechCrunch im letzten Monat verriet CEO Mati Staniszewski Details zu ihren Plänen, die Spracherkennungstechnologie zu verbessern.

„Wir wollen besser darin werden, zu verstehen, was du in einem Gespräch sagst. Wir konzentrieren uns nicht mehr nur auf das Generieren von Inhalten; wir bewegen uns hin zu Verständnis und Transkription von Sprache“, sagte Staniszewski. „Viele denken, Sprach-zu-Text ist nichts Neues, aber für viele Sprachen ist es immer noch ziemlich schwierig. Wir glauben, dass wir es besser machen können, weil wir interne Teams haben, die Daten labeln und uns schnelles Feedback geben.“

Scribe hat auch einige coole Funktionen, wie intelligente Sprecherzuordnung, um zu erkennen, wer spricht, Zeitstempel auf Wortebene für präzise Untertitel und automatische Markierung von Klangereignissen wie Publikumslachen. Außerdem ermöglicht ElevenLabs Kunden, Videoinhalte direkt zu transkribieren, um Untertitel oder Beschriftungen in ihrem Studio hinzuzufügen.

Derzeit funktioniert Scribe nur mit vorab aufgenommenem Audio. Aber keine Sorge, das Unternehmen sagt, dass sie bald an einer Version mit geringer Latenz für Echtzeit arbeiten. Also ist es noch nicht ganz bereit für Besprechungstranskripte oder Sprachnotizen.

ElevenLabs berechnet 0,40 Dollar pro Stunde transkribiertem Audio für Scribe. Das ist ein wettbewerbsfähiger Preis, aber einige Konkurrenten bieten günstigere Tarife für Audiotranskriptionen an, mit ein paar zusätzlichen Funktionen.

Verwandter Artikel

Die experimentelle KI „Claude“ von Anthropic wickelt in einem E-Commerce-Test Verhandlungen und Transaktionen ab Angesichts der rasanten Fortschritte im Bereich der künstlichen Intelligenz hat Anthropic am vergangenen Freitag still und leise ein internes Experiment namens „Project Deal“ gestartet, um das Potenzi

DeepSeek Code steht kurz vor der Markteinführung Angesichts der rasanten Entwicklung der KI-Technologie befindet sich DeepSeek an einem spannenden Wendepunkt. Das KI-Unternehmen gab kürzlich bekannt, dass es sich Finanzmittel in Höhe von über 70 Mil

Musks Grok: 1,5 Billionen Parameter und die Übernahme von Cursor-Code – bahnbrechende Neuerung oder nur ein Bluff? Elon Musk macht endlich einen Schritt.Im Wettlauf um die KI-Programmierung legen OpenAI und Anthropic einen Gang zu, während xAI hinterherzuhinken scheint. Musk hat oft sein Ziel bekräftigt, Claude Ko

Empfehlungen zu verwandten Spezialthemen

Geschäft

Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools

xix.ai

Produktivität

KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern

Entdecken Sie auf XIX.AI die besten KI-basierten Coaches für persönliches Wohlbefinden und Konzentration des Jahres 2026. Unsere sorgfältig zusammengestellte Rangliste umfasst erstklassige, bahnbrechende Tools zur Bewältigung von Burnout und zur Steigerung der mentalen Energie. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schlagen Sie noch heute den Weg zu höchster Produktivität und Wohlbefinden ein.

10 Tools

xix.ai

Chatbot

Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf

Entdecken Sie die besten KI-Romantik-Chatbots des Jahres 2026, mit denen Sie echte, langfristige Beziehungen aufbauen können. Unsere sorgfältig zusammengestellte Liste bietet Ihnen überzeugende, konsistente Persönlichkeiten, Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten sowie Tests aus der Praxis. Finden Sie Ihren perfekten Begleiter und legen Sie noch heute bei XIX.AI los.

10 Tools

xix.ai

Bildung und Lernen

Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.

Entdecken Sie die besten AI-Data-Science-Mentoren von 2026, um SQL, Pandas und ML-Arbeitsabläufe zu meistern. Erfahren Sie mehr über unsere hochbewerteten, sorgfältig ausgewählten Angebote bei XIX.AI – für effektive und bahnbrechende Anleitung. Vergleichen Sie kostenlose und bezahlte Optionen mit praktischen Einblicken aus der Praxis. Entfalten Sie Ihr Potenzial in der Data Science noch heute.

10 Tools

xix.ai

Chatbot

Die besten KI-Flirt- und Konversationstrainer: Steigere dein soziales Charisma und dein Selbstvertrauen in Echtzeit

Entdecken Sie auf XIX.AI die besten KI-Flirt- und Konversationstrainer des Jahres 2026. Unsere sorgfältig zusammengestellte, erstklassige Auswahl hilft Ihnen dabei, Ihr soziales Charisma und Ihr Selbstvertrauen in Echtzeit zu stärken. Entdecken Sie unverzichtbare, bahnbrechende Tools mit Vergleichen zwischen kostenlosen und kostenpflichtigen Angeboten sowie wöchentlich aktualisierten Rankings. Schaffen Sie sich noch heute einen sozialen Vorsprung.

10 Tools

xix.ai

Code

Die besten KI-Tools für automatisierte Einheitstests: Generieren Sie mit nur einem Klick Jest-, PyTest- und JUnit-Testfälle.

Entdecken Sie die neuesten, hochbewerteten KI-Tools von 2026 für den automatisierten Unit-Testing-Prozess. Unsere sorgfältig ausgewählten Lösungen bieten leistungsstarke und bahnbrechende Funktionen, um sofort Jest-, PyTest- und JUnit-Testfälle zu generieren. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von tatsächlichen Tests sowie wöchentlich aktualisierten Rankings auf XIX.AI. Entfalten Sie Ihr KI-Potenzial und steigern Sie noch heute die Produktivität Ihrer Entwicklungstätigkeit.

10 Tools

xix.ai

Kommentare (29)

0/500

Bitte melden Sie sich zuerst an

MiaDavis

5. September 2025 02:30:33 MESZ

스타트업이 이렇게 빠르게 성장하는 걸 보면 놀랍네요 ㅎㅎ 음성 분야는 경쟁이 심한데, ElevenLabs가 STT 시장에서도 성공할 수 있을까요? 투자금 1억 8천만 달러로 뭔가 특별한 기술을 만들겠죠? 🤔

LawrenceLopez

30. August 2025 22:30:33 MESZ

A ElevenLabs não para de inovar! Esse novo modelo de speech-to-text parece promissor, mas fico pensando... será que vai conseguir competir com gigantes como Google e OpenAI no mercado de transcrição? 🤔 Espero que ofereça algo único pra justificar o hype!

TimothyMartínez

21. August 2025 15:01:20 MESZ

Scribe sounds like a game-changer! I'm curious if it'll handle my thick accent as well as it claims. Excited to try it for podcast transcriptions! 😎

MatthewTaylor

12. August 2025 23:00:59 MESZ

Just saw ElevenLabs' Scribe model news—97% accuracy in English is wild! 😮 I'm curious how it'll handle my thick accent in meetings. Hope they drop that real-time version soon!

RogerRoberts

21. April 2025 03:44:55 MESZ

¡El Scribe de ElevenLabs es genial! Es increíble cómo han entrado en el mercado de voz a texto con un modelo tan sólido. Mi única queja es que a veces tiene problemas con acentos fuertes. Pero, para ser el primer intento, es bastante impresionante. ¡Sigan así, ElevenLabs! 🚀

RalphHill

20. April 2025 22:36:44 MESZ

O novo modelo Scribe do ElevenLabs é incrível! Eles passaram da geração de áudio para o reconhecimento de fala de forma tão suave. Testei e a precisão é boa, mas tropeça um pouco com sotaques fortes. Vale a pena conferir se você gosta de IA! 😊

Top -Nachrichten

AI Builder und Power Automate Revolutionieren die Dokumentenzusammenfassung KI -Hosts des Notebooklm -Podcasts, das jetzt für Interviews verfügbar ist China stellt nationale Standards für humanoide Roboter und verkörperte Intelligenz vor Ramp-Daten zeigen, dass die Akzeptanz von KI in Unternehmen sinkt Bing Image Creator Tutorial: Anleitung zur KI-Kunstgenerierung Lernen Sie, AI-Musik mit Ihrer Stimme zu erstellen: ein Schritt-für-Schritt-Suno-Tutorial iMyFone MagicMic: Echtzeit-AI-Stimmerveränderer Bewertung und Tutorial Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen DeepSeek V4 revolutioniert multimodale KI Embodied Intelligence stellt ersten Branchenstandard zur Eindämmung unkontrollierten Wachstums vor

Mehr

Vorgestellt