Speechify erweitert Chrome-Erweiterung um Spracheingabe und virtuellen Assistenten
Speechify ist vor allem als Tool zum Anhören von Artikeln, PDFs und Dokumenten bekannt. Das Unternehmen hat nun seine Chrome-Erweiterung um Stimmerkennungsfunktionen erweitert und Funktionen für die Spracheingabe und einen Sprachassistenten zur Beantwortung Ihrer Fragen eingeführt.
Im vergangenen Jahr gab es einen starken Anstieg bei den Spracherkennungs-Tools, was auf die erheblichen Verbesserungen bei der Qualität der Spracherkennungsmodelle zurückzuführen ist. Speechify macht sich diesen Trend zunutze und bringt sein eigenes Diktierwerkzeug auf den Markt, das zunächst die englische Sprache unterstützt. Ähnlich wie bei anderen Lösungen korrigiert die Spracheingabe von Speechify automatisch Fehler und entfernt Füllwörter.
Während meines kurzen Tests von etwas mehr als einem Tag habe ich festgestellt, dass das Tool von Speechify noch viel Raum für Verbesserungen hat. Es funktioniert zum Beispiel gut in Gmail und Google Docs, aber auf Websites wie WordPress hatte ich Probleme mit der Aktivierung der Sprachdiktierfunktion und einer zuverlässigen Leistung. Das Unternehmen gab an, dass es das Tool schrittweise für beliebte Websites optimiert.

Bildnachweis:Speechify Was die Genauigkeit angeht, so war die Wortfehlerrate des Tools höher als bei Konkurrenzprodukten wie Wispr Flow, Willow und Monologue. Speechify merkte an, dass sich sein Modell mit häufigerer Nutzung verbessert, was zu einer allmählichen Verringerung der Fehlerquote führt.
Das Startup führt auch einen Sprachassistenten ein, der über eine Seitenleiste im Browser zugänglich ist. Sie können ihm Fragen zu der von Ihnen angezeigten Webseite stellen, z. B. "Was sind die drei wichtigsten Punkte?" oder "Erklären Sie dies in einfacheren Worten".
ChatGPT und Gemini bieten zwar Konversations-Sprachmodi, aber Speechify argumentiert, dass diese Funktionen bei diesen Plattformen zweitrangig sind. Im Gegensatz dazu stellt das Startup die Sprachinteraktion in den Mittelpunkt seines eigenen Tools.
"Wir glauben, dass ein textbasierter Chat immer das Standard-Erlebnis sein wird, wenn Nutzer ChatGPT oder Gemini-Apps öffnen. Das ist es, was das Publikum erwartet. Die Sprachinteraktion wird wahrscheinlich eine sekundäre Funktion bleiben - oft ein nachträglicher Gedanke für diese Anbieter. Unsere jahrelange Erfahrung mit Speechify hat uns gezeigt, dass ein bedeutendes Segment des Marktes, einschließlich unserer eigenen Nutzer, die Sprache als primären Standardmodus bei der Interaktion mit KI bevorzugen", erklärte Rohan Pavuluri, Chief Business Officer des Unternehmens, in einer E-Mail an TechCrunch.
TechCrunch-VeranstaltungKommen Sie auf die Warteliste für die Disrupt 2026
Sichern Sie sich Ihren Platz auf der Warteliste für die Disrupt 2026 und erhalten Sie bevorzugten Zugang zu Early Bird-Tickets. Auf den vergangenen Disrupt-Bühnen waren führende Vertreter von Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil und Vinod Khosla zu Gast - einer von über 250 Branchenexperten, die mehr als 200 Sessions leiten, um Ihr Wachstum zu beschleunigen und Ihre Wettbewerbsfähigkeit zu steigern. Außerdem haben Sie die Möglichkeit, sich mit Hunderten von Start-ups auszutauschen, die in allen Branchen Innovationen vorantreiben.
Kommen Sie auf die Warteliste für die Disrupt 2026
Sichern Sie sich Ihren Platz auf der Warteliste für die Disrupt 2026 und erhalten Sie bevorzugten Zugang zu Early Bird-Tickets. Auf den vergangenen Disrupt-Bühnen waren führende Vertreter von Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil und Vinod Khosla zu Gast - einer von über 250 Branchenexperten, die mehr als 200 Sessions leiten, um Ihr Wachstum zu beschleunigen und Ihre Wettbewerbsfähigkeit zu steigern. Außerdem haben Sie die Möglichkeit, sich mit Hunderten von Start-ups auszutauschen, die in allen Branchen Innovationen vorantreiben.
San Francisco | 13.-15. Oktober 2026 JETZT WARTELISTEEine derzeitige Einschränkung besteht darin, dass der Speechify-Assistent nicht mit Browsern kompatibel ist, die über integrierte Sidebar-Assistenten verfügen, wie z. B. Atlas von OpenAI, Comet von Perplexity und Dia. Das Startup ist nicht übermäßig besorgt, da seine Erweiterung in erster Linie für Chrome und dessen große Nutzerbasis konzipiert ist.
Speechify plant, sowohl seine Spracheingabe- als auch seine Sprachassistenten-Funktionen schrittweise in alle seine Desktop- und mobilen Anwendungen zu integrieren.
Außerdem will das Unternehmen KI-Agenten entwickeln, die in der Lage sind, Aufgaben selbstständig auszuführen. Die vollständige Roadmap wurde zwar nicht bekannt gegeben, aber als Beispiel wurde genannt, dass der Agent Anrufe tätigen kann, um Termine zu vereinbaren oder in der Warteschleife des Kundendienstes zu warten. Andere Unternehmen wie Truecaller und Cloacked verfolgen ähnliche Ziele.
Verwandter Artikel
Mistral stellt ein Open-Source-Modell zur Sprachgenerierung vor
Das französische KI-Unternehmen Mistral hat am Donnerstag ein neues Open-Source-Text-to-Speech-Modell vorgestellt, das für Sprach-KI-Assistenten und Unternehmensanwendungen wie den Kundensupport konzi
Die besten KI-Diktat-Apps: Expertenbewertungen und Rankings
KI-Diktier-Apps haben in relativ kurzer Zeit bemerkenswerte Fortschritte gemacht. Lange Zeit waren sie träge und fehleranfällig, sodass die Nutzer mit einem bestimmten Akzent und vollkommen deutlich s
Wispr Flow setzt trotz Herausforderungen auf die Zukunft der Sprach-KI in Indien
Indiens digitale Landschaft ist stark von Sprachtechnologie geprägt, von Sprachnotizen bis hin zu mehrsprachigem Messaging. Die Umwandlung dieser weit verbreiteten Gewohnheiten in ein skalierbares KI-
Empfehlungen zu verwandten Spezialthemen
Kommentare (1)
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅
Speechify ist vor allem als Tool zum Anhören von Artikeln, PDFs und Dokumenten bekannt. Das Unternehmen hat nun seine Chrome-Erweiterung um Stimmerkennungsfunktionen erweitert und Funktionen für die Spracheingabe und einen Sprachassistenten zur Beantwortung Ihrer Fragen eingeführt.
Im vergangenen Jahr gab es einen starken Anstieg bei den Spracherkennungs-Tools, was auf die erheblichen Verbesserungen bei der Qualität der Spracherkennungsmodelle zurückzuführen ist. Speechify macht sich diesen Trend zunutze und bringt sein eigenes Diktierwerkzeug auf den Markt, das zunächst die englische Sprache unterstützt. Ähnlich wie bei anderen Lösungen korrigiert die Spracheingabe von Speechify automatisch Fehler und entfernt Füllwörter.
Während meines kurzen Tests von etwas mehr als einem Tag habe ich festgestellt, dass das Tool von Speechify noch viel Raum für Verbesserungen hat. Es funktioniert zum Beispiel gut in Gmail und Google Docs, aber auf Websites wie WordPress hatte ich Probleme mit der Aktivierung der Sprachdiktierfunktion und einer zuverlässigen Leistung. Das Unternehmen gab an, dass es das Tool schrittweise für beliebte Websites optimiert.

Was die Genauigkeit angeht, so war die Wortfehlerrate des Tools höher als bei Konkurrenzprodukten wie Wispr Flow, Willow und Monologue. Speechify merkte an, dass sich sein Modell mit häufigerer Nutzung verbessert, was zu einer allmählichen Verringerung der Fehlerquote führt.
Das Startup führt auch einen Sprachassistenten ein, der über eine Seitenleiste im Browser zugänglich ist. Sie können ihm Fragen zu der von Ihnen angezeigten Webseite stellen, z. B. "Was sind die drei wichtigsten Punkte?" oder "Erklären Sie dies in einfacheren Worten".
ChatGPT und Gemini bieten zwar Konversations-Sprachmodi, aber Speechify argumentiert, dass diese Funktionen bei diesen Plattformen zweitrangig sind. Im Gegensatz dazu stellt das Startup die Sprachinteraktion in den Mittelpunkt seines eigenen Tools.
"Wir glauben, dass ein textbasierter Chat immer das Standard-Erlebnis sein wird, wenn Nutzer ChatGPT oder Gemini-Apps öffnen. Das ist es, was das Publikum erwartet. Die Sprachinteraktion wird wahrscheinlich eine sekundäre Funktion bleiben - oft ein nachträglicher Gedanke für diese Anbieter. Unsere jahrelange Erfahrung mit Speechify hat uns gezeigt, dass ein bedeutendes Segment des Marktes, einschließlich unserer eigenen Nutzer, die Sprache als primären Standardmodus bei der Interaktion mit KI bevorzugen", erklärte Rohan Pavuluri, Chief Business Officer des Unternehmens, in einer E-Mail an TechCrunch.
TechCrunch-VeranstaltungKommen Sie auf die Warteliste für die Disrupt 2026
Sichern Sie sich Ihren Platz auf der Warteliste für die Disrupt 2026 und erhalten Sie bevorzugten Zugang zu Early Bird-Tickets. Auf den vergangenen Disrupt-Bühnen waren führende Vertreter von Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil und Vinod Khosla zu Gast - einer von über 250 Branchenexperten, die mehr als 200 Sessions leiten, um Ihr Wachstum zu beschleunigen und Ihre Wettbewerbsfähigkeit zu steigern. Außerdem haben Sie die Möglichkeit, sich mit Hunderten von Start-ups auszutauschen, die in allen Branchen Innovationen vorantreiben.
Kommen Sie auf die Warteliste für die Disrupt 2026
Sichern Sie sich Ihren Platz auf der Warteliste für die Disrupt 2026 und erhalten Sie bevorzugten Zugang zu Early Bird-Tickets. Auf den vergangenen Disrupt-Bühnen waren führende Vertreter von Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil und Vinod Khosla zu Gast - einer von über 250 Branchenexperten, die mehr als 200 Sessions leiten, um Ihr Wachstum zu beschleunigen und Ihre Wettbewerbsfähigkeit zu steigern. Außerdem haben Sie die Möglichkeit, sich mit Hunderten von Start-ups auszutauschen, die in allen Branchen Innovationen vorantreiben.
San Francisco | 13.-15. Oktober 2026 JETZT WARTELISTEEine derzeitige Einschränkung besteht darin, dass der Speechify-Assistent nicht mit Browsern kompatibel ist, die über integrierte Sidebar-Assistenten verfügen, wie z. B. Atlas von OpenAI, Comet von Perplexity und Dia. Das Startup ist nicht übermäßig besorgt, da seine Erweiterung in erster Linie für Chrome und dessen große Nutzerbasis konzipiert ist.
Speechify plant, sowohl seine Spracheingabe- als auch seine Sprachassistenten-Funktionen schrittweise in alle seine Desktop- und mobilen Anwendungen zu integrieren.
Außerdem will das Unternehmen KI-Agenten entwickeln, die in der Lage sind, Aufgaben selbstständig auszuführen. Die vollständige Roadmap wurde zwar nicht bekannt gegeben, aber als Beispiel wurde genannt, dass der Agent Anrufe tätigen kann, um Termine zu vereinbaren oder in der Warteschleife des Kundendienstes zu warten. Andere Unternehmen wie Truecaller und Cloacked verfolgen ähnliche Ziele.
Mistral stellt ein Open-Source-Modell zur Sprachgenerierung vor
Das französische KI-Unternehmen Mistral hat am Donnerstag ein neues Open-Source-Text-to-Speech-Modell vorgestellt, das für Sprach-KI-Assistenten und Unternehmensanwendungen wie den Kundensupport konzi
Die besten KI-Diktat-Apps: Expertenbewertungen und Rankings
KI-Diktier-Apps haben in relativ kurzer Zeit bemerkenswerte Fortschritte gemacht. Lange Zeit waren sie träge und fehleranfällig, sodass die Nutzer mit einem bestimmten Akzent und vollkommen deutlich s
Wispr Flow setzt trotz Herausforderungen auf die Zukunft der Sprach-KI in Indien
Indiens digitale Landschaft ist stark von Sprachtechnologie geprägt, von Sprachnotizen bis hin zu mehrsprachigem Messaging. Die Umwandlung dieser weit verbreiteten Gewohnheiten in ein skalierbares KI-
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅





Heim






