Maison
Speechify améliore son extension Chrome avec la saisie vocale et l'assistant virtuel
Speechify est principalement connu comme un outil permettant d'écouter des articles, des PDF et des documents. L'entreprise vient d'améliorer son extension Chrome avec des capacités de détection vocale, en introduisant des fonctionnalités de saisie vocale et un assistant vocal conversationnel pour répondre à vos questions.
Au cours de l'année écoulée, les outils de détection vocale se sont multipliés, grâce à l'amélioration significative de la qualité des modèles de reconnaissance vocale. Speechify tire parti de cette tendance en lançant son propre outil de dictée, qui prend initialement en charge l'anglais. Comme d'autres solutions, la saisie vocale de Speechify corrige automatiquement les erreurs et supprime les mots de remplissage.
Au cours de mon bref test d'un peu plus d'une journée, j'ai constaté que l'outil de Speechify pouvait être considérablement amélioré. Par exemple, il fonctionne bien dans Gmail et Google Docs, mais sur des sites web comme WordPress, j'ai rencontré des problèmes pour activer la fonction de dictée vocale et obtenir des performances fiables. L'entreprise a déclaré qu'elle optimisait progressivement l'outil pour les sites populaires.

Image Credits:Speechify En ce qui concerne la précision, le taux d'erreurs de mots de l'outil était plus élevé que celui de produits concurrents tels que Wispr Flow, Willow et Monologue. Speechify a noté que son modèle s'améliore avec une utilisation plus fréquente, conduisant à une réduction progressive des taux d'erreur.
La startup introduit également un assistant vocal conversationnel accessible à partir d'une barre latérale dans votre navigateur. Vous pouvez lui poser des questions sur la page web que vous consultez, telles que "quels sont les trois points principaux ?" ou "expliquez ceci en termes plus simples".
Bien que ChatGPT et Gemini proposent des modes de conversation vocale, Speechify affirme que ces fonctions sont secondaires sur ces plateformes. En revanche, la startup positionne l'interaction vocale comme l'expérience centrale de son propre outil.
"Nous pensons que le chat textuel sera toujours l'expérience par défaut lorsque les utilisateurs ouvriront les applications ChatGPT ou Gemini. C'est ce que leur public attend. L'interaction vocale restera probablement une fonction secondaire - souvent une réflexion après coup pour ces fournisseurs. Nos années d'expérience avec Speechify nous ont montré qu'un segment important du marché, y compris nos propres utilisateurs, préfère la voix comme mode principal, par défaut, lorsqu'ils interagissent avec l'IA", a expliqué Rohan Pavuluri, directeur commercial de la société, dans un e-mail adressé à TechCrunch.
Événement TechcrunchRejoignez la liste d'attente de Disrupt 2026
Inscrivez-vous sur la liste d'attente de Disrupt 2026 pour bénéficier d'un accès prioritaire aux billets à tarif préférentiel. Les étapes précédentes de Disrupt ont accueilli des dirigeants de Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil et Vinod Khosla - parmi plus de 250 experts de l'industrie qui dirigent plus de 200 sessions conçues pour accélérer votre croissance et aiguiser votre avantage concurrentiel. Vous aurez également l'occasion d'entrer en contact avec des centaines de startups qui stimulent l'innovation dans tous les secteurs.
Rejoindre la liste d'attente de Disrupt 2026
Inscrivez-vous sur la liste d'attente de Disrupt 2026 pour bénéficier d'un accès prioritaire aux billets à tarif préférentiel. Les étapes précédentes de Disrupt ont accueilli des dirigeants de Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil et Vinod Khosla - parmi plus de 250 experts de l'industrie qui dirigent plus de 200 sessions conçues pour accélérer votre croissance et aiguiser votre avantage concurrentiel. Vous aurez également l'occasion d'entrer en contact avec des centaines de startups qui stimulent l'innovation dans tous les secteurs.
San Francisco | Du 13 au 15 octobre 2026L'une des limites actuelles est que l'assistant de Speechify n'est pas compatible avec les navigateurs qui ont des assistants intégrés dans la barre latérale, comme Atlas d'OpenAI, Comet de Perplexity et Dia. La startup ne s'inquiète pas outre mesure, car son extension est principalement conçue pour Chrome et sa vaste base d'utilisateurs.
Speechify prévoit d'intégrer ses fonctions de saisie vocale et d'assistant vocal dans toutes ses applications de bureau et mobiles, dans le cadre d'un déploiement progressif.
L'entreprise vise également à développer des agents d'intelligence artificielle capables d'effectuer des tâches de manière autonome. Bien que la feuille de route complète n'ait pas été divulguée, l'un des exemples donnés est celui d'un agent qui passerait des appels téléphoniques pour prendre des rendez-vous ou qui serait en attente avec le service clientèle. D'autres entreprises comme Truecaller et Cloacked poursuivent des objectifs similaires.
Article connexe
Mistral dévoile un modèle open source de synthèse vocale
La société française d'IA Mistral a dévoilé jeudi un nouveau modèle open source de synthèse vocale, conçu pour les assistants vocaux IA et les applications d'entreprise telles que le service client. C
Les meilleures applications de dictée par IA : avis d'experts et classements
Les applications de dictée par IA ont fait des progrès remarquables en un laps de temps relativement court. Pendant longtemps, elles étaient lentes et sujettes à des erreurs, obligeant les utilisateur
Wispr Flow mise sur l'avenir de l'IA vocale en Inde malgré les défis
Le paysage numérique indien est fortement imprégné des technologies vocales, des notes vocales à la messagerie multilingue. Transformer ces habitudes largement répandues en une activité d'IA évolutive
Recommandations de sujets spéciaux liés
commentaires (1)
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅
Speechify est principalement connu comme un outil permettant d'écouter des articles, des PDF et des documents. L'entreprise vient d'améliorer son extension Chrome avec des capacités de détection vocale, en introduisant des fonctionnalités de saisie vocale et un assistant vocal conversationnel pour répondre à vos questions.
Au cours de l'année écoulée, les outils de détection vocale se sont multipliés, grâce à l'amélioration significative de la qualité des modèles de reconnaissance vocale. Speechify tire parti de cette tendance en lançant son propre outil de dictée, qui prend initialement en charge l'anglais. Comme d'autres solutions, la saisie vocale de Speechify corrige automatiquement les erreurs et supprime les mots de remplissage.
Au cours de mon bref test d'un peu plus d'une journée, j'ai constaté que l'outil de Speechify pouvait être considérablement amélioré. Par exemple, il fonctionne bien dans Gmail et Google Docs, mais sur des sites web comme WordPress, j'ai rencontré des problèmes pour activer la fonction de dictée vocale et obtenir des performances fiables. L'entreprise a déclaré qu'elle optimisait progressivement l'outil pour les sites populaires.

En ce qui concerne la précision, le taux d'erreurs de mots de l'outil était plus élevé que celui de produits concurrents tels que Wispr Flow, Willow et Monologue. Speechify a noté que son modèle s'améliore avec une utilisation plus fréquente, conduisant à une réduction progressive des taux d'erreur.
La startup introduit également un assistant vocal conversationnel accessible à partir d'une barre latérale dans votre navigateur. Vous pouvez lui poser des questions sur la page web que vous consultez, telles que "quels sont les trois points principaux ?" ou "expliquez ceci en termes plus simples".
Bien que ChatGPT et Gemini proposent des modes de conversation vocale, Speechify affirme que ces fonctions sont secondaires sur ces plateformes. En revanche, la startup positionne l'interaction vocale comme l'expérience centrale de son propre outil.
"Nous pensons que le chat textuel sera toujours l'expérience par défaut lorsque les utilisateurs ouvriront les applications ChatGPT ou Gemini. C'est ce que leur public attend. L'interaction vocale restera probablement une fonction secondaire - souvent une réflexion après coup pour ces fournisseurs. Nos années d'expérience avec Speechify nous ont montré qu'un segment important du marché, y compris nos propres utilisateurs, préfère la voix comme mode principal, par défaut, lorsqu'ils interagissent avec l'IA", a expliqué Rohan Pavuluri, directeur commercial de la société, dans un e-mail adressé à TechCrunch.
Événement TechcrunchRejoignez la liste d'attente de Disrupt 2026
Inscrivez-vous sur la liste d'attente de Disrupt 2026 pour bénéficier d'un accès prioritaire aux billets à tarif préférentiel. Les étapes précédentes de Disrupt ont accueilli des dirigeants de Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil et Vinod Khosla - parmi plus de 250 experts de l'industrie qui dirigent plus de 200 sessions conçues pour accélérer votre croissance et aiguiser votre avantage concurrentiel. Vous aurez également l'occasion d'entrer en contact avec des centaines de startups qui stimulent l'innovation dans tous les secteurs.
Rejoindre la liste d'attente de Disrupt 2026
Inscrivez-vous sur la liste d'attente de Disrupt 2026 pour bénéficier d'un accès prioritaire aux billets à tarif préférentiel. Les étapes précédentes de Disrupt ont accueilli des dirigeants de Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil et Vinod Khosla - parmi plus de 250 experts de l'industrie qui dirigent plus de 200 sessions conçues pour accélérer votre croissance et aiguiser votre avantage concurrentiel. Vous aurez également l'occasion d'entrer en contact avec des centaines de startups qui stimulent l'innovation dans tous les secteurs.
San Francisco | Du 13 au 15 octobre 2026L'une des limites actuelles est que l'assistant de Speechify n'est pas compatible avec les navigateurs qui ont des assistants intégrés dans la barre latérale, comme Atlas d'OpenAI, Comet de Perplexity et Dia. La startup ne s'inquiète pas outre mesure, car son extension est principalement conçue pour Chrome et sa vaste base d'utilisateurs.
Speechify prévoit d'intégrer ses fonctions de saisie vocale et d'assistant vocal dans toutes ses applications de bureau et mobiles, dans le cadre d'un déploiement progressif.
L'entreprise vise également à développer des agents d'intelligence artificielle capables d'effectuer des tâches de manière autonome. Bien que la feuille de route complète n'ait pas été divulguée, l'un des exemples donnés est celui d'un agent qui passerait des appels téléphoniques pour prendre des rendez-vous ou qui serait en attente avec le service clientèle. D'autres entreprises comme Truecaller et Cloacked poursuivent des objectifs similaires.
Mistral dévoile un modèle open source de synthèse vocale
La société française d'IA Mistral a dévoilé jeudi un nouveau modèle open source de synthèse vocale, conçu pour les assistants vocaux IA et les applications d'entreprise telles que le service client. C
Les meilleures applications de dictée par IA : avis d'experts et classements
Les applications de dictée par IA ont fait des progrès remarquables en un laps de temps relativement court. Pendant longtemps, elles étaient lentes et sujettes à des erreurs, obligeant les utilisateur
Wispr Flow mise sur l'avenir de l'IA vocale en Inde malgré les défis
Le paysage numérique indien est fortement imprégné des technologies vocales, des notes vocales à la messagerie multilingue. Transformer ces habitudes largement répandues en une activité d'IA évolutive
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅











