Maison
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale

DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations sur mobile et sur le Web, ainsi que les discussions de groupe pour les travailleurs de première ligne, via des applications personnalisées. La société a également présenté une API permettant aux développeurs externes et aux entreprises de s'appuyer sur la technologie de DeepL pour des cas d'utilisation sur mesure, tels que les centres d'appels.
« Après avoir passé tant d’années à nous concentrer sur la traduction de texte, la voix était une étape naturelle pour nous », a déclaré Jarek Kutylowski, PDG de DeepL, lors d’une interview accordée à TechCrunch. « Nous avons réalisé des progrès significatifs dans la traduction de textes et de documents. Mais nous avions le sentiment qu’il n’existait pas de produit de qualité pour la traduction vocale en temps réel. »
M. Kutylowski a expliqué que le principal défi dans le développement d’un produit de traduction en temps réel consiste à trouver le juste équilibre entre la réduction de la latence — le délai entre le moment où une personne parle et celui où l’audio traduit est entendu — et le maintien d’une grande précision.
DeepL lance des extensions pour des plateformes telles que Zoom et Microsoft Teams, où les auditeurs peuvent soit écouter les traductions en temps réel pendant que d’autres s’expriment dans leur langue maternelle, soit suivre le texte traduit en temps réel à l’écran. Ce programme est actuellement disponible en accès anticipé, et l’entreprise invite les organisations à s’inscrire sur une liste d’attente. DeepL propose également un produit pour les conversations sur mobile et sur le Web, qu'elles se déroulent en personne ou à distance.
DeepL permet également aux utilisateurs de participer à des conversations de groupe dans des contextes tels que des sessions de formation ou des ateliers, en permettant aux participants de se connecter via un code QR.
DeepL affirme que sa technologie de traduction vocale est capable d'apprendre et de s'adapter à un vocabulaire personnalisé, y compris des termes spécifiques à un secteur d'activité, ainsi qu'aux noms d'entreprises et aux noms de personnes.
M. Kutylowski a souligné que l'IA est en train de transformer le service client pour les années à venir. Il a fait remarquer qu'une couche de traduction aide les entreprises à fournir une assistance dans des langues où le personnel qualifié est rare et coûteux à recruter.
L'entreprise affirme contrôler l'ensemble de la pile voix-à-voix. Cependant, le système actuel convertit la parole en texte, applique la traduction, puis reconvertit le texte en parole. DeepL estime que ses années d'expérience dans la traduction de texte lui confèrent un avantage en termes de qualité de traduction. À l'avenir, l'entreprise vise à développer un modèle de traduction vocale de bout en bout qui contourne entièrement l'étape du texte.
DeepL est confrontée à la concurrence de plusieurs start-ups bien financées travaillant dans des domaines connexes. Sanas, qui a levé 65 millions de dollars l'année dernière auprès de Quadrille Capital et Teleperformance, utilise l'IA pour modifier l'accent d'un locuteur en temps réel — un outil principalement destiné aux agents de centres d'appels.
Basée à Dubaï, Camb.AI se concentre sur la synthèse vocale et la traduction pour les entreprises des médias et du divertissement, notamment Amazon Web Services, en les aidant à doubler et à localiser du contenu vidéo à grande échelle.
Palabra, soutenue par Seven Seven Six, la société du cofondateur de Reddit Alexis Ohanian, développe un moteur de traduction vocale en temps réel conçu pour préserver à la fois le sens et la voix originale de l'orateur, ce qui la place en concurrence plus directe avec ce que DeepL est en train de développer.
Article connexe
ElevenLabs annonce que BlackRock, Jamie Foxx et Eva Longoria ont rejoint le cercle de ses investisseurs
ElevenLabs, la société spécialisée dans l'IA vocale, a révélé le nom d'investisseurs supplémentaires ayant participé à son tour de table de série D de 500 millions de dollars, initialement annoncé en
Mistral dévoile un modèle open source de synthèse vocale
La société française d'IA Mistral a dévoilé jeudi un nouveau modèle open source de synthèse vocale, conçu pour les assistants vocaux IA et les applications d'entreprise telles que le service client. C
Les meilleures applications de dictée par IA : avis d'experts et classements
Les applications de dictée par IA ont fait des progrès remarquables en un laps de temps relativement court. Pendant longtemps, elles étaient lentes et sujettes à des erreurs, obligeant les utilisateur
Recommandations de sujets spéciaux liés
commentaires (0)

DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations sur mobile et sur le Web, ainsi que les discussions de groupe pour les travailleurs de première ligne, via des applications personnalisées. La société a également présenté une API permettant aux développeurs externes et aux entreprises de s'appuyer sur la technologie de DeepL pour des cas d'utilisation sur mesure, tels que les centres d'appels.
« Après avoir passé tant d’années à nous concentrer sur la traduction de texte, la voix était une étape naturelle pour nous », a déclaré Jarek Kutylowski, PDG de DeepL, lors d’une interview accordée à TechCrunch. « Nous avons réalisé des progrès significatifs dans la traduction de textes et de documents. Mais nous avions le sentiment qu’il n’existait pas de produit de qualité pour la traduction vocale en temps réel. »
M. Kutylowski a expliqué que le principal défi dans le développement d’un produit de traduction en temps réel consiste à trouver le juste équilibre entre la réduction de la latence — le délai entre le moment où une personne parle et celui où l’audio traduit est entendu — et le maintien d’une grande précision.
DeepL lance des extensions pour des plateformes telles que Zoom et Microsoft Teams, où les auditeurs peuvent soit écouter les traductions en temps réel pendant que d’autres s’expriment dans leur langue maternelle, soit suivre le texte traduit en temps réel à l’écran. Ce programme est actuellement disponible en accès anticipé, et l’entreprise invite les organisations à s’inscrire sur une liste d’attente. DeepL propose également un produit pour les conversations sur mobile et sur le Web, qu'elles se déroulent en personne ou à distance.
DeepL permet également aux utilisateurs de participer à des conversations de groupe dans des contextes tels que des sessions de formation ou des ateliers, en permettant aux participants de se connecter via un code QR.
DeepL affirme que sa technologie de traduction vocale est capable d'apprendre et de s'adapter à un vocabulaire personnalisé, y compris des termes spécifiques à un secteur d'activité, ainsi qu'aux noms d'entreprises et aux noms de personnes.
M. Kutylowski a souligné que l'IA est en train de transformer le service client pour les années à venir. Il a fait remarquer qu'une couche de traduction aide les entreprises à fournir une assistance dans des langues où le personnel qualifié est rare et coûteux à recruter.
L'entreprise affirme contrôler l'ensemble de la pile voix-à-voix. Cependant, le système actuel convertit la parole en texte, applique la traduction, puis reconvertit le texte en parole. DeepL estime que ses années d'expérience dans la traduction de texte lui confèrent un avantage en termes de qualité de traduction. À l'avenir, l'entreprise vise à développer un modèle de traduction vocale de bout en bout qui contourne entièrement l'étape du texte.
DeepL est confrontée à la concurrence de plusieurs start-ups bien financées travaillant dans des domaines connexes. Sanas, qui a levé 65 millions de dollars l'année dernière auprès de Quadrille Capital et Teleperformance, utilise l'IA pour modifier l'accent d'un locuteur en temps réel — un outil principalement destiné aux agents de centres d'appels.
Basée à Dubaï, Camb.AI se concentre sur la synthèse vocale et la traduction pour les entreprises des médias et du divertissement, notamment Amazon Web Services, en les aidant à doubler et à localiser du contenu vidéo à grande échelle.
Palabra, soutenue par Seven Seven Six, la société du cofondateur de Reddit Alexis Ohanian, développe un moteur de traduction vocale en temps réel conçu pour préserver à la fois le sens et la voix originale de l'orateur, ce qui la place en concurrence plus directe avec ce que DeepL est en train de développer.
ElevenLabs annonce que BlackRock, Jamie Foxx et Eva Longoria ont rejoint le cercle de ses investisseurs
ElevenLabs, la société spécialisée dans l'IA vocale, a révélé le nom d'investisseurs supplémentaires ayant participé à son tour de table de série D de 500 millions de dollars, initialement annoncé en
Mistral dévoile un modèle open source de synthèse vocale
La société française d'IA Mistral a dévoilé jeudi un nouveau modèle open source de synthèse vocale, conçu pour les assistants vocaux IA et les applications d'entreprise telles que le service client. C
Les meilleures applications de dictée par IA : avis d'experts et classements
Les applications de dictée par IA ont fait des progrès remarquables en un laps de temps relativement court. Pendant longtemps, elles étaient lentes et sujettes à des erreurs, obligeant les utilisateur











