DeepL, conocida por la traducción de textos, se centra ahora en la traducción de voz

DeepL, una empresa de traducción conocida principalmente por sus herramientas de texto, ha lanzado hoy un paquete de traducción de voz a voz diseñado para situaciones como reuniones, conversaciones por móvil y por Internet, y debates en grupo para trabajadores de primera línea a través de aplicaciones personalizadas. La empresa también ha presentado una API que permite a desarrolladores externos y a otras empresas aprovechar la tecnología de DeepL para casos de uso específicos, como los centros de atención telefónica.
«Después de tantos años centrados en la traducción de texto, la voz era el siguiente paso natural para nosotros», declaró el director ejecutivo de DeepL, Jarek Kutylowski, a TechCrunch en una entrevista. «Hemos logrado avances significativos en la traducción de textos y documentos. Pero sentíamos que no existía un buen producto disponible para la traducción de voz en tiempo real».
Kutylowski explicó que el principal reto a la hora de desarrollar un producto de traducción en tiempo real consiste en encontrar el equilibrio adecuado entre reducir la latencia —el retraso entre el momento en que alguien habla y el momento en que se escucha el audio traducido— y mantener una alta precisión.
DeepL está lanzando complementos para plataformas como Zoom y Microsoft Teams, donde los oyentes pueden escuchar traducciones en tiempo real mientras otros hablan en sus idiomas nativos o seguir el texto traducido en tiempo real en la pantalla. Este programa está disponible actualmente en acceso anticipado, y la empresa invita a las organizaciones a apuntarse a una lista de espera. DeepL también ofrece un producto para conversaciones móviles y web, ya sean presenciales o a distancia.
DeepL también permite a los usuarios participar en conversaciones grupales en entornos como sesiones de formación o talleres, permitiendo a los asistentes unirse mediante un código QR.
DeepL afirma que su tecnología de voz a voz puede aprender y adaptarse a un vocabulario personalizado, incluyendo términos específicos del sector, así como nombres de empresas y personas.
Kutylowski señaló que la IA está transformando el servicio de atención al cliente en los próximos años. Destacó que una capa de traducción ayuda a las empresas a ofrecer asistencia en idiomas en los que el personal cualificado es escaso y su contratación resulta costosa.
La empresa afirma que controla toda la pila de voz a voz. Sin embargo, el sistema actual convierte el habla en texto, aplica la traducción y, a continuación, vuelve a convertir el texto en habla. DeepL cree que sus años de trabajo en la traducción de texto le dan una ventaja en cuanto a la calidad de la traducción. De cara al futuro, la empresa pretende desarrollar un modelo de traducción de voz de extremo a extremo que elimine por completo el paso del texto.
DeepL se enfrenta a la competencia de varias startups bien financiadas que trabajan en áreas relacionadas. Sanas, que recaudó 65 millones de dólares el año pasado de Quadrille Capital y Teleperformance, utiliza la IA para modificar el acento de un hablante en tiempo real, una herramienta dirigida principalmente a los agentes de centros de llamadas.
Camb.AI, con sede en Dubái, se centra en la síntesis de voz y la traducción para empresas de medios de comunicación y entretenimiento, entre ellas Amazon Web Services, ayudándolas a doblar y localizar contenidos de vídeo a gran escala.
Palabra, respaldada por Seven Seven Six, la empresa del cofundador de Reddit Alexis Ohanian, está desarrollando un motor de traducción de voz en tiempo real diseñado para preservar tanto el significado como la voz original del hablante, lo que la sitúa en una competencia más directa con lo que DeepL está desarrollando actualmente.
Artículo relacionado
ElevenLabs anuncia que BlackRock, Jamie Foxx y Eva Longoria se han convertido en nuevos inversores
ElevenLabs, la empresa de inteligencia artificial aplicada a la voz, ha dado a conocer nuevos inversores en su ronda de financiación de serie D, por valor de 500 millones de dólares, anunciada inicial
Mistral presenta un modelo de generación de voz de código abierto
La empresa francesa de IA Mistral presentó el jueves un nuevo modelo de código abierto de conversión de texto a voz, diseñado para asistentes de voz con IA y aplicaciones empresariales como la atenció
Las mejores aplicaciones de dictado con IA: opiniones de expertos y clasificaciones
Las aplicaciones de dictado por IA han logrado avances notables en un periodo relativamente corto. Durante mucho tiempo, eran lentas y propensas a cometer errores, y exigían a los usuarios hablar con
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

DeepL, una empresa de traducción conocida principalmente por sus herramientas de texto, ha lanzado hoy un paquete de traducción de voz a voz diseñado para situaciones como reuniones, conversaciones por móvil y por Internet, y debates en grupo para trabajadores de primera línea a través de aplicaciones personalizadas. La empresa también ha presentado una API que permite a desarrolladores externos y a otras empresas aprovechar la tecnología de DeepL para casos de uso específicos, como los centros de atención telefónica.
«Después de tantos años centrados en la traducción de texto, la voz era el siguiente paso natural para nosotros», declaró el director ejecutivo de DeepL, Jarek Kutylowski, a TechCrunch en una entrevista. «Hemos logrado avances significativos en la traducción de textos y documentos. Pero sentíamos que no existía un buen producto disponible para la traducción de voz en tiempo real».
Kutylowski explicó que el principal reto a la hora de desarrollar un producto de traducción en tiempo real consiste en encontrar el equilibrio adecuado entre reducir la latencia —el retraso entre el momento en que alguien habla y el momento en que se escucha el audio traducido— y mantener una alta precisión.
DeepL está lanzando complementos para plataformas como Zoom y Microsoft Teams, donde los oyentes pueden escuchar traducciones en tiempo real mientras otros hablan en sus idiomas nativos o seguir el texto traducido en tiempo real en la pantalla. Este programa está disponible actualmente en acceso anticipado, y la empresa invita a las organizaciones a apuntarse a una lista de espera. DeepL también ofrece un producto para conversaciones móviles y web, ya sean presenciales o a distancia.
DeepL también permite a los usuarios participar en conversaciones grupales en entornos como sesiones de formación o talleres, permitiendo a los asistentes unirse mediante un código QR.
DeepL afirma que su tecnología de voz a voz puede aprender y adaptarse a un vocabulario personalizado, incluyendo términos específicos del sector, así como nombres de empresas y personas.
Kutylowski señaló que la IA está transformando el servicio de atención al cliente en los próximos años. Destacó que una capa de traducción ayuda a las empresas a ofrecer asistencia en idiomas en los que el personal cualificado es escaso y su contratación resulta costosa.
La empresa afirma que controla toda la pila de voz a voz. Sin embargo, el sistema actual convierte el habla en texto, aplica la traducción y, a continuación, vuelve a convertir el texto en habla. DeepL cree que sus años de trabajo en la traducción de texto le dan una ventaja en cuanto a la calidad de la traducción. De cara al futuro, la empresa pretende desarrollar un modelo de traducción de voz de extremo a extremo que elimine por completo el paso del texto.
DeepL se enfrenta a la competencia de varias startups bien financiadas que trabajan en áreas relacionadas. Sanas, que recaudó 65 millones de dólares el año pasado de Quadrille Capital y Teleperformance, utiliza la IA para modificar el acento de un hablante en tiempo real, una herramienta dirigida principalmente a los agentes de centros de llamadas.
Camb.AI, con sede en Dubái, se centra en la síntesis de voz y la traducción para empresas de medios de comunicación y entretenimiento, entre ellas Amazon Web Services, ayudándolas a doblar y localizar contenidos de vídeo a gran escala.
Palabra, respaldada por Seven Seven Six, la empresa del cofundador de Reddit Alexis Ohanian, está desarrollando un motor de traducción de voz en tiempo real diseñado para preservar tanto el significado como la voz original del hablante, lo que la sitúa en una competencia más directa con lo que DeepL está desarrollando actualmente.
ElevenLabs anuncia que BlackRock, Jamie Foxx y Eva Longoria se han convertido en nuevos inversores
ElevenLabs, la empresa de inteligencia artificial aplicada a la voz, ha dado a conocer nuevos inversores en su ronda de financiación de serie D, por valor de 500 millones de dólares, anunciada inicial
Mistral presenta un modelo de generación de voz de código abierto
La empresa francesa de IA Mistral presentó el jueves un nuevo modelo de código abierto de conversión de texto a voz, diseñado para asistentes de voz con IA y aplicaciones empresariales como la atenció
Las mejores aplicaciones de dictado con IA: opiniones de expertos y clasificaciones
Las aplicaciones de dictado por IA han logrado avances notables en un periodo relativamente corto. Durante mucho tiempo, eran lentas y propensas a cometer errores, y exigían a los usuarios hablar con





Hogar






