O DeepL, conhecido pela tradução de textos, agora se volta para a tradução de voz

A DeepL, empresa de tradução mais conhecida por suas ferramentas baseadas em texto, lançou hoje um pacote de tradução de voz para voz voltado para cenários como reuniões, conversas em dispositivos móveis e na web, e discussões em grupo para profissionais da linha de frente por meio de aplicativos personalizados. A empresa também apresentou uma API que permite que desenvolvedores externos e empresas utilizem a tecnologia da DeepL para casos de uso personalizados, como centrais de atendimento.
“Depois de passar tantos anos focados na tradução de texto, a voz foi o próximo passo natural para nós”, disse o CEO da DeepL, Jarek Kutylowski, ao TechCrunch em uma entrevista. “Fizemos progressos significativos na tradução de textos e documentos. Mas sentimos que não havia um ótimo produto disponível para tradução de voz em tempo real.”
Kutylowski explicou que o principal desafio no desenvolvimento de um produto de tradução em tempo real envolve encontrar o equilíbrio certo entre reduzir a latência — o atraso entre o momento em que alguém fala e quando o áudio traduzido é ouvido — e manter alta precisão.
A DeepL está lançando complementos para plataformas como o Zoom e o Microsoft Teams, onde os ouvintes podem ouvir traduções em tempo real enquanto outras pessoas falam em seus idiomas nativos ou acompanhar o texto traduzido em tempo real na tela. Este programa está atualmente disponível em acesso antecipado, e a empresa está convidando organizações a se inscreverem em uma lista de espera. O DeepL também oferece um produto para conversas em dispositivos móveis e na web, sejam elas presenciais ou remotas.
O DeepL também permite que os usuários participem de conversas em grupo em ambientes como sessões de treinamento ou workshops, permitindo que os participantes se juntem por meio de um código QR.
A DeepL afirma que sua tecnologia de voz para voz pode aprender e se adaptar a vocabulários personalizados, incluindo termos específicos do setor, bem como nomes de empresas e pessoas.
Kutylowski observou que a IA está remodelando o atendimento ao cliente nos próximos anos. Ele destacou que uma camada de tradução ajuda as empresas a oferecer suporte em idiomas nos quais há escassez de pessoal qualificado e cuja contratação é cara.
A empresa afirma que controla toda a pilha de voz-para-voz. No entanto, o sistema atual converte fala em texto, aplica a tradução e, em seguida, converte o texto de volta em fala. A DeepL acredita que seus anos de trabalho em tradução de texto lhe conferem uma vantagem na qualidade da tradução. Olhando para o futuro, a empresa pretende desenvolver um modelo de tradução de voz de ponta a ponta que ignore completamente a etapa do texto.
A DeepL enfrenta concorrência de várias startups bem financiadas que atuam em áreas relacionadas. A Sanas, que levantou US$ 65 milhões no ano passado da Quadrille Capital e da Teleperformance, usa IA para modificar o sotaque de um locutor em tempo real — uma ferramenta voltada principalmente para agentes de call center.
A Camb.AI, com sede em Dubai, concentra-se na síntese de voz e tradução para empresas de mídia e entretenimento, incluindo a Amazon Web Services, ajudando-as a dublar e localizar conteúdo de vídeo em grande escala.
A Palabra, apoiada pela empresa Seven Seven Six do cofundador do Reddit, Alexis Ohanian, está desenvolvendo um mecanismo de tradução de fala em tempo real projetado para preservar tanto o significado quanto a voz original do locutor, colocando-a em concorrência mais direta com o que a DeepL está desenvolvendo atualmente.
Artigo relacionado
A ElevenLabs anuncia a BlackRock, Jamie Foxx e Eva Longoria como novos investidores
A ElevenLabs, empresa especializada em IA de voz, revelou novos investidores em sua rodada de financiamento da Série D, no valor de US$ 500 milhões, anunciada originalmente em fevereiro. Entre eles es
A Mistral lança um modelo de geração de fala de código aberto
A empresa francesa de IA Mistral revelou na quinta-feira um novo modelo de conversão de texto em fala de código aberto, projetado para assistentes de voz com IA e aplicações empresariais, como atendim
Os melhores aplicativos de ditado por IA: análises de especialistas e rankings
Os aplicativos de ditado por IA alcançaram avanços notáveis em um período relativamente curto. Por muito tempo, eles eram lentos e propensos a erros, exigindo que os usuários falassem com um sotaque e
Recomendações de tópicos especiais relacionados
Comentários (0)

A DeepL, empresa de tradução mais conhecida por suas ferramentas baseadas em texto, lançou hoje um pacote de tradução de voz para voz voltado para cenários como reuniões, conversas em dispositivos móveis e na web, e discussões em grupo para profissionais da linha de frente por meio de aplicativos personalizados. A empresa também apresentou uma API que permite que desenvolvedores externos e empresas utilizem a tecnologia da DeepL para casos de uso personalizados, como centrais de atendimento.
“Depois de passar tantos anos focados na tradução de texto, a voz foi o próximo passo natural para nós”, disse o CEO da DeepL, Jarek Kutylowski, ao TechCrunch em uma entrevista. “Fizemos progressos significativos na tradução de textos e documentos. Mas sentimos que não havia um ótimo produto disponível para tradução de voz em tempo real.”
Kutylowski explicou que o principal desafio no desenvolvimento de um produto de tradução em tempo real envolve encontrar o equilíbrio certo entre reduzir a latência — o atraso entre o momento em que alguém fala e quando o áudio traduzido é ouvido — e manter alta precisão.
A DeepL está lançando complementos para plataformas como o Zoom e o Microsoft Teams, onde os ouvintes podem ouvir traduções em tempo real enquanto outras pessoas falam em seus idiomas nativos ou acompanhar o texto traduzido em tempo real na tela. Este programa está atualmente disponível em acesso antecipado, e a empresa está convidando organizações a se inscreverem em uma lista de espera. O DeepL também oferece um produto para conversas em dispositivos móveis e na web, sejam elas presenciais ou remotas.
O DeepL também permite que os usuários participem de conversas em grupo em ambientes como sessões de treinamento ou workshops, permitindo que os participantes se juntem por meio de um código QR.
A DeepL afirma que sua tecnologia de voz para voz pode aprender e se adaptar a vocabulários personalizados, incluindo termos específicos do setor, bem como nomes de empresas e pessoas.
Kutylowski observou que a IA está remodelando o atendimento ao cliente nos próximos anos. Ele destacou que uma camada de tradução ajuda as empresas a oferecer suporte em idiomas nos quais há escassez de pessoal qualificado e cuja contratação é cara.
A empresa afirma que controla toda a pilha de voz-para-voz. No entanto, o sistema atual converte fala em texto, aplica a tradução e, em seguida, converte o texto de volta em fala. A DeepL acredita que seus anos de trabalho em tradução de texto lhe conferem uma vantagem na qualidade da tradução. Olhando para o futuro, a empresa pretende desenvolver um modelo de tradução de voz de ponta a ponta que ignore completamente a etapa do texto.
A DeepL enfrenta concorrência de várias startups bem financiadas que atuam em áreas relacionadas. A Sanas, que levantou US$ 65 milhões no ano passado da Quadrille Capital e da Teleperformance, usa IA para modificar o sotaque de um locutor em tempo real — uma ferramenta voltada principalmente para agentes de call center.
A Camb.AI, com sede em Dubai, concentra-se na síntese de voz e tradução para empresas de mídia e entretenimento, incluindo a Amazon Web Services, ajudando-as a dublar e localizar conteúdo de vídeo em grande escala.
A Palabra, apoiada pela empresa Seven Seven Six do cofundador do Reddit, Alexis Ohanian, está desenvolvendo um mecanismo de tradução de fala em tempo real projetado para preservar tanto o significado quanto a voz original do locutor, colocando-a em concorrência mais direta com o que a DeepL está desenvolvendo atualmente.
A ElevenLabs anuncia a BlackRock, Jamie Foxx e Eva Longoria como novos investidores
A ElevenLabs, empresa especializada em IA de voz, revelou novos investidores em sua rodada de financiamento da Série D, no valor de US$ 500 milhões, anunciada originalmente em fevereiro. Entre eles es
A Mistral lança um modelo de geração de fala de código aberto
A empresa francesa de IA Mistral revelou na quinta-feira um novo modelo de conversão de texto em fala de código aberto, projetado para assistentes de voz com IA e aplicações empresariais, como atendim
Os melhores aplicativos de ditado por IA: análises de especialistas e rankings
Os aplicativos de ditado por IA alcançaram avanços notáveis em um período relativamente curto. Por muito tempo, eles eram lentos e propensos a erros, exigindo que os usuários falassem com um sotaque e





Lar






