opção
Lar
Notícias
A Hume AI lança o TADA: um sistema de síntese de voz para dispositivos móveis de código aberto com velocidade 5 vezes maior e sem erros de reprodução

A Hume AI lança o TADA: um sistema de síntese de voz para dispositivos móveis de código aberto com velocidade 5 vezes maior e sem erros de reprodução

18 de Março de 2026
111

A Hume AI lança o TADA: um sistema de síntese de voz para dispositivos móveis de código aberto com velocidade 5 vezes maior e sem erros de reprodução

A Hume AI disponibilizou em código aberto seu mais recente modelo de geração de fala, o TADA (Text-Acoustic Dual Alignment). Esse sistema de conversão de texto em fala (TTS), desenvolvido com base em um grande modelo de linguagem, utiliza uma arquitetura inovadora de alinhamento duplo para texto e acústica. Essa abordagem aumenta significativamente a eficiência e a confiabilidade da geração, além de ampliar seu leque de aplicações práticas.

Conforme detalhado oficialmente, o TADA estabelece uma sincronização rigorosa de 1:1 entre tokens de texto e representações acústicas. Essa arquitetura resolve completamente o problema comum de alucinação de conteúdo no nível do token encontrado em sistemas TTS tradicionais baseados em LLM. Em avaliações envolvendo mais de 1.000 amostras de teste, o modelo não apresentou nenhum caso de alucinação de conteúdo.

Em relação ao desempenho, o TADA gera áudio mais de cinco vezes mais rápido do que sistemas TTS LLM comparáveis. Ele também opera com notável eficiência de recursos, exigindo apenas 2 a 3 quadros de recursos computacionais por segundo de áudio. Em contraste, as soluções convencionais normalmente precisam de 12,5 a 75 quadros. Essa eficiência permite que o modelo execute inferência local em hardware de baixo consumo de energia, como smartphones e dispositivos de borda, eliminando a necessidade de servidores em nuvem.

O TADA oferece suporte multilíngue, incluindo chinês, com suas versões multilíngues baseadas na escala de parâmetros do Llama3.23B. O lançamento inclui modelos pré-treinados multilíngues de 1B (principalmente para inglês) e 3B. Com uma janela de contexto de 2.048 tokens, o modelo pode gerar aproximadamente 700 segundos de áudio contínuo em uma única passagem. Essa capacidade supera em muito as soluções tradicionais, que normalmente se limitam a cerca de 70 segundos sob as mesmas restrições de tokens.

Uma inovação fundamental é seu recurso de transcrição síncrona. Ao gerar fala, o modelo produz simultaneamente a transcrição de texto correspondente. Esse processo elimina a necessidade de uma etapa separada e adicional de reconhecimento automático de fala (ASR), resultando em latência zero para a saída de texto. Essa funcionalidade é particularmente valiosa para legendagem em tempo real, sistemas de interação por voz e ferramentas de criação de conteúdo.

Em avaliações subjetivas realizadas por humanos, o TADA alcançou o segundo lugar tanto em naturalidade quanto em similaridade de voz. Ele superou vários sistemas com maior número de parâmetros e dados de treinamento mais extensos, demonstrando uma qualidade de áudio altamente competitiva.

Link: https://huggingface.co/collections/HumeAI/tada

Artigo relacionado
MIIT Solicita Opiniões Públicas sobre 121 Padrões Industriais, Incluindo o Protocolo de Contexto para Modelos de IA MIIT Solicita Opiniões Públicas sobre 121 Padrões Industriais, Incluindo o Protocolo de Contexto para Modelos de IA O Ministério da Indústria e Tecnologia da Informação da China lançou oficialmente um comunicado solicitando feedback público sobre 121 projetos de padronização industrial, incluindo o “Requisitos de Segurança Aplicacional para o Protocolo de Contexto
A OpenAI se alia ao Departamento de Defesa dos EUA; as instalações do ChatGPT aumentam em 295%. A OpenAI se alia ao Departamento de Defesa dos EUA; as instalações do ChatGPT aumentam em 295%. Indignação Pública: A Parceria Militar da OpenAI Provoca uma “Onda de Desinstalações”Recentemente, a líder em tecnologia de IA, OpenAI, anunciou uma parceria profunda com o Departamento de Defesa dos EUA, integrando seus modelos de IA em redes milit
A OpenAI lança o recurso A OpenAI lança o recurso "Sites", marcando o fim da era "no-code" com sites criados a partir de texto A OpenAI lançou o Sites, um novo recurso para o Codex, sua IA para engenharia de software. Atualmente em fase de pré-lançamento, ele está disponível apenas para assinantes pagantes dos planos Business
Recomendações de tópicos especiais relacionados
Educação e Aprendizagem Melhores ferramentas de repetição espaçada com IA: otimize seus horários de estudo para estudantes de medicina e direito
Melhores ferramentas de repetição espaçada com IA: otimize seus horários de estudo para estudantes de medicina e direito

Descubra os melhores ferramentas de repetição espaçada em AI de 2026, selecionadas por XIX.AI. Nossas escolhas mais recomendadas e revolucionárias ajudam estudantes de medicina e direito a otimizar seus horários de estudo para uma melhor retenção do conhecimento. Compare opções gratuitas e pagas com testes reais e rankings atualizados semanalmente. Desfrute agora de uma vantagem competitiva no aprendizado.

10 ferramentas
xix.ai
Criação de vídeo As melhores plataformas de IA para conversão de texto em vídeo para redação de roteiros e narrativa visual
As melhores plataformas de IA para conversão de texto em vídeo para redação de roteiros e narrativa visual

As melhores plataformas de IA para conversão de texto em vídeo de 2026: as ferramentas mais bem avaliadas para redação de roteiros e narrativa visual. Descubra soluções poderosas e revolucionárias para transformar seu texto em vídeos envolventes. Compare opções gratuitas e pagas com nossos rankings atualizados semanalmente e testes práticos. Encontre a plataforma perfeita para impulsionar sua criatividade e produtividade. Explore a seleção especial no XIX.AI.

10 ferramentas
xix.ai
chatbot Orquestradores de Múltiplos Agentes IA: Projeto de Fluxos de Trabalho Automatizados Complexos através do Linguagem Natural
Orquestradores de Múltiplos Agentes IA: Projeto de Fluxos de Trabalho Automatizados Complexos através do Linguagem Natural

2026 Mais recente: Descubra os melhores orquestradores multi-agente de IA para projetar fluxos de trabalho automatizados complexos através do uso da linguagem natural. Nossa lista selecionada apresenta plataformas poderosas e altamente avaliadas para uma automação de tarefas sem falhas e um gerenciamento inteligente de processos. Compare opções gratuitas e pagas com informações reais do mundo real. Desfrute de uma vantagem competitiva com as classificações atualizadas semanalmente por especialistas da XIX.AI.

10 ferramentas
xix.ai
Edição de imagem Melhores softwares de redução de ruído por IA: Remova granulação e artefatos em fotografias noturnas com baixa luz
Melhores softwares de redução de ruído por IA: Remova granulação e artefatos em fotografias noturnas com baixa luz

Descubra os melhores softwares de redução de ruído por IA de 2026 para fotografias noturnas em baixas condições de luz. Nossa lista selecionada e avaliada compara ferramentas gratuitas e pagas, apresentando testes reais e classificações atualizadas semanalmente. Remova facilmente granulação e distorções nas imagens. Desfrute das vantagens da inteligência artificial em XIX.AI.

10 ferramentas
xix.ai
chatbot Os melhores geradores personalizados de namoradas virtuais com IA: crie personalidades, hobbies e histórias de vida exclusivas
Os melhores geradores personalizados de namoradas virtuais com IA: crie personalidades, hobbies e histórias de vida exclusivas

Descubra os melhores geradores personalizados de namoradas com IA de 2026 no XIX.AI. Explore nossa lista selecionada e com as melhores avaliações para criar personalidades únicas, hobbies e histórias de fundo detalhadas. Compare as opções gratuitas com as pagas com informações reais. Encontre hoje mesmo sua companheira criativa perfeita.

10 ferramentas
xix.ai
Produtividade Projetistas de arquitetura de IA: criem arquiteturas de sistemas escaláveis usando linguagem natural
Projetistas de arquitetura de IA: criem arquiteturas de sistemas escaláveis usando linguagem natural

Descubra as melhores ferramentas de projeto de arquitetura de IA de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta soluções poderosas e revolucionárias para criar arquiteturas de sistemas escaláveis usando linguagem natural. Compare opções gratuitas e pagas com informações práticas. Aproveite ao máximo sua vantagem em IA e otimize o desenvolvimento hoje mesmo.

10 ferramentas
xix.ai
Comentários (1)
0/500
NicholasLee
NicholasLee 29 de Abril de 2026 à51 01:00:51 WEST

TADA的開源真是業界良心!5倍速且無幻覺,這對需要即時語音合成的開發者來說太實用了。不過好奇它在複雜中文聲調的表現如何?有人測試過嗎?🤔

OR