Lar
Google revela WAXAL: conjunto de dados de fala africana para impulsionar a soberania dos dados de IA

O Google lançou oficialmente o WAXAL, um novo conjunto de dados de fala focado em línguas africanas. Esta iniciativa abrange 21 línguas, como acoli, hausa, luganda e ioruba, enfrentando o desafio persistente da baixa precisão de reconhecimento e erros frequentes nos sistemas de IA para essas línguas.
Os principais destaques deste projeto incluem:
Soberania dos dados restaurada: ao contrário dos modelos anteriores dominados por grandes corporações, o conjunto de dados WAXAL é propriedade exclusiva das instituições africanas envolvidas na sua criação, e não do Google.
Grande escala e qualidade profissional: o conjunto de dados contém mais de 11.000 horas de fala e cerca de 2 milhões de gravações. Ele apresenta aproximadamente 1.250 horas de fala transcrita, juntamente com áudio de alta qualidade para aplicativos de conversão de texto em fala.
Possibilitando a inovação local: o projeto é de código aberto sob uma licença permissiva que permite o uso comercial. Instituições como a Universidade de Gana já estão aproveitando esses dados para impulsionar pesquisas localizadas de IA em áreas como saúde materna.
Apesar de obstáculos como a complexidade linguística e a falta de marcadores de tom, o lançamento do WAXAL sinaliza a mudança da África de fonte de dados para coproprietária da infraestrutura de IA. O Google pretende expandir o projeto para cobrir 27 idiomas, fortalecendo o papel da África no cenário da IA.
Artigo relacionado
Relatório do quarto trimestre do ano fiscal de 2026 da Alibaba: receita com IA dispara, ARR da plataforma BaiLian ultrapassa 10 bilhões de yuans
O Alibaba Group divulgou hoje seus resultados financeiros do quarto trimestre e do ano fiscal de 2026, indicando que seu negócio de nuvem impulsionado por IA está passando por um crescimento explosivo
Elon Musk perde ação judicial contra Sam Altman e OpenAI
A afirmação de Elon Musk de que os cofundadores da OpenAI o prejudicaram falhou quando nove jurados da Califórnia decidiram por unanimidade que suas ações judiciais foram apresentadas tarde demais.Musk acusou Sam Altman, Greg Brockman, a OpenAI e a
Por favor, forneça o título do artigo para que possamos reformulá-lo na forma de uma pergunta.
No panorama digital atual, a inteligência artificial está transformando setores em todos os âmbitos, e os blogs não são exceção. Os blogueiros estão constantemente em busca de maneiras de otimizar seu
Recomendações de tópicos especiais relacionados
Comentários (0)

O Google lançou oficialmente o WAXAL, um novo conjunto de dados de fala focado em línguas africanas. Esta iniciativa abrange 21 línguas, como acoli, hausa, luganda e ioruba, enfrentando o desafio persistente da baixa precisão de reconhecimento e erros frequentes nos sistemas de IA para essas línguas.
Os principais destaques deste projeto incluem:
Soberania dos dados restaurada: ao contrário dos modelos anteriores dominados por grandes corporações, o conjunto de dados WAXAL é propriedade exclusiva das instituições africanas envolvidas na sua criação, e não do Google.
Grande escala e qualidade profissional: o conjunto de dados contém mais de 11.000 horas de fala e cerca de 2 milhões de gravações. Ele apresenta aproximadamente 1.250 horas de fala transcrita, juntamente com áudio de alta qualidade para aplicativos de conversão de texto em fala.
Possibilitando a inovação local: o projeto é de código aberto sob uma licença permissiva que permite o uso comercial. Instituições como a Universidade de Gana já estão aproveitando esses dados para impulsionar pesquisas localizadas de IA em áreas como saúde materna.
Apesar de obstáculos como a complexidade linguística e a falta de marcadores de tom, o lançamento do WAXAL sinaliza a mudança da África de fonte de dados para coproprietária da infraestrutura de IA. O Google pretende expandir o projeto para cobrir 27 idiomas, fortalecendo o papel da África no cenário da IA.
Relatório do quarto trimestre do ano fiscal de 2026 da Alibaba: receita com IA dispara, ARR da plataforma BaiLian ultrapassa 10 bilhões de yuans
O Alibaba Group divulgou hoje seus resultados financeiros do quarto trimestre e do ano fiscal de 2026, indicando que seu negócio de nuvem impulsionado por IA está passando por um crescimento explosivo
Elon Musk perde ação judicial contra Sam Altman e OpenAI
A afirmação de Elon Musk de que os cofundadores da OpenAI o prejudicaram falhou quando nove jurados da Califórnia decidiram por unanimidade que suas ações judiciais foram apresentadas tarde demais.Musk acusou Sam Altman, Greg Brockman, a OpenAI e a
Por favor, forneça o título do artigo para que possamos reformulá-lo na forma de uma pergunta.
No panorama digital atual, a inteligência artificial está transformando setores em todos os âmbitos, e os blogs não são exceção. Os blogueiros estão constantemente em busca de maneiras de otimizar seu











