Modelo de linguagem tibetana é aclamado na Feira de Ciência e Tecnologia de Pequim

Na 28ª Exposição Internacional de Ciência, Tecnologia e Indústria de Pequim, na China, um modelo de linguagem de grande escala capaz de “compreender” o tibetano e gerar conteúdo utilizando um raciocínio próprio da cultura tibetana chamou bastante a atenção. Desenvolvido por uma equipe de pesquisa da Universidade do Tibete, esse modelo — chamado “DeepZang” — demonstra os avanços da IA no processamento multilíngue e destaca como as línguas minoritárias estão se integrando rapidamente ao panorama digital global.
Durante anos, os principais modelos de linguagem de grande porte foram treinados predominantemente em chinês e inglês, resultando em resultados com forte caráter de tradução e pouco naturais quando aplicados a línguas minoritárias como o tibetano. Para superar esse desafio, a equipe de desenvolvimento reuniu quase 70 milhões de frases paralelas tibetano-chinesas e mais de 30.500 horas de dados de voz, cobrindo as três principais regiões dialetais tibetanas: Ü-Tsang, Kham e Amdo.
O que diferencia esse grande modelo é sua capacidade de “pensamento na língua nativa”. Na exposição, ele se mostrou altamente prático: redigir um contrato de comércio de iaques, compor um poema em homenagem aos pais ou oferecer orientação alimentar profissional — suas respostas foram precisas e impregnadas do caráter cultural distintivo do tibetano. Ao integrar o reconhecimento de impressão vocal com a classificação de dialetos, ele resolve de forma eficaz os desafios de comunicação decorrentes das grandes diferenças entre os dialetos tibetanos falados. Mesmo usuários com alfabetização limitada podem interagir facilmente por meio da voz.
O progresso tecnológico impulsiona diretamente a produtividade. Lobsang Dunyu, tradutor baseado em Shannan, no Tibete, observou que a tradução assistida por IA permite que um documento que antes exigia três pessoas e 40 minutos seja agora concluído por uma única pessoa em pouco mais de 20 minutos. Hoje, o “DeepZang” tem mais de 300.000 usuários, com mais de 70% entre 18 e 40 anos, abrangendo regiões remotas no Tibete, Qinghai, Sichuan e Gansu.
Apesar de suas capacidades impressionantes, a comercialização da IA tibetana ainda enfrenta obstáculos, como altos custos de computação e pressões financeiras. Em resposta, as autoridades afirmaram que sua primeira participação na exposição teve como objetivo encontrar parceiros com visões semelhantes para enfrentar em conjunto os desafios relacionados ao poder de computação e aos ciclos de negócios. À medida que as redes 5G e a infraestrutura de energia melhoram em todo o Tibete, a IA tibetana está pronta para se tornar uma ponte sólida ligando os falantes do tibetano ao mundo digital moderno.
Artigo relacionado
A avaliação de US$ 5,3 bilhões da Runway desafia o Google, à medida que a IA de vídeo supera a de linguagem
Enquanto a maioria dos gigantes da IA investiu bilhões em modelos de linguagem, a startup de vídeo com IA generativa Runway segue em frente por um caminho bem diferente. De acordo com o TechCrunch, es
Google vai aumentar investimento na Anthropic; valor total pode chegar a US$ 40 bilhões
Na acirrada corrida pela IA, as principais empresas de tecnologia estão tomando medidas cada vez mais ousadas. De acordo com os últimos relatos, o Google planeja investir até US$ 10 bilhões na startup
Lançado o motor de xadrez de IA de código aberto e gratuito Maia 3 para aprimorar a experiência de jogo dos jogadores
A equipe do Maia Chess lançou um novo motor de xadrez de código aberto, o Maia 3, treinado com 250 milhões de partidas reais disputadas por humanos. Ele atinge uma classificação Elo de cerca de 1800 —
Recomendações de tópicos especiais relacionados
Comentários (0)

Na 28ª Exposição Internacional de Ciência, Tecnologia e Indústria de Pequim, na China, um modelo de linguagem de grande escala capaz de “compreender” o tibetano e gerar conteúdo utilizando um raciocínio próprio da cultura tibetana chamou bastante a atenção. Desenvolvido por uma equipe de pesquisa da Universidade do Tibete, esse modelo — chamado “DeepZang” — demonstra os avanços da IA no processamento multilíngue e destaca como as línguas minoritárias estão se integrando rapidamente ao panorama digital global.
Durante anos, os principais modelos de linguagem de grande porte foram treinados predominantemente em chinês e inglês, resultando em resultados com forte caráter de tradução e pouco naturais quando aplicados a línguas minoritárias como o tibetano. Para superar esse desafio, a equipe de desenvolvimento reuniu quase 70 milhões de frases paralelas tibetano-chinesas e mais de 30.500 horas de dados de voz, cobrindo as três principais regiões dialetais tibetanas: Ü-Tsang, Kham e Amdo.
O que diferencia esse grande modelo é sua capacidade de “pensamento na língua nativa”. Na exposição, ele se mostrou altamente prático: redigir um contrato de comércio de iaques, compor um poema em homenagem aos pais ou oferecer orientação alimentar profissional — suas respostas foram precisas e impregnadas do caráter cultural distintivo do tibetano. Ao integrar o reconhecimento de impressão vocal com a classificação de dialetos, ele resolve de forma eficaz os desafios de comunicação decorrentes das grandes diferenças entre os dialetos tibetanos falados. Mesmo usuários com alfabetização limitada podem interagir facilmente por meio da voz.
O progresso tecnológico impulsiona diretamente a produtividade. Lobsang Dunyu, tradutor baseado em Shannan, no Tibete, observou que a tradução assistida por IA permite que um documento que antes exigia três pessoas e 40 minutos seja agora concluído por uma única pessoa em pouco mais de 20 minutos. Hoje, o “DeepZang” tem mais de 300.000 usuários, com mais de 70% entre 18 e 40 anos, abrangendo regiões remotas no Tibete, Qinghai, Sichuan e Gansu.
Apesar de suas capacidades impressionantes, a comercialização da IA tibetana ainda enfrenta obstáculos, como altos custos de computação e pressões financeiras. Em resposta, as autoridades afirmaram que sua primeira participação na exposição teve como objetivo encontrar parceiros com visões semelhantes para enfrentar em conjunto os desafios relacionados ao poder de computação e aos ciclos de negócios. À medida que as redes 5G e a infraestrutura de energia melhoram em todo o Tibete, a IA tibetana está pronta para se tornar uma ponte sólida ligando os falantes do tibetano ao mundo digital moderno.
A avaliação de US$ 5,3 bilhões da Runway desafia o Google, à medida que a IA de vídeo supera a de linguagem
Enquanto a maioria dos gigantes da IA investiu bilhões em modelos de linguagem, a startup de vídeo com IA generativa Runway segue em frente por um caminho bem diferente. De acordo com o TechCrunch, es
Google vai aumentar investimento na Anthropic; valor total pode chegar a US$ 40 bilhões
Na acirrada corrida pela IA, as principais empresas de tecnologia estão tomando medidas cada vez mais ousadas. De acordo com os últimos relatos, o Google planeja investir até US$ 10 bilhões na startup





Lar






