Maison
Un modèle linguistique tibétain remporte un franc succès au Salon des sciences et des technologies de Pékin

Lors de la 28e édition du Salon international des sciences, des technologies et de l'industrie de Pékin, en Chine, un modèle linguistique de grande envergure capable de « comprendre » le tibétain et de générer du contenu en s'inspirant de la pensée tibétaine a suscité un vif intérêt. Développé par une équipe de recherche de l'université du Tibet, ce modèle, baptisé « DeepZang », illustre les avancées de l'IA en matière de traitement multilingue et met en évidence la manière dont les langues minoritaires s'intègrent rapidement dans le paysage numérique mondial.
Pendant des années, les grands modèles linguistiques courants ont été principalement entraînés sur le chinois et l'anglais, ce qui a donné lieu à des résultats maladroits et fortement marqués par la traduction lorsqu'ils étaient appliqués à des langues minoritaires comme le tibétain. Pour surmonter ce défi, l’équipe de développement a rassemblé près de 70 millions de phrases parallèles tibétain-chinois et plus de 30 500 heures de données vocales, couvrant les trois principales régions dialectales tibétaines : l’Ü-Tsang, le Kham et l’Amdo.
Ce qui distingue ce grand modèle, c'est sa capacité à « penser en langue maternelle ». Lors du salon, il s'est révélé très pratique : rédiger un contrat de vente de yaks, composer un poème à la gloire des parents ou donner des conseils diététiques professionnels — ses réponses étaient précises et imprégnées du caractère culturel distinctif du tibétain. En intégrant la reconnaissance vocale à la classification des dialectes, il répond efficacement aux défis de communication découlant des différences majeures entre les dialectes tibétains parlés. Même les utilisateurs ayant un niveau d’alphabétisation limité peuvent interagir facilement par la voix.
Les progrès technologiques stimulent directement la productivité. Lobsang Dunyu, un traducteur basé à Shannan, au Tibet, a fait remarquer que la traduction assistée par l’IA permet désormais à une seule personne de traduire en un peu plus de 20 minutes un document qui nécessitait auparavant trois personnes et 40 minutes. Aujourd’hui, « DeepZang » compte plus de 300 000 utilisateurs, dont plus de 70 % ont entre 18 et 40 ans, répartis dans des régions reculées du Tibet, du Qinghai, du Sichuan et du Gansu.
Malgré ses capacités impressionnantes, la commercialisation de l’IA tibétaine se heurte encore à des obstacles tels que des coûts informatiques élevés et des pressions financières. En réponse, les responsables ont déclaré que leur première participation au salon visait à trouver des partenaires partageant les mêmes idées afin de relever ensemble les défis liés à la puissance de calcul et aux cycles économiques. À mesure que les réseaux 5G et les infrastructures électriques s'améliorent à travers le Tibet, l'IA tibétaine est en passe de devenir un pont solide reliant les locuteurs tibétains au monde numérique moderne.
Article connexe
Sandberg et Clegg rejoignent le conseil d'administration de Nscale alors que la start-up « Stargate Norway » atteint une valorisation de 14,6 milliards de dollars
Alors que la demande explose pour des centres de données capables de fournir des capacités de calcul IA à grande échelle, Nscale, une entreprise britannique spécialisée dans les infrastructures d'IA s
Avec une valorisation de 5,3 milliards de dollars, Runway défie Google alors que l'IA vidéo prend le pas sur l'IA linguistique
Alors que la plupart des géants de l'IA ont investi des milliards dans les modèles linguistiques, la start-up Runway, spécialisée dans la vidéo générative par IA, suit une voie très différente. Selon
Google va renforcer son investissement dans Anthropic, pour un montant total pouvant atteindre 40 milliards de dollars
Dans la course effrénée à l'IA, les géants de la tech multiplient les initiatives audacieuses. Selon les dernières informations, Google prévoit d'investir jusqu'à 10 milliards de dollars dans la start
Recommandations de sujets spéciaux liés
commentaires (0)

Lors de la 28e édition du Salon international des sciences, des technologies et de l'industrie de Pékin, en Chine, un modèle linguistique de grande envergure capable de « comprendre » le tibétain et de générer du contenu en s'inspirant de la pensée tibétaine a suscité un vif intérêt. Développé par une équipe de recherche de l'université du Tibet, ce modèle, baptisé « DeepZang », illustre les avancées de l'IA en matière de traitement multilingue et met en évidence la manière dont les langues minoritaires s'intègrent rapidement dans le paysage numérique mondial.
Pendant des années, les grands modèles linguistiques courants ont été principalement entraînés sur le chinois et l'anglais, ce qui a donné lieu à des résultats maladroits et fortement marqués par la traduction lorsqu'ils étaient appliqués à des langues minoritaires comme le tibétain. Pour surmonter ce défi, l’équipe de développement a rassemblé près de 70 millions de phrases parallèles tibétain-chinois et plus de 30 500 heures de données vocales, couvrant les trois principales régions dialectales tibétaines : l’Ü-Tsang, le Kham et l’Amdo.
Ce qui distingue ce grand modèle, c'est sa capacité à « penser en langue maternelle ». Lors du salon, il s'est révélé très pratique : rédiger un contrat de vente de yaks, composer un poème à la gloire des parents ou donner des conseils diététiques professionnels — ses réponses étaient précises et imprégnées du caractère culturel distinctif du tibétain. En intégrant la reconnaissance vocale à la classification des dialectes, il répond efficacement aux défis de communication découlant des différences majeures entre les dialectes tibétains parlés. Même les utilisateurs ayant un niveau d’alphabétisation limité peuvent interagir facilement par la voix.
Les progrès technologiques stimulent directement la productivité. Lobsang Dunyu, un traducteur basé à Shannan, au Tibet, a fait remarquer que la traduction assistée par l’IA permet désormais à une seule personne de traduire en un peu plus de 20 minutes un document qui nécessitait auparavant trois personnes et 40 minutes. Aujourd’hui, « DeepZang » compte plus de 300 000 utilisateurs, dont plus de 70 % ont entre 18 et 40 ans, répartis dans des régions reculées du Tibet, du Qinghai, du Sichuan et du Gansu.
Malgré ses capacités impressionnantes, la commercialisation de l’IA tibétaine se heurte encore à des obstacles tels que des coûts informatiques élevés et des pressions financières. En réponse, les responsables ont déclaré que leur première participation au salon visait à trouver des partenaires partageant les mêmes idées afin de relever ensemble les défis liés à la puissance de calcul et aux cycles économiques. À mesure que les réseaux 5G et les infrastructures électriques s'améliorent à travers le Tibet, l'IA tibétaine est en passe de devenir un pont solide reliant les locuteurs tibétains au monde numérique moderne.
Sandberg et Clegg rejoignent le conseil d'administration de Nscale alors que la start-up « Stargate Norway » atteint une valorisation de 14,6 milliards de dollars
Alors que la demande explose pour des centres de données capables de fournir des capacités de calcul IA à grande échelle, Nscale, une entreprise britannique spécialisée dans les infrastructures d'IA s
Avec une valorisation de 5,3 milliards de dollars, Runway défie Google alors que l'IA vidéo prend le pas sur l'IA linguistique
Alors que la plupart des géants de l'IA ont investi des milliards dans les modèles linguistiques, la start-up Runway, spécialisée dans la vidéo générative par IA, suit une voie très différente. Selon
Google va renforcer son investissement dans Anthropic, pour un montant total pouvant atteindre 40 milliards de dollars
Dans la course effrénée à l'IA, les géants de la tech multiplient les initiatives audacieuses. Selon les dernières informations, Google prévoit d'investir jusqu'à 10 milliards de dollars dans la start











