La Chine adopte le terme officiel « unité lexicale » pour désigner le « token »
Le site web du gouvernement chinois a récemment republié un article du Quotidien du Peuple citant l'Administration nationale des données, qui a officiellement désigné l'unité fondamentale des grands modèles, le « token », sous le nom de « mot-élément » dans les contextes formels. Le rapport indique que l'utilisation quotidienne des éléments de mot au sein de l'industrie chinoise de l'IA dépasse désormais les 140 000 milliards. Cette désignation officielle met non seulement un terme au débat académique et industriel de longue date sur la traduction chinoise du terme « token », mais marque également une nouvelle étape dans la normalisation de la terminologie technique des grands modèles au niveau national.

Auparavant, divers termes pour désigner le « token » se disputaient la faveur du secteur. Le chercheur Yang Bin, de l'Institut de recherche Tencent, avait proposé le terme « élément de modèle », suscitant un large débat. Par la suite, la suggestion de « Intelligence Element », avancée par Wang Xiaochuan, fondateur de Baichuan Intelligence, You Yang, fondateur de Lunchen Technology, et Hu Yilin, ancien professeur associé à l’université Tsinghua, a rencontré un vif succès sur les réseaux sociaux. Ce terme mettait en avant le rôle du token en tant qu’unité d’« intelligence générale » plutôt que de simple « calcul général ».
Le terme choisi par le gouvernement, « Word Element », met toutefois davantage l’accent sur la logique technique sous-jacente. Officiellement défini comme la plus petite unité permettant à l’IA de comprendre le langage humain, le niveau de granularité de segmentation d’un Word Element se situe entre les caractères et les mots. Cela permet une couverture plus précise des segments sémantiques lors du traitement de textes par des modèles de grande envergure. Alors que l'utilisation approche le cap historique des 140 000 milliards, une norme terminologique unifiée contribuera à réduire les coûts de communication dans l'ensemble du secteur et jettera des bases solides pour la quantification statistique et l'élaboration des politiques relatives aux futures infrastructures d'IA.
Article connexe
Bain prévoit un marché du SaaS de 100 milliards de dollars dans le domaine de l'automatisation par l'IA agentique
Bain & Company a estimé à 100 milliards de dollars la taille du marché américain pour les entreprises SaaS exploitant l'IA agentique. Selon le cabinet, ce marché résulte de l'automatisation des tâches
La politique rendant obligatoire l'utilisation de la recherche par IA provoque un exode, tandis que DuckDuckGo enregistre une forte augmentation du nombre d'utilisateurs
Suite à l'annonce faite par Google lors de sa conférence I/O 2026 concernant une refonte complète de son moteur de recherche axée sur l'IA, de nombreux utilisateurs se sont mis à rechercher des altern
Xiaohongshu se restructure : Conan nommé président, création d'un département dédié à l'IA et d'une division internationale Rednote
Le 30 avril, Xiaohongshu a adressé une note interne à l'ensemble de ses employés pour annoncer le lancement d'une nouvelle restructuration organisationnelle. Au cœur de cette évolution figure l'intégr
Recommandations de sujets spéciaux liés
commentaires (0)
Le site web du gouvernement chinois a récemment republié un article du Quotidien du Peuple citant l'Administration nationale des données, qui a officiellement désigné l'unité fondamentale des grands modèles, le « token », sous le nom de « mot-élément » dans les contextes formels. Le rapport indique que l'utilisation quotidienne des éléments de mot au sein de l'industrie chinoise de l'IA dépasse désormais les 140 000 milliards. Cette désignation officielle met non seulement un terme au débat académique et industriel de longue date sur la traduction chinoise du terme « token », mais marque également une nouvelle étape dans la normalisation de la terminologie technique des grands modèles au niveau national.

Auparavant, divers termes pour désigner le « token » se disputaient la faveur du secteur. Le chercheur Yang Bin, de l'Institut de recherche Tencent, avait proposé le terme « élément de modèle », suscitant un large débat. Par la suite, la suggestion de « Intelligence Element », avancée par Wang Xiaochuan, fondateur de Baichuan Intelligence, You Yang, fondateur de Lunchen Technology, et Hu Yilin, ancien professeur associé à l’université Tsinghua, a rencontré un vif succès sur les réseaux sociaux. Ce terme mettait en avant le rôle du token en tant qu’unité d’« intelligence générale » plutôt que de simple « calcul général ».
Le terme choisi par le gouvernement, « Word Element », met toutefois davantage l’accent sur la logique technique sous-jacente. Officiellement défini comme la plus petite unité permettant à l’IA de comprendre le langage humain, le niveau de granularité de segmentation d’un Word Element se situe entre les caractères et les mots. Cela permet une couverture plus précise des segments sémantiques lors du traitement de textes par des modèles de grande envergure. Alors que l'utilisation approche le cap historique des 140 000 milliards, une norme terminologique unifiée contribuera à réduire les coûts de communication dans l'ensemble du secteur et jettera des bases solides pour la quantification statistique et l'élaboration des politiques relatives aux futures infrastructures d'IA.
La politique rendant obligatoire l'utilisation de la recherche par IA provoque un exode, tandis que DuckDuckGo enregistre une forte augmentation du nombre d'utilisateurs
Suite à l'annonce faite par Google lors de sa conférence I/O 2026 concernant une refonte complète de son moteur de recherche axée sur l'IA, de nombreux utilisateurs se sont mis à rechercher des altern
Xiaohongshu se restructure : Conan nommé président, création d'un département dédié à l'IA et d'une division internationale Rednote
Le 30 avril, Xiaohongshu a adressé une note interne à l'ensemble de ses employés pour annoncer le lancement d'une nouvelle restructuration organisationnelle. Au cœur de cette évolution figure l'intégr





Maison






