China legt den offiziellen Namen für „Token“ als „Wort-Einheit“ fest
Die Website der chinesischen Regierung hat kürzlich einen Artikel der „People’s Daily“ erneut veröffentlicht, in dem unter Berufung auf die Nationale Datenverwaltung berichtet wird, dass diese die Grundeinheit großer Modelle, „Token“, in offiziellen Kontexten offiziell als „Wortelement“ bezeichnet hat. Dem Bericht zufolge übersteigt die tägliche Nutzung von Wortelementen in Chinas KI-Branche mittlerweile 140 Billionen. Diese maßgebliche Festlegung beendet nicht nur die langjährige akademische und brancheninterne Debatte über die chinesische Übersetzung von „Token“, sondern bedeutet auch einen weiteren Schritt zur Standardisierung der Fachterminologie für große Modelle auf nationaler Ebene.

Zuvor konkurrierten innerhalb der Branche verschiedene Begriffe für „Token“. Der Wissenschaftler Yang Bin vom Tencent Research Institute schlug „Model Element“ vor, was eine breite Diskussion auslöste. Später fand der Vorschlag „Intelligence Element“, der von Wang Xiaochuan, dem Gründer von Baichuan Intelligence, You Yang, dem Gründer von Lunchen Technology, und Hu Yilin, dem ehemaligen außerordentlichen Professor der Tsinghua-Universität, vorgebracht wurde, in den sozialen Medien große Resonanz. Dieser Begriff hob die Rolle des Tokens als Einheit der „allgemeinen Intelligenz“ hervor und nicht nur als Einheit der „allgemeinen Berechnung“.
Der von der Regierung gewählte Begriff „Word Element“ konzentriert sich jedoch stärker auf die zugrunde liegende technische Logik. Offiziell erklärt als kleinste Einheit, mit der KI menschliche Sprache verstehen kann, liegt die Segmentierungsgranularität eines Word Elements zwischen Zeichen und Wörtern. Dies ermöglicht eine präzisere Erfassung semantischer Ausschnitte bei der Textverarbeitung durch große Modelle. Da die Nutzung sich dem historischen Meilenstein von 140 Billionen nähert, wird ein einheitlicher Terminologiestandard dazu beitragen, die Kommunikationskosten branchenweit zu senken und eine solide Grundlage für die statistische Quantifizierung und die Politikgestaltung im Zusammenhang mit der zukünftigen KI-Infrastruktur zu schaffen.
Verwandter Artikel
Hauptinvestor von Suno: Das Löschen von Beiträgen wird die Lücke bei Urheberrechtsklagen nicht schließen
Die mit Spannung erwartete KI-Plattform zur Musikgenerierung „Suno“ steht vor einem harten Rechtsstreit um Urheberrechte, und eine unverblümte Äußerung ihres Hauptinvestors könnte der Gegenseite genau
Claude Opus 4.7 startet mit dem Grundsatz, dass Zuverlässigkeit vor Intelligenz geht
Anthropic hat in diesem Jahr ein hohes Tempo beibehalten und fast jeden zweiten Tag neue Funktionen eingeführt. Das mit Spannung erwartete Claude Opus 4.7 wurde soeben offiziell veröffentlicht, und in
Haier bringt den weltweit leichtesten KI-Sport-Exoskelett-Roboter mit einem Gewicht von nur 1,75 kg auf den Markt
Die Haier Group hat den weltweit leichtesten KI-gestützten Exoskelett-Roboter für den Sport vorgestellt – den Haier Exoskeleton Robot W3. Diese Markteinführung stellt einen neuen Branchenrekord in Sac
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Die Website der chinesischen Regierung hat kürzlich einen Artikel der „People’s Daily“ erneut veröffentlicht, in dem unter Berufung auf die Nationale Datenverwaltung berichtet wird, dass diese die Grundeinheit großer Modelle, „Token“, in offiziellen Kontexten offiziell als „Wortelement“ bezeichnet hat. Dem Bericht zufolge übersteigt die tägliche Nutzung von Wortelementen in Chinas KI-Branche mittlerweile 140 Billionen. Diese maßgebliche Festlegung beendet nicht nur die langjährige akademische und brancheninterne Debatte über die chinesische Übersetzung von „Token“, sondern bedeutet auch einen weiteren Schritt zur Standardisierung der Fachterminologie für große Modelle auf nationaler Ebene.

Zuvor konkurrierten innerhalb der Branche verschiedene Begriffe für „Token“. Der Wissenschaftler Yang Bin vom Tencent Research Institute schlug „Model Element“ vor, was eine breite Diskussion auslöste. Später fand der Vorschlag „Intelligence Element“, der von Wang Xiaochuan, dem Gründer von Baichuan Intelligence, You Yang, dem Gründer von Lunchen Technology, und Hu Yilin, dem ehemaligen außerordentlichen Professor der Tsinghua-Universität, vorgebracht wurde, in den sozialen Medien große Resonanz. Dieser Begriff hob die Rolle des Tokens als Einheit der „allgemeinen Intelligenz“ hervor und nicht nur als Einheit der „allgemeinen Berechnung“.
Der von der Regierung gewählte Begriff „Word Element“ konzentriert sich jedoch stärker auf die zugrunde liegende technische Logik. Offiziell erklärt als kleinste Einheit, mit der KI menschliche Sprache verstehen kann, liegt die Segmentierungsgranularität eines Word Elements zwischen Zeichen und Wörtern. Dies ermöglicht eine präzisere Erfassung semantischer Ausschnitte bei der Textverarbeitung durch große Modelle. Da die Nutzung sich dem historischen Meilenstein von 140 Billionen nähert, wird ein einheitlicher Terminologiestandard dazu beitragen, die Kommunikationskosten branchenweit zu senken und eine solide Grundlage für die statistische Quantifizierung und die Politikgestaltung im Zusammenhang mit der zukünftigen KI-Infrastruktur zu schaffen.
Hauptinvestor von Suno: Das Löschen von Beiträgen wird die Lücke bei Urheberrechtsklagen nicht schließen
Die mit Spannung erwartete KI-Plattform zur Musikgenerierung „Suno“ steht vor einem harten Rechtsstreit um Urheberrechte, und eine unverblümte Äußerung ihres Hauptinvestors könnte der Gegenseite genau
Claude Opus 4.7 startet mit dem Grundsatz, dass Zuverlässigkeit vor Intelligenz geht
Anthropic hat in diesem Jahr ein hohes Tempo beibehalten und fast jeden zweiten Tag neue Funktionen eingeführt. Das mit Spannung erwartete Claude Opus 4.7 wurde soeben offiziell veröffentlicht, und in
Haier bringt den weltweit leichtesten KI-Sport-Exoskelett-Roboter mit einem Gewicht von nur 1,75 kg auf den Markt
Die Haier Group hat den weltweit leichtesten KI-gestützten Exoskelett-Roboter für den Sport vorgestellt – den Haier Exoskeleton Robot W3. Diese Markteinführung stellt einen neuen Branchenrekord in Sac





Heim






