Chinesische KI -Zensur, die durch durchgesickerte Daten ausgesetzt ist

Heim

Nachricht

10. April 2025

WillGarcía

102

# China

Chinas Einsatz von KI zur Verbesserung seiner Zensurfähigkeiten hat ein neues Niveau erreicht, wie eine durchgesickerte Datenbank mit 133.000 Beispielen von Inhalten zeigt, die von der chinesischen Regierung als sensibel eingestuft wurden. Dieses ausgeklügelte große Sprachmodell (LLM) ist darauf ausgelegt, Inhalte zu einer Vielzahl von Themen automatisch zu erkennen und zu zensieren, von Armut in ländlichen Gebieten über Korruption innerhalb der Kommunistischen Partei bis hin zu subtiler politischer Satire.

Chinesische Flagge auf einem Mast hinter Stacheldraht

Dieses Foto, aufgenommen am 4. Juni 2019, zeigt die chinesische Flagge hinter Stacheldraht in einem Wohnkomplex in Yengisar, südlich von Kashgar, in Chinas westlicher Region Xinjiang. Bildnachweis: Greg Baker / AFP / Getty Images

Laut Xiao Qiang, einem Forscher an der UC Berkeley, der sich auf chinesische Zensur spezialisiert hat, ist diese Datenbank ein „klarer Beweis“ dafür, dass die chinesische Regierung oder ihre Partner LLMs nutzen, um ihre Repressionsbemühungen zu verstärken. Im Gegensatz zu traditionellen Methoden, die auf menschliche Moderatoren und Schlüsselwortfilter angewiesen sind, kann dieser KI-gestützte Ansatz die Effizienz und Präzision der staatlich kontrollierten Informationsverwaltung erheblich steigern.

Das Datenset, das vom Sicherheitsforscher NetAskari auf einer ungesicherten Elasticsearch-Datenbank entdeckt wurde, die auf einem Baidu-Server gehostet wird, enthält aktuelle Einträge vom Dezember 2024. Es ist unklar, wer genau das Datenset erstellt hat, aber sein Zweck ist offensichtlich: ein LLM zu trainieren, um Inhalte zu sensiblen Themen wie Umweltverschmutzung, Lebensmittelsicherheit, Finanzbetrug, Arbeitskonflikten und militärischen Angelegenheiten zu identifizieren und zu kennzeichnen. Politische Satire, insbesondere wenn sie historische Analogien oder Bezüge zu Taiwan enthält, ist ebenfalls ein vorrangiges Ziel.

ein Ausschnitt von JSON-Code, der sich auf Prompt-Token und LLMs bezieht. Viele der Inhalte sind auf Chinesisch.

Bildnachweis: Charles Rollet

Die Trainingsdaten umfassen verschiedene Beispiele für Inhalte, die potenziell soziale Unruhen auslösen könnten, wie Beschwerden über korrupte Polizeibeamte, Berichte über Armut in ländlichen Gebieten und Nachrichten über ausgeschlossene Funktionäre der Kommunistischen Partei. Das Datenset enthält auch umfangreiche Bezüge zu Taiwan und militärischen Themen, wobei das chinesische Wort für Taiwan (台湾) über 15.000 Mal vorkommt.

Die beabsichtigte Verwendung des Datensets wird als „Arbeit an der öffentlichen Meinung“ beschrieben, ein Begriff, den Michael Caster von Article 19 erklärt, der typischerweise mit der Cyberspace Administration of China (CAC) in Verbindung gebracht wird und Zensur- sowie Propaganda-Bemühungen umfasst. Dies steht im Einklang mit der Sichtweise des chinesischen Präsidenten Xi Jinping, der das Internet als die „Frontlinie“ der Arbeit der Kommunistischen Partei an der öffentlichen Meinung betrachtet.

Diese Entwicklung ist Teil eines breiteren Trends, bei dem autoritäre Regime KI-Technologie für repressive Zwecke einsetzen. OpenAI berichtete kürzlich, dass ein unbekannter Akteur, vermutlich aus China, generative KI nutzte, um soziale Medien zu überwachen und regierungskritische Beiträge an die chinesische Regierung weiterzuleiten. Dieselbe Technologie wurde auch verwendet, um kritische Kommentare über die prominente chinesische Dissidentin Cai Xia zu generieren.

Während Chinas traditionelle Zensurmethoden auf einfache Algorithmen angewiesen sind, um gesperrte Begriffe zu blockieren, stellt der Einsatz von LLMs einen bedeutenden Fortschritt dar. Diese KI-Systeme können selbst subtile Kritik in großem Maßstab erkennen und sich kontinuierlich verbessern, während sie mehr Daten verarbeiten.

„Ich denke, es ist entscheidend, hervorzuheben, wie sich die KI-gestützte Zensur weiterentwickelt und die staatliche Kontrolle über den öffentlichen Diskurs noch ausgefeilter macht, insbesondere zu einer Zeit, in der chinesische KI-Modelle wie DeepSeek Wellen schlagen“, sagte Xiao Qiang gegenüber TechCrunch.

Verwandter Artikel

Manus stellt 'Wide Research' AI-Tool mit über 100 Agenten für Web Scraping vor Der chinesische KI-Innovator Manus, der zuvor durch seine bahnbrechende Multi-Agenten-Orchestrierungsplattform für Verbraucher und professionelle Nutzer auf sich aufmerksam gemacht hat, hat eine bahnb

ByteDance enthüllt Seed-Thinking-v1.5 KI-Modell zur Verbesserung der Denkfähigkeiten Das Rennen um fortschrittliche denkende KI begann mit OpenAIs o1-Modell im September 2024 und gewann mit dem Start von DeepSeeks R1 im Januar 2025 an Dynamik.Wichtige KI-Entwickler konkurrieren nun da

Alibaba enthüllt Wan2.1-VACE: Open-Source-KI-Videolösung Alibaba hat Wan2.1-VACE vorgestellt, ein Open-Source-KI-Modell, das die Prozesse der Videoproduktion und -bearbeitung revolutionieren soll.VACE ist eine zentrale Komponente der Wan2.1-Video-KI-Modellf

Kommentare (38)

0/200

Einreichen

HarryRoberts

11. August 2025 20:01:05 MESZ

Whoa, 133,000 flagged posts? That's wild! China's AI censorship game is intense, but I'm curious—how do they even decide what's 'sensitive'? Sounds like a slippery slope. 😬

CharlesGonzalez

1. August 2025 15:47:34 MESZ

This leak is wild! 133,000 flagged posts show how deep China's AI censorship goes. It's like a digital Big Brother on steroids. 😳 Makes you wonder how much we're not seeing online.

ElijahWalker

22. Juli 2025 09:35:51 MESZ

This leak is wild! 133,000 flagged posts? That’s a scary peek into how AI’s being used to control speech in China. Makes you wonder how much is being filtered without us knowing. 😳

MichaelDavis

21. April 2025 10:06:03 MESZ

Essa ferramenta é reveladora! Mostra como a censura por AI na China é profunda. O vazamento do banco de dados é um pouco assustador, mas é importante saber o que está acontecendo nos bastidores. Definitivamente, algo que todos interessados em liberdade na internet devem conhecer. Fique de olho nisso! 👀

SebastianAnderson

20. April 2025 00:25:56 MESZ

Los datos filtrados sobre la censura de IA en China son escalofriantes. Es aterrador pensar en cómo se está utilizando la IA para controlar la información. Necesitamos más transparencia y menos censura, ¿no crees? 🤔

RoyYoung

19. April 2025 18:38:42 MESZ

中国的AI审查越来越失控了！😱 泄露了133,000个被标记内容的例子，显示出这有多深入。想到AI在自动审查东西，真是可怕。我们需要更多的透明度和更少的控制，对吧？🚫

Top -Nachrichten

Gemini 2.5 Pro jetzt unbegrenzt und billiger als Claude, GPT-4O Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen AI-Synchronisation: Ultimativer Leitfaden zur realistischen Stimmen-Erstellung Die KI von Cambium verwandelt Abfall Holz in Holz OpenAI verbessert den AI -Sprachassistenten für bessere Chats So stellen Sie sicher, dass Ihre Daten für die KI -Integration vertrauenswürdig sind NotebookLM erweitert weltweit, fügt Folien und eine verbesserte Faktenprüfung hinzu Optimierungen an US -Rechenzentren könnten 76 GW neue Leistungskapazität freischalten Google nutzt KI, um über 39 Millionen Anzeigenkonten für mutmaßlichen Betrug auszusetzen Künstliche Intelligenz Sprachklonierung: Das ultimative Handbuch zur Beherrschung der Sprachkonvertierung

Mehr

Vorgestellt