漏れたデータによって暴露された中国のAI検閲

家

ニュース

2025年4月10日

WillGarcía

102

# China

中国がAIを活用して検閲能力を強化したことは、13万3000件のコンテンツが中国政府によって機密性のためにフラグ付けされた漏洩データベースによって明らかにされ、新たなレベルに達しています。この高度な大規模言語モデル（LLM）は、農村部の貧困から共産党内の腐敗、さらには微妙な政治的風刺まで、幅広いトピックに関連するコンテンツを自動的に検出し、検閲するように設計されています。

有刺鉄線の背後にある旗竿に掲げられた中国国旗

2019年6月4日に撮影されたこの写真は、中国西部の新疆地域、カシュガルの南にあるイェンギサールの住宅地で、有刺鉄線の背後にある中国国旗を示しています。画像クレジット：Greg Baker / AFP / Getty Images

カリフォルニア大学バークレー校で中国の検閲を専門とする研究者、シャオ・チャンによると、このデータベースは中国政府またはその関連団体がLLMを使用して抑圧努力を強化している「明確な証拠」です。従来の人間のモデレーターやキーワードフィルタリングに依存する方法とは異なり、このAI駆動のアプローチは、国家が管理する情報管理の効率と精度を大幅に向上させることができます。

セキュリティ研究者のNetAskariが、Baiduサーバー上で保護されていないElasticsearchデータベースで発見したこのデータセットには、2024年12月からの最近のエントリーが含まれています。データセットを作成したのが誰かは不明ですが、その目的は明らかです：汚染、食品安全、金融詐欺、労働争議、軍事問題などの機密トピックに関連するコンテンツを特定し、フラグ付けするLLMを訓練することです。歴史的類推や台湾への言及を含む政治的風刺も、優先度の高いターゲットです。

プロンプトトークンとLLMを参照するJSONコードのスニペット。内容の多くは中国語です。

画像クレジット：Charles Rollet

トレーニングデータには、腐敗した警察官への不満、農村部の貧困に関する報告、共産党から追放された役人に関するニュースなど、社会不安を引き起こす可能性のあるさまざまなコンテンツの例が含まれています。データセットには、台湾や軍事関連のトピックへの広範な言及も含まれており、「台湾」という中国語が1万5000回以上出現しています。

データセットの意図された用途は「世論工作」と記述されており、Article 19のマイケル・キャスターが説明するところでは、通常、中国サイバースペース管理局（CAC）に関連し、検閲とプロパガンダの努力を伴います。これは、中国の習近平国家主席がインターネットを共産党の世論工作の「最前線」と見なす見解と一致しています。

この発展は、権威主義政権が抑圧目的でAI技術を採用する広範な傾向の一部です。OpenAIは最近、中国と思われる未特定のアクターが生成AIを使用してソーシャルメディアを監視し、反政府的な投稿を中国政府に転送していたと報告しました。同じ技術は、著名な中国の反体制派、蔡霞に対する批判的なコメントを生成するためにも使用されました。

中国の従来の検閲方法は、ブラックリストに登録された用語をブロックする基本的なアルゴリズムに依存していますが、LLMの使用は大きな進歩を表しています。これらのAIシステムは、大規模な微妙な批判を検出し、データを処理するにつれて継続的に改善することができます。

「AI駆動の検閲がどのように進化しているかを強調することは、特にDeepSeekのような中国のAIモデルが注目を集めている時期に、国家が公共の言論をより高度に制御していることを示すために重要だと思います」と、シャオ・チャンはTechCrunchに語りました。

バイトダンスがSeed-Thinking-v1.5 AIモデルを公開し、推論能力を向上高度な推論AIの競争は、2024年9月にOpenAIのo1モデルで始まり、2025年1月のDeepSeekのR1ローンチで勢いを増しました。主要なAI開発企業は現在、より高速でコスト効率の高い推論AIモデルを開発するために競争しており、チェーン・オブ・ソートプロセスを通じて正確でよく考え抜かれた応答を提供し、回答前に正確性を確保しています。TikTokの親会社であるバイトダンスは、技術論文で概要が

AlibabaがWan2.1-VACEを発表：オープンソースAIビデオソリューション Alibabaは、ビデオ作成および編集プロセスを革新するオープンソースAIモデル、Wan2.1-VACEを発表しました。VACEは、AlibabaのWan2.1ビデオAIモデルファミリーの主要なコンポーネントであり、同社はこれが「業界初の多様なビデオ生成および編集タスクに対応する包括的なソリューションを提供するオープンソースモデル」だと主張しています。もしAlibabaがビデオ制作プロセスを効率化

华为CEO任正非が語る中国のAI野心とレジリエンス戦略华为CEO任正非が中国のAI環境と同社が直面する課題について率直な見解を共有。「深く考えていない」と任は人民日報のQ&Aで述べる。「考えすぎは無駄だ。」戦略計画と危機対応の時代に、彼のアドバイスは驚くほどシンプル：「障害を無視し、行動して着実に進む。」この哲学は、グローバルな制裁と制限の中で华为を導き、任の回答に静かな決意を反映。华为のAscend AIチップについて語る際、任は誇張を避け率直。過

コメント (38)

0/200

提出する

HarryRoberts

2025年8月12日 3:01:05 JST

Whoa, 133,000 flagged posts? That's wild! China's AI censorship game is intense, but I'm curious—how do they even decide what's 'sensitive'? Sounds like a slippery slope. 😬

CharlesGonzalez

2025年8月1日 22:47:34 JST

This leak is wild! 133,000 flagged posts show how deep China's AI censorship goes. It's like a digital Big Brother on steroids. 😳 Makes you wonder how much we're not seeing online.

ElijahWalker

2025年7月22日 16:35:51 JST

This leak is wild! 133,000 flagged posts? That’s a scary peek into how AI’s being used to control speech in China. Makes you wonder how much is being filtered without us knowing. 😳

MichaelDavis

2025年4月21日 17:06:03 JST

Essa ferramenta é reveladora! Mostra como a censura por AI na China é profunda. O vazamento do banco de dados é um pouco assustador, mas é importante saber o que está acontecendo nos bastidores. Definitivamente, algo que todos interessados em liberdade na internet devem conhecer. Fique de olho nisso! 👀

SebastianAnderson

2025年4月20日 7:25:56 JST

Los datos filtrados sobre la censura de IA en China son escalofriantes. Es aterrador pensar en cómo se está utilizando la IA para controlar la información. Necesitamos más transparencia y menos censura, ¿no crees? 🤔

RoyYoung

2025年4月20日 1:38:42 JST

中国的AI审查越来越失控了！😱 泄露了133,000个被标记内容的例子，显示出这有多深入。想到AI在自动审查东西，真是可怕。我们需要更多的透明度和更少的控制，对吧？🚫

トップニュース

Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します AIボイスクローン：音声変換を極めるための完全ガイド

もっと

特集