オプション
ニュース
漏れたデータによって暴露された中国のAI検閲

漏れたデータによって暴露された中国のAI検閲

2025年4月10日
88

中国がAIを活用して検閲能力を強化したことは、13万3000件のコンテンツが中国政府によって機密性のためにフラグ付けされた漏洩データベースによって明らかにされ、新たなレベルに達しています。この高度な大規模言語モデル(LLM)は、農村部の貧困から共産党内の腐敗、さらには微妙な政治的風刺まで、幅広いトピックに関連するコンテンツを自動的に検出し、検閲するように設計されています。

有刺鉄線の背後にある旗竿に掲げられた中国国旗

2019年6月4日に撮影されたこの写真は、中国西部の新疆地域、カシュガルの南にあるイェンギサールの住宅地で、有刺鉄線の背後にある中国国旗を示しています。画像クレジット:Greg Baker / AFP / Getty Images

カリフォルニア大学バークレー校で中国の検閲を専門とする研究者、シャオ・チャンによると、このデータベースは中国政府またはその関連団体がLLMを使用して抑圧努力を強化している「明確な証拠」です。従来の人間のモデレーターやキーワードフィルタリングに依存する方法とは異なり、このAI駆動のアプローチは、国家が管理する情報管理の効率と精度を大幅に向上させることができます。

セキュリティ研究者のNetAskariが、Baiduサーバー上で保護されていないElasticsearchデータベースで発見したこのデータセットには、2024年12月からの最近のエントリーが含まれています。データセットを作成したのが誰かは不明ですが、その目的は明らかです:汚染、食品安全、金融詐欺、労働争議、軍事問題などの機密トピックに関連するコンテンツを特定し、フラグ付けするLLMを訓練することです。歴史的類推や台湾への言及を含む政治的風刺も、優先度の高いターゲットです。

プロンプトトークンとLLMを参照するJSONコードのスニペット。内容の多くは中国語です。

画像クレジット:Charles Rollet

トレーニングデータには、腐敗した警察官への不満、農村部の貧困に関する報告、共産党から追放された役人に関するニュースなど、社会不安を引き起こす可能性のあるさまざまなコンテンツの例が含まれています。データセットには、台湾や軍事関連のトピックへの広範な言及も含まれており、「台湾」という中国語が1万5000回以上出現しています。

データセットの意図された用途は「世論工作」と記述されており、Article 19のマイケル・キャスターが説明するところでは、通常、中国サイバースペース管理局(CAC)に関連し、検閲とプロパガンダの努力を伴います。これは、中国の習近平国家主席がインターネットを共産党の世論工作の「最前線」と見なす見解と一致しています。

この発展は、権威主義政権が抑圧目的でAI技術を採用する広範な傾向の一部です。OpenAIは最近、中国と思われる未特定のアクターが生成AIを使用してソーシャルメディアを監視し、反政府的な投稿を中国政府に転送していたと報告しました。同じ技術は、著名な中国の反体制派、蔡霞に対する批判的なコメントを生成するためにも使用されました。

中国の従来の検閲方法は、ブラックリストに登録された用語をブロックする基本的なアルゴリズムに依存していますが、LLMの使用は大きな進歩を表しています。これらのAIシステムは、大規模な微妙な批判を検出し、データを処理するにつれて継続的に改善することができます。

「AI駆動の検閲がどのように進化しているかを強調することは、特にDeepSeekのような中国のAIモデルが注目を集めている時期に、国家が公共の言論をより高度に制御していることを示すために重要だと思います」と、シャオ・チャンはTechCrunchに語りました。

関連記事
AlibabaがWan2.1-VACEを発表:オープンソースAIビデオソリューション AlibabaがWan2.1-VACEを発表:オープンソースAIビデオソリューション Alibabaは、ビデオ作成および編集プロセスを革新するオープンソースAIモデル、Wan2.1-VACEを発表しました。VACEは、AlibabaのWan2.1ビデオAIモデルファミリーの主要なコンポーネントであり、同社はこれが「業界初の多様なビデオ生成および編集タスクに対応する包括的なソリューションを提供するオープンソースモデル」だと主張しています。もしAlibabaがビデオ制作プロセスを効率化
华为CEO任正非が語る中国のAI野心とレジリエンス戦略 华为CEO任正非が語る中国のAI野心とレジリエンス戦略 华为CEO任正非が中国のAI環境と同社が直面する課題について率直な見解を共有。「深く考えていない」と任は人民日報のQ&Aで述べる。「考えすぎは無駄だ。」戦略計画と危機対応の時代に、彼のアドバイスは驚くほどシンプル:「障害を無視し、行動して着実に進む。」この哲学は、グローバルな制裁と制限の中で华为を導き、任の回答に静かな決意を反映。华为のAscend AIチップについて語る際、任は誇張を避け率直。過
中国はコンピュータービジョン監視研究におけるグローバルランキングをトップにします:CSET 中国はコンピュータービジョン監視研究におけるグローバルランキングをトップにします:CSET セキュリティおよび新興技術センター(CSET)からの最近の研究は、AI関連の監視技術の研究における中国の重要なリードに光を当てています。 **人口の視覚的監視のためのAI研究の傾向** **というタイトルのレポートは、中国の研究SECをどのように掘り下げますか
コメント (37)
0/200
CharlesGonzalez
CharlesGonzalez 2025年8月1日 22:47:34 JST

This leak is wild! 133,000 flagged posts show how deep China's AI censorship goes. It's like a digital Big Brother on steroids. 😳 Makes you wonder how much we're not seeing online.

ElijahWalker
ElijahWalker 2025年7月22日 16:35:51 JST

This leak is wild! 133,000 flagged posts? That’s a scary peek into how AI’s being used to control speech in China. Makes you wonder how much is being filtered without us knowing. 😳

MichaelDavis
MichaelDavis 2025年4月21日 17:06:03 JST

Essa ferramenta é reveladora! Mostra como a censura por AI na China é profunda. O vazamento do banco de dados é um pouco assustador, mas é importante saber o que está acontecendo nos bastidores. Definitivamente, algo que todos interessados em liberdade na internet devem conhecer. Fique de olho nisso! 👀

SebastianAnderson
SebastianAnderson 2025年4月20日 7:25:56 JST

Los datos filtrados sobre la censura de IA en China son escalofriantes. Es aterrador pensar en cómo se está utilizando la IA para controlar la información. Necesitamos más transparencia y menos censura, ¿no crees? 🤔

RoyYoung
RoyYoung 2025年4月20日 1:38:42 JST

中国的AI审查越来越失控了!😱 泄露了133,000个被标记内容的例子,显示出这有多深入。想到AI在自动审查东西,真是可怕。我们需要更多的透明度和更少的控制,对吧?🚫

EdwardTaylor
EdwardTaylor 2025年4月20日 0:12:20 JST

このツールは本当に驚きですね!中国のAIによる検閲がどれだけ深いかがよく分かります。データベースの漏洩はちょっと怖いですが、裏側で何が起こっているかを知ることは重要です。インターネットの自由に興味がある人は必見ですよ!👀

トップに戻ります
OR