中国人工智能审查制度被泄漏的数据暴露
中国利用人工智能增强其审查能力已达到一个新水平,一份泄露的数据库显示,中国政府标记了133,000个敏感内容示例。这一复杂的大型语言模型(LLM)旨在自动检测和审查与多种话题相关的内容,从农村贫困到共产党内部的腐败,甚至是微妙的政治讽刺。

这张摄于2019年6月4日的照片显示,中国西部新疆地区喀什以南的焉耆县一处住宅区内,中国国旗在铁丝网后。图片来源:Greg Baker / AFP / Getty Images 据加州大学伯克利分校专门研究中国审查制度的研究员肖强表示,这一数据库是“明确证据”,证明中国政府或其关联机构正在使用大型语言模型来加强其压制努力。与依赖人工审查员和关键词过滤的传统方法不同,这种人工智能驱动的方法可以显著提高国家控制信息管理的效率和精确度。
该数据集由安全研究员NetAskari在一个未受保护的、托管在百度服务器上的Elasticsearch数据库中发现,包含2024年12月的最新条目。目前尚不清楚具体是谁创建了这个数据集,但其目的显而易见:训练大型语言模型以识别和标记与敏感话题相关的内容,如污染、食品安全、金融诈骗、劳动争议和军事事务。政治讽刺,尤其是涉及历史类比或台湾的内容,也是优先审查目标。

图片来源:Charles Rollet 训练数据包括可能引发社会动荡的各种内容示例,如对腐败警察的投诉、关于农村贫困的报道,以及关于被开除的共产党官员的新闻。数据集还包含大量关于台湾和军事相关话题的提及,其中“台湾”一词出现了超过15,000次。
数据集的用途被描述为“舆论工作”,Article 19的Michael Caster解释说,这个术语通常与中国国家互联网信息办公室(CAC)相关,涉及审查和宣传工作。这与习近平主席将互联网视为共产党舆论工作“前线”的观点一致。
这一发展是专制政权采用人工智能技术进行压制目的的更广泛趋势的一部分。OpenAI最近报告称,一个可能是来自中国的未识别行为者使用生成式人工智能监控社交媒体,并将反政府帖子转发给中国政府。同一技术还被用于生成针对著名中国异见人士蔡霞的批评评论。
虽然中国的传统审查方法依赖基本算法来屏蔽黑名单术语,但使用大型语言模型代表了重大进步。这些人工智能系统可以大规模检测甚至微妙的批评,并随着处理更多数据而不断改进。
“我认为必须强调人工智能驱动的审查如何演变,使国家对公共话语的控制更加复杂,尤其是在DeepSeek等中国人工智能模型掀起波澜的时刻,”肖强对TechCrunch表示。
相关文章
德国法院支持泰瑞达机器人公司,对Elite Robots下达禁令
泰瑞达旗下子公司Universal Robots近日在MODEX展会上展示了其配备UR协作机器人手臂的移动式机械手。来源:泰瑞达随着汉诺威工业博览会本周在德国拉开帷幕,汉堡地区法院针对Elite Robots Deutschland GmbH颁布了初步禁令。该裁决是针对泰瑞达机器人公司(Teradyne Robotics A/S)提起的版权侵权诉讼作出的。泰瑞达公司旗下子公司泰瑞达机器人(Tera
现代汽车在AW展会上推出MobED机器人,人工智能正重塑制造业格局
现代汽车将在2026年自动化世界大会上展示其MobED机器人及其他韩国系统。来源:现代汽车集团随着机器人技术和人工智能在制造业、物流业等领域应用日益广泛,现代汽车集团机器人实验室将于下周在首尔举办的智能工厂与自动化世界(AW)展会上首次亮相其MobED移动平台。本次展会还将汇聚其他顶尖工业机器人供应商。这款"移动偏心机器人"(MobED)于2025年12月首次亮相,通过四组独立控制的车轮及独特的偏
首尔自动化世界展会将展示中国类人机器人制造商
中国五大人形机器人领军企业将赴首尔参展并进行技术展示。来源:AW 2026随着人形机器人日益受到全球科技领袖、投资者及工业参与者的关注,中国五大顶尖人形机器人开发商将于下周首次齐聚韩国。被誉为"亚洲顶级制造AX博览会"的2026智能工厂与自动化世界博览会(AW)已确认AGIBOT、傅里叶、华为、乐聚、优树等企业参展。这些企业将在AW 2026附属活动"中国类人机器人大会"(亦称"中国类人机器人:首
相关专题推荐
评论 (38)
0/500
Whoa, 133,000 flagged posts? That's wild! China's AI censorship game is intense, but I'm curious—how do they even decide what's 'sensitive'? Sounds like a slippery slope. 😬
This leak is wild! 133,000 flagged posts show how deep China's AI censorship goes. It's like a digital Big Brother on steroids. 😳 Makes you wonder how much we're not seeing online.
This leak is wild! 133,000 flagged posts? That’s a scary peek into how AI’s being used to control speech in China. Makes you wonder how much is being filtered without us knowing. 😳
Essa ferramenta é reveladora! Mostra como a censura por AI na China é profunda. O vazamento do banco de dados é um pouco assustador, mas é importante saber o que está acontecendo nos bastidores. Definitivamente, algo que todos interessados em liberdade na internet devem conhecer. Fique de olho nisso! 👀
Los datos filtrados sobre la censura de IA en China son escalofriantes. Es aterrador pensar en cómo se está utilizando la IA para controlar la información. Necesitamos más transparencia y menos censura, ¿no crees? 🤔
中国利用人工智能增强其审查能力已达到一个新水平,一份泄露的数据库显示,中国政府标记了133,000个敏感内容示例。这一复杂的大型语言模型(LLM)旨在自动检测和审查与多种话题相关的内容,从农村贫困到共产党内部的腐败,甚至是微妙的政治讽刺。

据加州大学伯克利分校专门研究中国审查制度的研究员肖强表示,这一数据库是“明确证据”,证明中国政府或其关联机构正在使用大型语言模型来加强其压制努力。与依赖人工审查员和关键词过滤的传统方法不同,这种人工智能驱动的方法可以显著提高国家控制信息管理的效率和精确度。
该数据集由安全研究员NetAskari在一个未受保护的、托管在百度服务器上的Elasticsearch数据库中发现,包含2024年12月的最新条目。目前尚不清楚具体是谁创建了这个数据集,但其目的显而易见:训练大型语言模型以识别和标记与敏感话题相关的内容,如污染、食品安全、金融诈骗、劳动争议和军事事务。政治讽刺,尤其是涉及历史类比或台湾的内容,也是优先审查目标。

训练数据包括可能引发社会动荡的各种内容示例,如对腐败警察的投诉、关于农村贫困的报道,以及关于被开除的共产党官员的新闻。数据集还包含大量关于台湾和军事相关话题的提及,其中“台湾”一词出现了超过15,000次。
数据集的用途被描述为“舆论工作”,Article 19的Michael Caster解释说,这个术语通常与中国国家互联网信息办公室(CAC)相关,涉及审查和宣传工作。这与习近平主席将互联网视为共产党舆论工作“前线”的观点一致。
这一发展是专制政权采用人工智能技术进行压制目的的更广泛趋势的一部分。OpenAI最近报告称,一个可能是来自中国的未识别行为者使用生成式人工智能监控社交媒体,并将反政府帖子转发给中国政府。同一技术还被用于生成针对著名中国异见人士蔡霞的批评评论。
虽然中国的传统审查方法依赖基本算法来屏蔽黑名单术语,但使用大型语言模型代表了重大进步。这些人工智能系统可以大规模检测甚至微妙的批评,并随着处理更多数据而不断改进。
“我认为必须强调人工智能驱动的审查如何演变,使国家对公共话语的控制更加复杂,尤其是在DeepSeek等中国人工智能模型掀起波澜的时刻,”肖强对TechCrunch表示。
德国法院支持泰瑞达机器人公司,对Elite Robots下达禁令
泰瑞达旗下子公司Universal Robots近日在MODEX展会上展示了其配备UR协作机器人手臂的移动式机械手。来源:泰瑞达随着汉诺威工业博览会本周在德国拉开帷幕,汉堡地区法院针对Elite Robots Deutschland GmbH颁布了初步禁令。该裁决是针对泰瑞达机器人公司(Teradyne Robotics A/S)提起的版权侵权诉讼作出的。泰瑞达公司旗下子公司泰瑞达机器人(Tera
现代汽车在AW展会上推出MobED机器人,人工智能正重塑制造业格局
现代汽车将在2026年自动化世界大会上展示其MobED机器人及其他韩国系统。来源:现代汽车集团随着机器人技术和人工智能在制造业、物流业等领域应用日益广泛,现代汽车集团机器人实验室将于下周在首尔举办的智能工厂与自动化世界(AW)展会上首次亮相其MobED移动平台。本次展会还将汇聚其他顶尖工业机器人供应商。这款"移动偏心机器人"(MobED)于2025年12月首次亮相,通过四组独立控制的车轮及独特的偏
首尔自动化世界展会将展示中国类人机器人制造商
中国五大人形机器人领军企业将赴首尔参展并进行技术展示。来源:AW 2026随着人形机器人日益受到全球科技领袖、投资者及工业参与者的关注,中国五大顶尖人形机器人开发商将于下周首次齐聚韩国。被誉为"亚洲顶级制造AX博览会"的2026智能工厂与自动化世界博览会(AW)已确认AGIBOT、傅里叶、华为、乐聚、优树等企业参展。这些企业将在AW 2026附属活动"中国类人机器人大会"(亦称"中国类人机器人:首
Whoa, 133,000 flagged posts? That's wild! China's AI censorship game is intense, but I'm curious—how do they even decide what's 'sensitive'? Sounds like a slippery slope. 😬
This leak is wild! 133,000 flagged posts show how deep China's AI censorship goes. It's like a digital Big Brother on steroids. 😳 Makes you wonder how much we're not seeing online.
This leak is wild! 133,000 flagged posts? That’s a scary peek into how AI’s being used to control speech in China. Makes you wonder how much is being filtered without us knowing. 😳
Essa ferramenta é reveladora! Mostra como a censura por AI na China é profunda. O vazamento do banco de dados é um pouco assustador, mas é importante saber o que está acontecendo nos bastidores. Definitivamente, algo que todos interessados em liberdade na internet devem conhecer. Fique de olho nisso! 👀
Los datos filtrados sobre la censura de IA en China son escalofriantes. Es aterrador pensar en cómo se está utilizando la IA para controlar la información. Necesitamos más transparencia y menos censura, ¿no crees? 🤔





首页






