Китайская цензура ИИ, выявленная просочившимися данными
Использование Китаем искусственного интеллекта для усиления своих цензурных возможностей достигло нового уровня, как показывает утёкшая база данных, содержащая 133 000 примеров контента, помеченного как чувствительный китайским правительством. Эта сложная большая языковая модель (LLM) разработана для автоматического обнаружения и цензурирования контента, связанного с широким спектром тем, от бедности в сельских районах до коррупции в Коммунистической партии и даже тонкой политической сатиры.

Эта фотография, сделанная 4 июня 2019 года, показывает китайский флаг за колючей проволокой в жилом комплексе в Йенгисаре, к югу от Кашгара, в западном регионе Синьцзян в Китае. Источник изображения: Greg Baker / AFP / Getty Images По словам Сяо Цяна, исследователя из UC Berkeley, специализирующегося на китайской цензуре, эта база данных является "явным доказательством" того, что китайское правительство или его аффилированные структуры используют LLM для усиления своих репрессивных усилий. В отличие от традиционных методов, зависящих от модераторов-людей и фильтрации по ключевым словам, этот подход, основанный на искусственном интеллекте, значительно повышает эффективность и точность государственного управления информацией.
Набор данных, обнаруженный исследователем безопасности NetAskari в незащищённой базе данных Elasticsearch, размещённой на сервере Baidu, включает недавние записи от декабря 2024 года. Неясно, кто именно создал этот набор данных, но его цель очевидна: обучить LLM выявлять и помечать контент, связанный с чувствительными темами, такими как загрязнение окружающей среды, безопасность пищевых продуктов, финансовые махинации, трудовые споры и военные вопросы. Политическая сатира, особенно если она включает исторические аналогии или упоминания Тайваня, также является приоритетной целью.

Источник изображения: Charles Rollet Обучающие данные включают различные примеры контента, который потенциально может вызвать социальные волнения, такие как жалобы на коррумпированных полицейских, сообщения о бедности в сельской местности и новости об исключённых из Коммунистической партии чиновниках. Набор данных также содержит множество ссылок на Тайвань и военные темы, при этом китайское слово для Тайваня (台湾) встречается более 15 000 раз.
Предполагаемое использование набора данных описывается как "работа с общественным мнением", термин, который, по словам Майкла Кастера из Article 19, обычно ассоциируется с Управлением киберпространства Китая (CAC) и включает усилия по цензуре и пропаганде. Это соответствует взглядам президента Китая Си Цзиньпина, который считает интернет "передовой линией" работы Коммунистической партии с общественным мнением.
Это развитие является частью более широкой тенденции, когда авторитарные режимы используют технологии искусственного интеллекта в репрессивных целях. OpenAI недавно сообщила, что неустановленный субъект, вероятно из Китая, использовал генеративный ИИ для мониторинга социальных сетей и пересылки антиправительственных постов китайскому правительству. Та же технология использовалась для генерации критических комментариев о известной китайской диссидентке Цай Ся.
Хотя традиционные методы цензуры в Китае полагаются на базовые алгоритмы для блокировки запрещённых терминов, использование LLM представляет значительный прогресс. Эти системы ИИ способны обнаруживать даже тонкую критику в массовом масштабе и постоянно совершенствуются по мере обработки большего объёма данных.
"Я считаю важным подчеркнуть, как развивается цензура, основанная на искусственном интеллекте, делая государственный контроль над общественным дискурсом ещё более изощрённым, особенно в то время, когда китайские модели ИИ, такие как DeepSeek, вызывают волну интереса", — сказал Сяо Цян в интервью TechCrunch.
Связанная статья
Немецкий суд принял сторону компании Teradyne Robotics и вынес судебный запрет в отношении компании Elite Robots
Дочерняя компания Teradyne — Universal Robots — недавно продемонстрировала на выставке MODEX свой мобильный манипулятор, оснащенный манипулятором-коллаборативным роботом UR. Источник: TeradyneНа этой
Hyundai представляет робота MobED на выставке AW в то время, как искусственный интеллект преобразует производство
Hyundai продемонстрирует своего робота MobED среди других корейских систем на выставке AW 2026. Источник: Hyundai Motor GroupРоботическая лаборатория Hyundai Motor Group представит свою мобильную плат
Seoul Automation World представит китайских производителей гуманоидных роботов
Пять ведущих китайских компаний, занимающихся разработкой гуманоидных роботов, примут участие в выставке в Сеуле. Источник: AW 2026Поскольку гуманоидные роботы вызывают растущий интерес со стороны мир
Рекомендации по связанным специальным темам
Комментарии (38)
Whoa, 133,000 flagged posts? That's wild! China's AI censorship game is intense, but I'm curious—how do they even decide what's 'sensitive'? Sounds like a slippery slope. 😬
This leak is wild! 133,000 flagged posts show how deep China's AI censorship goes. It's like a digital Big Brother on steroids. 😳 Makes you wonder how much we're not seeing online.
This leak is wild! 133,000 flagged posts? That’s a scary peek into how AI’s being used to control speech in China. Makes you wonder how much is being filtered without us knowing. 😳
Essa ferramenta é reveladora! Mostra como a censura por AI na China é profunda. O vazamento do banco de dados é um pouco assustador, mas é importante saber o que está acontecendo nos bastidores. Definitivamente, algo que todos interessados em liberdade na internet devem conhecer. Fique de olho nisso! 👀
Los datos filtrados sobre la censura de IA en China son escalofriantes. Es aterrador pensar en cómo se está utilizando la IA para controlar la información. Necesitamos más transparencia y menos censura, ¿no crees? 🤔
Использование Китаем искусственного интеллекта для усиления своих цензурных возможностей достигло нового уровня, как показывает утёкшая база данных, содержащая 133 000 примеров контента, помеченного как чувствительный китайским правительством. Эта сложная большая языковая модель (LLM) разработана для автоматического обнаружения и цензурирования контента, связанного с широким спектром тем, от бедности в сельских районах до коррупции в Коммунистической партии и даже тонкой политической сатиры.

По словам Сяо Цяна, исследователя из UC Berkeley, специализирующегося на китайской цензуре, эта база данных является "явным доказательством" того, что китайское правительство или его аффилированные структуры используют LLM для усиления своих репрессивных усилий. В отличие от традиционных методов, зависящих от модераторов-людей и фильтрации по ключевым словам, этот подход, основанный на искусственном интеллекте, значительно повышает эффективность и точность государственного управления информацией.
Набор данных, обнаруженный исследователем безопасности NetAskari в незащищённой базе данных Elasticsearch, размещённой на сервере Baidu, включает недавние записи от декабря 2024 года. Неясно, кто именно создал этот набор данных, но его цель очевидна: обучить LLM выявлять и помечать контент, связанный с чувствительными темами, такими как загрязнение окружающей среды, безопасность пищевых продуктов, финансовые махинации, трудовые споры и военные вопросы. Политическая сатира, особенно если она включает исторические аналогии или упоминания Тайваня, также является приоритетной целью.

Обучающие данные включают различные примеры контента, который потенциально может вызвать социальные волнения, такие как жалобы на коррумпированных полицейских, сообщения о бедности в сельской местности и новости об исключённых из Коммунистической партии чиновниках. Набор данных также содержит множество ссылок на Тайвань и военные темы, при этом китайское слово для Тайваня (台湾) встречается более 15 000 раз.
Предполагаемое использование набора данных описывается как "работа с общественным мнением", термин, который, по словам Майкла Кастера из Article 19, обычно ассоциируется с Управлением киберпространства Китая (CAC) и включает усилия по цензуре и пропаганде. Это соответствует взглядам президента Китая Си Цзиньпина, который считает интернет "передовой линией" работы Коммунистической партии с общественным мнением.
Это развитие является частью более широкой тенденции, когда авторитарные режимы используют технологии искусственного интеллекта в репрессивных целях. OpenAI недавно сообщила, что неустановленный субъект, вероятно из Китая, использовал генеративный ИИ для мониторинга социальных сетей и пересылки антиправительственных постов китайскому правительству. Та же технология использовалась для генерации критических комментариев о известной китайской диссидентке Цай Ся.
Хотя традиционные методы цензуры в Китае полагаются на базовые алгоритмы для блокировки запрещённых терминов, использование LLM представляет значительный прогресс. Эти системы ИИ способны обнаруживать даже тонкую критику в массовом масштабе и постоянно совершенствуются по мере обработки большего объёма данных.
"Я считаю важным подчеркнуть, как развивается цензура, основанная на искусственном интеллекте, делая государственный контроль над общественным дискурсом ещё более изощрённым, особенно в то время, когда китайские модели ИИ, такие как DeepSeek, вызывают волну интереса", — сказал Сяо Цян в интервью TechCrunch.
Немецкий суд принял сторону компании Teradyne Robotics и вынес судебный запрет в отношении компании Elite Robots
Дочерняя компания Teradyne — Universal Robots — недавно продемонстрировала на выставке MODEX свой мобильный манипулятор, оснащенный манипулятором-коллаборативным роботом UR. Источник: TeradyneНа этой
Hyundai представляет робота MobED на выставке AW в то время, как искусственный интеллект преобразует производство
Hyundai продемонстрирует своего робота MobED среди других корейских систем на выставке AW 2026. Источник: Hyundai Motor GroupРоботическая лаборатория Hyundai Motor Group представит свою мобильную плат
Seoul Automation World представит китайских производителей гуманоидных роботов
Пять ведущих китайских компаний, занимающихся разработкой гуманоидных роботов, примут участие в выставке в Сеуле. Источник: AW 2026Поскольку гуманоидные роботы вызывают растущий интерес со стороны мир
Whoa, 133,000 flagged posts? That's wild! China's AI censorship game is intense, but I'm curious—how do they even decide what's 'sensitive'? Sounds like a slippery slope. 😬
This leak is wild! 133,000 flagged posts show how deep China's AI censorship goes. It's like a digital Big Brother on steroids. 😳 Makes you wonder how much we're not seeing online.
This leak is wild! 133,000 flagged posts? That’s a scary peek into how AI’s being used to control speech in China. Makes you wonder how much is being filtered without us knowing. 😳
Essa ferramenta é reveladora! Mostra como a censura por AI na China é profunda. O vazamento do banco de dados é um pouco assustador, mas é importante saber o que está acontecendo nos bastidores. Definitivamente, algo que todos interessados em liberdade na internet devem conhecer. Fique de olho nisso! 👀
Los datos filtrados sobre la censura de IA en China son escalofriantes. Es aterrador pensar en cómo se está utilizando la IA para controlar la información. Necesitamos más transparencia y menos censura, ¿no crees? 🤔





Дом






