вариант
Дом
Новости
Запомненные данные моделей искусственного интеллекта раскрыты в результате нарушения конфиденциальности CAMIA

Запомненные данные моделей искусственного интеллекта раскрыты в результате нарушения конфиденциальности CAMIA

13 ноября 2025 г.
115

Новая революционная атака на конфиденциальность выявляет уязвимости, определяя, использовались ли личные данные для обучения систем искусственного интеллекта.

Атака CAMIA (Context-Aware Membership Inference Attack), разработанная совместно исследователями Brave и Национального университета Сингапура, значительно превосходит предыдущие методы анализа памяти моделей ИИ.

Индустрия ИИ сталкивается с растущей обеспокоенностью по поводу "запоминания данных", когда модели непреднамеренно сохраняют конфиденциальную учебную информацию. ИИ в здравоохранении может раскрыть записи пациентов, а модели, обученные в корпорациях, могут запомнить конфиденциальную электронную почту.

Недавние события, такие как планы LinkedIn по использованию пользовательских данных для обучения ИИ, обострили споры о конфиденциальности, подчеркнув потенциальные риски появления конфиденциальной информации в генерируемом контенте.

Для обнаружения утечек данных специалисты по безопасности применяют атаки на членские выводы (MIA). Эти тесты, по сути, спрашивают модели: "Был ли этот конкретный пример частью вашего обучения?". Успешные атаки подтверждают опасные нарушения конфиденциальности.

Принцип заключается в том, что модели обрабатывают знакомые учебные данные иначе, чем новую информацию, и MIA систематически используют эти различия в поведении.

Традиционные MIA оказались неэффективны против современного генеративного ИИ, поскольку были разработаны для более простых моделей классификации. Большие языковые модели генерируют текст последовательно, что делает целостную оценку неадекватной для выявления утечек.

Инновация CAMIA признает, что запоминание ИИ зависит от контекста. Модели больше всего полагаются на запомненный контент, когда не уверены в последующих ответах.

Рассмотрим фразу "Гарри Поттер... написан... Мир Гарри..." - Модели легко предсказывают слово "Поттер" благодаря контекстуальным подсказкам, а не запоминанию.

Однако, если речь идет только о "Гарри", для предсказания "Поттера" требуется фактическое запоминание обучающих данных. Высокое доверие к предсказаниям в неоднозначных контекстах убедительно свидетельствует о заученном контенте.

CAMIA представляет собой первую атаку на конфиденциальность, разработанную специально для генеративного ИИ. Она отслеживает колебания неопределенности во время генерации текста, различая контекстуальное угадывание и реальное запоминание.

Тестирование на бенчмарках MIMIR с моделями Pythia и GPT-Neo дало впечатляющие результаты. В сравнении с моделью Pythia с параметрами 2,8 Б, CAMIA почти удвоила точность обнаружения, сохранив при этом минимальный коэффициент ложных срабатываний в 1%.

Атака работает эффективно - обработка 1000 образцов занимает около 38 минут на графическом процессоре A100, что делает ее пригодной для практического аудита моделей.

Это исследование подчеркивает риски конфиденциальности, присущие обучению массивных моделей на непроверенных наборах данных. Команда стремится продвигать методы сохранения приватности, которые позволяют сбалансировать полезность ИИ и защиту пользователей.

См. также: Samsung оценивает реальную производительность корпоративных моделей ИИ

Познакомьтесь с достижениями в области ИИ и больших данных на выставке AI & Big Data Expo в Амстердаме, Калифорнии и Лондоне. Это мероприятие, организованное TechEx, предлагает всестороннюю информацию наряду с ведущими технологическими конференциями.

Новости об искусственном интеллекте предоставляются компанией TechForge Media. Узнайте о предстоящих мероприятиях и вебинарах по корпоративным технологиям.

Связанная статья
На Meta подали иск в связи с нарушением конфиденциальности при использовании очков с ИИ: по сообщениям, сотрудники просматривали контент с откровенными сценами На Meta подали иск в связи с нарушением конфиденциальности при использовании очков с ИИ: по сообщениям, сотрудники просматривали контент с откровенными сценами Компания Meta столкнулась с новым судебным иском, связанным с нарушением конфиденциальности при использовании ее умных очков с искусственным интеллектом. Согласно расследованию шведских газет, сотрудн
Сэм Альтман из OpenAI объявляет о наступлении эры сверхинтеллекта Сэм Альтман из OpenAI объявляет о наступлении эры сверхинтеллекта Генеральный директор OpenAI Сэм Альтман объявил, что человечество вступило в эру искусственного сверхразума, и пути назад уже нет.«Мы прошли точку невозврата; восхождение началось, — говорит Альтман.
Бум искусственного интеллекта вызывает опасения, напоминающие пузырь эпохи доткомов Бум искусственного интеллекта вызывает опасения, напоминающие пузырь эпохи доткомов Приток многомиллиардных инвестиций в искусственный интеллект вызвал бурную дискуссию: не грозит ли отрасли пузырь, подобный тому, что был в сфере интернет-компаний?Инвесторы внимательно следят за любы
Рекомендации по связанным специальным темам
письмо Лучшие программы для создания персонажей в жанре научной фантастики: генерация последовательных мотиваций персонажей и их роковых недостатков
Лучшие программы для создания персонажей в жанре научной фантастики: генерация последовательных мотиваций персонажей и их роковых недостатков

Откройте для себя 20 лучших инструментов 2026 года для создания персонажей с помощью искусственного интеллекта, которые помогут вам придать своим героям глубину. В тщательно подобранном списке XIX.AI представлены самые популярные и революционные инструменты, способные генерировать правдоподобные мотивации и роковые недостатки персонажей. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой потенциал в области создания историй уже сейчас.

10 инструментов
xix.ai
Бизнес Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине
Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине

Откройте для себя лучшее программное обеспечение 2026 года для оптимизации цен с помощью ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены высокооцененные, революционные инструменты, которые отслеживают конкурентов и автоматически корректируют цены в вашем магазине для получения максимальной прибыли. Сравните бесплатные и платные варианты на основе реальных тестов. Получите преимущество в ценообразовании уже сейчас.

10 инструментов
xix.ai
код Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях
Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях

Откройте для себя 20 лучших рецензентов кода на базе ИИ 2026 года на XIX.AI. В нашем тщательно составленном списке представлены высокооцененные, революционные инструменты для автоматизации проверки соответствия стандартам чистого кода и рефакторинга файлов в устаревших репозиториях. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Получите преимущество ИИ уже сегодня.

10 инструментов
xix.ai
Преобразование текста в речь Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения
Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов
xix.ai
Создание комиксов Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии
Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов
xix.ai
Бизнес Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы
Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов
xix.ai
Комментарии (3)
0/500
BenGarcía
BenGarcía 2 июня 2026 г., 3:00:08 GMT+03:00

This is wild! 🤯 So basically they can tell if my personal data was used to train an AI? That's both cool and terrifying. What if companies get sued over this? Privacy laws need to catch up fast, because memorization is a real issue.

MarkHarris
MarkHarris 20 марта 2026 г., 9:00:36 GMT+03:00

Also das mit dem CAMIA-Angriff klingt echt nicht gut. KI-Modelle sollen doch keine persönlichen Daten speichern, oder? Wenn jetzt jeder prüfen kann, ob seine eigenen Daten im Training waren, wo soll das hinführen? Da müssen dringend strengere Datenschutzregeln für KI-Entwicklung her. Ist ja fast schon beängstigend, was da alles rauskommen könnte... 🤔

RalphSmith
RalphSmith 6 декабря 2025 г., 3:30:37 GMT+03:00

Слышали про CAMIA? Это кошмар для приватности! Теперь любой может узнать, использовались ли их данные для обучения ИИ. Время удалять свои фото из интернета 📸 А вы как думаете - стоит ли запретить сбор личных данных для ИИ?

OR