Dados memorizados de modelos de IA expostos na violação de privacidade da CAMIA

Lar

Notícias

13 de Novembro de 2025

EricDavis

115

# ethics # models # Society # privacy

Um novo e inovador ataque à privacidade expõe vulnerabilidades ao detectar se dados pessoais foram usados para treinar sistemas de IA.

Desenvolvido em conjunto por pesquisadores da Brave e da Universidade Nacional de Cingapura, o CAMIA (Context-Aware Membership Inference Attack) supera significativamente os métodos anteriores de análise da memória do modelo de IA.

O setor de IA enfrenta preocupações crescentes com a "memorização de dados", em que os modelos retêm involuntariamente informações confidenciais de treinamento. A IA do setor de saúde pode divulgar registros de pacientes, enquanto modelos treinados por empresas podem regurgitar e-mails confidenciais.

Desenvolvimentos recentes, como os planos do LinkedIn de utilizar dados de usuários para treinamento de IA, intensificaram os debates sobre privacidade, destacando os possíveis riscos de informações confidenciais aparecerem no conteúdo gerado.

Os profissionais de segurança empregam ataques de inferência de membros (MIAs) para detectar vazamentos de dados. Esses testes basicamente perguntam aos modelos: "Esse exemplo específico fez parte do seu treinamento?" Ataques bem-sucedidos confirmam violações de privacidade perigosas.

O princípio decorre do fato de os modelos processarem dados de treinamento familiares de forma diferente das novas informações - os MIAs exploram sistematicamente essas diferenças de comportamento.

Os MIAs tradicionais se mostraram ineficazes contra a IA geradora moderna porque foram projetados para modelos de classificação mais simples. Grandes modelos de linguagem geram texto sequencialmente, tornando as avaliações holísticas inadequadas para detectar vazamentos.

A inovação da CAMIA reconhece que a memorização da IA depende do contexto. Os modelos dependem mais do conteúdo memorizado quando não têm certeza das respostas subsequentes.

Considere a frase "Harry Potter é... escrito por... O mundo de Harry..." - Os modelos preveem facilmente "Potter" por meio de pistas contextuais em vez de memorização.

No entanto, se for considerado apenas "Harry", a previsão de "Potter" exige a memorização real dos dados de treinamento. As previsões de alta confiança em contextos ambíguos indicam fortemente o conteúdo memorizado.

A CAMIA representa o primeiro ataque à privacidade projetado especificamente para IA generativa. Ele rastreia as flutuações de incerteza durante a geração de texto, distinguindo entre adivinhação contextual e recuperação genuína.

Os testes em benchmarks MIMIR com os modelos Pythia e GPT-Neo produziram resultados impressionantes. Contra um modelo Pythia de 2,8B parâmetros, a CAMIA quase dobrou a precisão da detecção, mantendo uma taxa mínima de 1% de falsos positivos.

O ataque opera de forma eficiente - o processamento de 1.000 amostras leva cerca de 38 minutos em uma GPU A100, o que o torna viável para a auditoria prática de modelos.

Essa pesquisa ressalta os riscos à privacidade inerentes ao treinamento de modelos maciços em conjuntos de dados não verificados. A equipe tem como objetivo promover técnicas de preservação da privacidade que equilibrem a utilidade da IA com a proteção do usuário.

Veja também: Samsung avalia a produtividade real dos modelos de IA corporativos

Explore os avanços da IA e do Big Data na AI & Big Data Expo em Amsterdã, Califórnia e Londres. Esse evento afiliado à TechEx oferece insights abrangentes juntamente com as principais conferências de tecnologia.

As notícias sobre IA são trazidas a você pela TechForge Media. Descubra os próximos eventos e webinars sobre tecnologia empresarial.

Artigo relacionado

Meta enfrenta processo judicial por questões de privacidade relacionadas aos óculos com IA, já que funcionários teriam visualizado conteúdo explícito A Meta enfrenta um novo processo judicial relacionado a questões de privacidade envolvendo seus óculos inteligentes com IA. De acordo com uma investigação realizada por jornais suecos, funcionários de

Sam Altman, da OpenAI, declara o início da era da superinteligência O CEO da OpenAI, Sam Altman, anunciou que a humanidade entrou na era da superinteligência artificial e que não há mais volta.“Passamos do ponto sem volta; a ascensão começou”, afirma Altman. “Estamos

O boom da IA ecoa as preocupações com a bolha da era das pontocom O influxo de investimentos multimilionários em IA alimentou um debate acalorado: o setor está caminhando para uma bolha semelhante à das empresas ponto com?Os investidores estão atentos a qualquer arr

Recomendações de tópicos especiais relacionados

escrita

Os melhores criadores de perfis de ficção com IA: gerar motivações consistentes para personagens e falhas fatais

Descubra os melhores criadores de perfis de ficção com IA de 2026 para criar personagens complexos. A lista selecionada pela XIX.AI apresenta ferramentas de ponta e revolucionárias que geram motivações consistentes e falhas fatais. Compare as opções gratuitas com as pagas por meio de testes práticos. Liberte agora o seu potencial narrativo.

10 ferramentas

xix.ai

Negócios

Os melhores softwares de otimização de preços com IA: acompanhe os concorrentes e ajuste automaticamente os preços da loja

Descubra os melhores softwares de otimização de preços com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta ferramentas de ponta e revolucionárias que monitoram os concorrentes e ajustam automaticamente os preços da sua loja para maximizar o lucro. Compare opções gratuitas e pagas com testes práticos. Obtenha sua vantagem competitiva em preços agora mesmo.

10 ferramentas

xix.ai

código

Os melhores revisores de código com IA: automatize a conformidade com o código limpo e refatore arquivos de repositórios legados

Descubra os melhores revisores de código com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta ferramentas de ponta e revolucionárias para automatizar a conformidade com o código limpo e refatorar arquivos de repositórios legados. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Obtenha sua vantagem com IA hoje mesmo.

10 ferramentas

xix.ai

Conversão de texto para fala

Os melhores aplicativos de TTS com IA para dislexia: apoio à aprendizagem e à eficiência na leitura para alunos

Descubra os melhores aplicativos de TTS com IA de 2026, selecionados especialmente para auxiliar na dislexia. Nossas classificações especializadas comparam ferramentas gratuitas e pagas, destacando recursos avançados para melhorar a eficiência na leitura e na aprendizagem. Explore soluções inovadoras e imperdíveis para revelar o potencial dos alunos. Comece sua jornada no XIX.AI.

10 ferramentas

xix.ai

Criação de quadrinhos

Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia

Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!

15 ferramentas

xix.ai

Negócios

Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas

xix.ai

Comentários (3)

0/500

Por favor, faça o login primeiro

BenGarcía

2 de Junho de 2026 à8 01:00:08 WEST

This is wild! 🤯 So basically they can tell if my personal data was used to train an AI? That's both cool and terrifying. What if companies get sued over this? Privacy laws need to catch up fast, because memorization is a real issue.

MarkHarris

20 de Março de 2026 à36 06:00:36 WET

Also das mit dem CAMIA-Angriff klingt echt nicht gut. KI-Modelle sollen doch keine persönlichen Daten speichern, oder? Wenn jetzt jeder prüfen kann, ob seine eigenen Daten im Training waren, wo soll das hinführen? Da müssen dringend strengere Datenschutzregeln für KI-Entwicklung her. Ist ja fast schon beängstigend, was da alles rauskommen könnte... 🤔

RalphSmith

6 de Dezembro de 2025 à37 00:30:37 WET

Слышали про CAMIA? Это кошмар для приватности! Теперь любой может узнать, использовались ли их данные для обучения ИИ. Время удалять свои фото из интернета 📸 А вы как думаете - стоит ли запретить сбор личных данных для ИИ?

Principais notícias

AI Builder e Power Automate Revolucionam a Sumarização de Documentos Hosts de IA do podcast Notebooklm agora disponíveis para entrevistas China revela padrão nacional para robôs humanóides e inteligência incorporada Platôs de adoção de IA corporativa, revelam dados da Ramp Tutorial do Criador de Imagens do Bing: Guia de Geração de Arte por IA Aprenda a criar música de IA usando sua voz: um tutorial passo a passo do SUNO iMyFone MagicMic: Revisão e Tutorial de Mudança de Voz AI em Tempo Real Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como uma revolução na IA multimodal A Embodied Intelligence divulga a primeira norma do setor para conter o crescimento descontrolado

Mais

Apresentou