La violación de la privacidad de CAMIA deja al descubierto los datos memorizados de modelos de inteligencia artificial

Hogar

Noticias

13 de noviembre de 2025

EricDavis

115

# ethics # models # Society # privacy

Un nuevo e innovador ataque a la privacidad pone al descubierto vulnerabilidades al detectar si se han utilizado datos personales para entrenar sistemas de IA.

Desarrollado conjuntamente por investigadores de Brave y de la Universidad Nacional de Singapur, CAMIA (Context-Aware Membership Inference Attack) supera con creces los métodos anteriores para analizar la memoria de los modelos de IA.

La industria de la IA se enfrenta a una creciente preocupación por la "memorización de datos", en la que los modelos retienen involuntariamente información de entrenamiento sensible. La IA sanitaria podría revelar historiales de pacientes, mientras que los modelos entrenados para empresas podrían regurgitar correos electrónicos confidenciales.

Acontecimientos recientes como los planes de LinkedIn de utilizar los datos de los usuarios para el entrenamiento de la IA han intensificado los debates sobre la privacidad, poniendo de relieve los riesgos potenciales de que aparezca información sensible en el contenido generado.

Los profesionales de la seguridad emplean Ataques de Inferencia de Membresía (MIA) para detectar fugas de datos. Estas pruebas esencialmente preguntan a los modelos: "¿Este ejemplo concreto formaba parte de tu formación?". Los ataques exitosos confirman peligrosas violaciones de la privacidad.

El principio se basa en que los modelos procesan los datos de entrenamiento conocidos de forma diferente a la información nueva: los MIA explotan estas diferencias de comportamiento de forma sistemática.

Los MIA tradicionales resultaron ineficaces contra la IA generativa moderna porque se diseñaron para modelos de clasificación más sencillos. Los grandes modelos lingüísticos generan texto de forma secuencial, por lo que las evaluaciones holísticas resultan inadecuadas para detectar filtraciones.

La innovación de CAMIA reconoce que la memorización de la IA depende del contexto. Los modelos recurren más al contenido memorizado cuando no están seguros de las respuestas posteriores.

Pensemos en la frase "Harry Potter está... escrito por... El mundo de Harry..." - los modelos predicen fácilmente "Potter" gracias a pistas contextuales más que a la memorización.

Sin embargo, si sólo se dice "Harry", para predecir "Potter" hay que memorizar los datos de entrenamiento. Las predicciones de alta fiabilidad en contextos ambiguos indican claramente que se ha memorizado el contenido.

CAMIA representa el primer ataque a la privacidad diseñado específicamente para la IA generativa. Realiza un seguimiento de las fluctuaciones de incertidumbre durante la generación de texto, distinguiendo entre la adivinación contextual y la memorización real.

Las pruebas realizadas en los parámetros MIMIR con los modelos Pythia y GPT-Neo arrojaron resultados impresionantes. Frente a un modelo Pythia de 2,8 mil millones de parámetros, CAMIA casi duplicó la precisión de detección, manteniendo una tasa mínima de falsos positivos del 1%.

El ataque funciona de forma eficiente: procesar 1.000 muestras lleva aproximadamente 38 minutos en una GPU A100, lo que lo hace viable para la auditoría práctica de modelos.

Esta investigación subraya los riesgos para la privacidad inherentes al entrenamiento de modelos masivos en conjuntos de datos no verificados. El objetivo del equipo es promover técnicas de preservación de la privacidad que equilibren la utilidad de la IA con la protección del usuario.

Véase también: Samsung evalúa la productividad real de los modelos empresariales de IA

Explore los avances de la IA y los macrodatos en la AI & Big Data Expo de Ámsterdam, California y Londres. Este evento afiliado a TechEx ofrece información exhaustiva junto con las principales conferencias tecnológicas.

TechForge Media pone a su disposición AI News. Descubra los próximos eventos y seminarios web sobre tecnología empresarial.

Artículo relacionado

Meta se enfrenta a una demanda por la privacidad de sus gafas con IA, ya que, según se informa, algunos empleados vieron contenido explícito Meta se enfrenta a una nueva demanda relacionada con cuestiones de privacidad en torno a sus gafas inteligentes con IA. Según una investigación realizada por varios periódicos suecos, los trabajadores

Sam Altman, de OpenAI, declara el amanecer de la era de la superinteligencia. El director ejecutivo de OpenAI, Sam Altman, ha anunciado que la humanidad ha entrado en la era de la superinteligencia artificial y que ya no hay vuelta atrás.«Hemos pasado el punto de no retorno; el

El auge de la IA recuerda las preocupaciones sobre la burbuja de la era puntocom La afluencia de inversiones multimillonarias en IA ha alimentado un acalorado debate: ¿se encamina la industria hacia una burbuja similar a la de las puntocom?Los inversores están atentos a cualquier

Recomendaciones de temas especiales relacionados

escribiendo

Los mejores creadores de perfiles de ficción con IA: cómo generar motivaciones y defectos fatales coherentes para los personajes

Descubre los mejores creadores de perfiles de ficción con IA de 2026 para dar vida a personajes profundos. La selección de XIX.AI incluye herramientas de primera categoría y revolucionarias que generan motivaciones coherentes y defectos fatales. Compara las opciones gratuitas con las de pago mediante pruebas en el mundo real. Libera ahora tu potencial narrativo.

10 herramientas

xix.ai

Negocio

El mejor software de optimización de precios con IA: realiza un seguimiento de la competencia y ajusta automáticamente los precios de la tienda

Descubre el mejor software de optimización de precios con IA de 2026 en XIX.AI. Nuestra selección incluye herramientas de primera categoría y revolucionarias que analizan a la competencia y ajustan automáticamente los precios de tu tienda para maximizar los beneficios. Compara las opciones gratuitas con las de pago mediante pruebas reales. Aprovecha ahora tu ventaja competitiva en materia de precios.

10 herramientas

xix.ai

código

Los mejores revisores de código basados en IA: automatiza el cumplimiento de las normas de código limpio y refactoriza los archivos de repositorios heredados

Descubre los mejores revisores de código con IA de 2026 en XIX.AI. Nuestra lista seleccionada incluye herramientas de primera categoría y revolucionarias para automatizar el cumplimiento de las normas de código limpio y refactorizar archivos de repositorios heredados. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo tu ventaja con la IA.

10 herramientas

xix.ai

Texto a voz

Las mejores aplicaciones de síntesis de voz con IA para la dislexia: apoyo al aprendizaje y mejora de la eficiencia en la lectura de los estudiantes

Descubre las mejores aplicaciones de TTS con IA de 2026, seleccionadas específicamente para ayudar a las personas con dislexia. Nuestra clasificación, elaborada por expertos, compara herramientas gratuitas y de pago, y destaca sus potentes funciones para mejorar la eficiencia en la lectura y el aprendizaje. Explora soluciones innovadoras e imprescindibles para liberar el potencial de los estudiantes. Empieza tu viaje en XIX.AI.

10 herramientas

xix.ai

Creación de cómics

Los mejores generadores de IA para manga shonen: crea secuencias de acción trepidantes y efectos de energía

Descubre los mejores generadores de IA para manga shonen de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas para crear secuencias de acción trepidantes y efectos energéticos dinámicos. Compara las opciones gratuitas con las de pago mediante pruebas reales. ¡Libera tu potencial creativo y empieza a crear manga épico hoy mismo!

15 herramientas

xix.ai

Negocio

Los mejores gestores de gastos con IA: escanea recibos y clasifica automáticamente los gastos de la empresa

Los mejores gestores de gastos con IA de 2026: las herramientas mejor valoradas para escanear recibos y clasificar automáticamente los gastos de la empresa. Descubre soluciones potentes y revolucionarias para una gestión de gastos sin esfuerzo, un seguimiento financiero preciso y un cumplimiento normativo optimizado. Nuestra comparativa, seleccionada y actualizada semanalmente, entre opciones gratuitas y de pago te ayuda a encontrar la que mejor se adapta a tus necesidades. Aprovecha al máximo las ventajas de la IA con las recomendaciones de los expertos de XIX.AI.

10 herramientas

xix.ai

comentario (3)

0/500

Inicie sesión primero

BenGarcía

2 de junio de 2026 02:00:08 GMT+02:00

This is wild! 🤯 So basically they can tell if my personal data was used to train an AI? That's both cool and terrifying. What if companies get sued over this? Privacy laws need to catch up fast, because memorization is a real issue.

MarkHarris

20 de marzo de 2026 07:00:36 GMT+01:00

Also das mit dem CAMIA-Angriff klingt echt nicht gut. KI-Modelle sollen doch keine persönlichen Daten speichern, oder? Wenn jetzt jeder prüfen kann, ob seine eigenen Daten im Training waren, wo soll das hinführen? Da müssen dringend strengere Datenschutzregeln für KI-Entwicklung her. Ist ja fast schon beängstigend, was da alles rauskommen könnte... 🤔

RalphSmith

6 de diciembre de 2025 01:30:37 GMT+01:00

Слышали про CAMIA? Это кошмар для приватности! Теперь любой может узнать, использовались ли их данные для обучения ИИ. Время удалять свои фото из интернета 📸 А вы как думаете - стоит ли запретить сбор личных данных для ИИ?

Noticias principales

AI Builder y Power Automate Revolucionan la Sumarización de Documentos Los anfitriones de AI del podcast Notebooklm ahora están disponibles para entrevistas China presenta su robot humanoide nacional y sus estándares de inteligencia incorporada Los datos de Ramp revelan un estancamiento en la adopción de la IA por parte de las empresas Guía de creación de arte con el creador de imágenes de Bing Aprende a crear música de IA usando tu voz: un tutorial de Suno paso a paso iMyFone MagicMic: Revisión y Tutorial de Cambio de Voz AI en Tiempo Real Generadores de Video AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como un revolucionario sistema de IA multimodal Embodied Intelligence presenta la primera norma del sector para frenar el crecimiento descontrolado

Más

Presentado