选项
首页
新闻
CAMIA 隐私泄露事件暴露了人工智能模型的记忆数据

CAMIA 隐私泄露事件暴露了人工智能模型的记忆数据

2025-11-13
115

一种突破性的新型隐私攻击通过检测个人数据是否被用于训练人工智能系统来暴露漏洞。

CAMIA(情境感知成员推理攻击)由Brave和新加坡国立大学的研究人员联合开发,其性能大大优于以往的人工智能模型记忆分析方法。

人工智能行业面临着越来越多的 "数据记忆 "问题,即模型无意中保留了敏感的训练信息。医疗保健领域的人工智能可能会泄露病人记录,而企业训练的模型则可能会反刍机密邮件。

LinkedIn 计划利用用户数据进行人工智能训练等最新进展加剧了对隐私问题的争论,凸显了敏感信息出现在生成内容中的潜在风险。

安全专家采用成员推理攻击(MIAs)来检测数据泄露。这些测试主要是询问模型"这个具体例子是你培训的一部分吗?成功的攻击会确认危险的隐私泄露。

其原理源于模型处理熟悉的训练数据的方式与处理新信息的方式不同--MIA 系统地利用了这些行为差异。

事实证明,传统的 MIA 对现代生成式人工智能无效,因为它们是为更简单的分类模型设计的。大型语言模型是按顺序生成文本的,因此整体评估不足以发现漏洞。

CAMIA 的创新认识到,人工智能的记忆取决于上下文。在不确定后续反应时,模型最依赖于记忆内容。

考虑一下 "哈利-波特是......写的......哈利的世界......"。- 通过上下文线索而不是记忆,模型很容易预测出 "波特"。

然而,如果只给出 "哈利",预测 "波特 "则需要实际记忆训练数据。在模棱两可的语境中,高置信度的预测结果有力地表明了记忆内容。

CAMIA 是首个专为生成式人工智能设计的隐私攻击工具。它跟踪文本生成过程中的不确定性波动,区分上下文猜测和真正的回忆。

使用 Pythia 和 GPT-Neo 模型在 MIMIR 基准上进行的测试结果令人印象深刻。与参数为 2.8B 的 Pythia 模型相比,CAMIA 将检测准确率提高了近一倍,同时保持了最低的 1%误报率。

这种攻击的运行效率很高--在 A100 GPU 上处理 1,000 个样本大约需要 38 分钟,这使它在实际模型审计中变得可行。

这项研究强调了在未经审核的数据集上训练大规模模型所固有的隐私风险。该团队旨在推广隐私保护技术,在人工智能的实用性和用户保护之间取得平衡。

另请参见:三星为企业人工智能模型的实际生产力设定基准

在阿姆斯特丹、加利福尼亚和伦敦举行的人工智能和大数据博览会上探索人工智能和大数据的发展。这一 TechEx 附属活动与领先的技术会议一起提供全面的见解。

人工智能新闻由 TechForge Media 为您提供。了解即将举行的企业技术活动和网络研讨会。

相关文章
据报道员工浏览了露骨内容,Meta因AI眼镜隐私问题面临诉讼 据报道员工浏览了露骨内容,Meta因AI眼镜隐私问题面临诉讼 Meta正面临一起涉及其AI智能眼镜隐私问题的新诉讼。据瑞典媒体调查,一家位于肯尼亚的分包商员工一直在审查客户的视频 footage。据报道,这些视频包含裸露、性行为以及人们如厕等敏感内容。Meta表示会在图像中对人脸进行模糊处理,但新闻报道援引消息人士称,这一措施并非总是有效。这一调查结果促使英国信息专员办公室展开调查。这家科技巨头目前在美国也面临法律诉讼。在最新提交的诉状中,由公益律所克拉克森
OpenAI创始人山姆·阿尔特曼宣告超级智能时代来临 OpenAI创始人山姆·阿尔特曼宣告超级智能时代来临 OpenAI首席执行官山姆·奥尔特曼宣布,人类已进入人工智能超级智能时代,且无法回头。"我们已越过不可逆转的临界点,上升阶段正式开启,"奥特曼表示,"人类正站在创造数字超级智能的边缘,而迄今为止,其发展态势竟比想象中更不令人感到陌生。"尽管缺乏明显迹象——街头尚未遍布机器人,疾病依然存在——但奥特曼所描述的深刻变革已悄然启动。在他这样的公司内部,正在研发能够超越人类通用智能的系统。"从重要意义上说
人工智能热潮引发对互联网泡沫时代的担忧 人工智能热潮引发对互联网泡沫时代的担忧 人工智能领域数十亿美元的投资涌入,引发了一场激烈争论:该行业是否正走向互联网泡沫式的泡沫?投资者正警惕着热情降温的迹象,或芯片与基础设施巨额投入未能带来预期回报的征兆。美银全球研究近期调查凸显了这种谨慎态度:54%的基金经理认为人工智能股票已处于泡沫状态,38%持反对意见。与互联网泡沫的相似之处尽管普遍乐观,质疑者仍质疑人工智能的实质影响,部分人将其斥为虚张声势或即将破灭的泡沫。思科亚太、日本及中
相关专题推荐
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
写作 顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷
顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷

探索2026年最优秀的AI人物设定生成工具,助您塑造鲜活立体的角色。XIX.AI精心筛选的这份清单汇集了广受好评、颠覆传统的工具,能够生成具有内在逻辑的动机和致命缺陷。通过实际测试对比免费与付费选项。立即释放您的叙事潜能。

10 个工具
xix.ai
商业 顶级 AI 定价优化软件:追踪竞争对手并自动调整店铺价格
顶级 AI 定价优化软件:追踪竞争对手并自动调整店铺价格

在 XIX.AI 上探索 2026 年最佳 AI 定价优化软件。我们精心挑选的清单汇集了备受好评、具有颠覆性意义的工具,这些工具不仅能追踪竞争对手,还能自动调整您的店铺价格,从而实现利润最大化。通过实际测试对比免费与付费选项。立即掌握您的定价优势。

10 个工具
xix.ai
代码 最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件
最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件

在 XIX.AI 上探索 2026 年最佳 AI 代码审查工具。我们的精选列表汇集了备受好评、具有颠覆性的工具,可自动确保代码规范并重构遗留代码库文件。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即开启您的 AI 优势。

10 个工具
xix.ai
文字转语音 专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率
专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成(TTS)应用,专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具,重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案,释放学生的潜能。立即访问XIX.AI,开启您的探索之旅。

10 个工具
xix.ai
评论 (3)
0/500
BenGarcía
BenGarcía 2026-06-02 08:00:08

This is wild! 🤯 So basically they can tell if my personal data was used to train an AI? That's both cool and terrifying. What if companies get sued over this? Privacy laws need to catch up fast, because memorization is a real issue.

MarkHarris
MarkHarris 2026-03-20 14:00:36

Also das mit dem CAMIA-Angriff klingt echt nicht gut. KI-Modelle sollen doch keine persönlichen Daten speichern, oder? Wenn jetzt jeder prüfen kann, ob seine eigenen Daten im Training waren, wo soll das hinführen? Da müssen dringend strengere Datenschutzregeln für KI-Entwicklung her. Ist ja fast schon beängstigend, was da alles rauskommen könnte... 🤔

RalphSmith
RalphSmith 2025-12-06 08:30:37

Слышали про CAMIA? Это кошмар для приватности! Теперь любой может узнать, использовались ли их данные для обучения ИИ. Время удалять свои фото из интернета 📸 А вы как думаете - стоит ли запретить сбор личных данных для ИИ?

OR