Meta 增强人工智能安全,推出高级 Llama 工具
Meta 发布了新的 Llama 安全工具,以加强人工智能开发并防御新兴威胁。
这些升级的 Llama 人工智能模型安全工具与 Meta 的新资源相结合,旨在增强网络安全团队利用人工智能进行防御的能力,提升所有人工智能利益相关者的安全性。
使用 Llama 模型的开发者现在可以直接在 Meta 的 Llama Protections 页面、Hugging Face 和 GitHub 上访问增强的工具。
Llama Guard 4 引入了多模态功能,支持对文本和图像的安全执法,这对日益视觉化的人工智能应用至关重要。它已集成到 Meta 的新 Llama API 中,目前处于有限预览阶段。
LlamaFirewall 是一个新增的安全中心,用于人工智能系统,协调安全模型并与 Meta 的保护工具集成,以应对提示注入攻击、不安全代码生成或恶意人工智能插件行为等风险。
Meta 还优化了 Llama Prompt Guard。更新后的 Prompt Guard 2 (86M) 模型擅长检测越狱尝试和提示注入。此外,紧凑型 Prompt Guard 2 22M 将延迟和计算成本降低了高达 75%,为注重成本的开发者保持强大的检测能力。
除了开发者,Meta 还为网络安全专业人士提供人工智能驱动的工具,以应对网络攻击,满足对高级防御的日益增长的需求。
CyberSec Eval 4 基准套件已全面升级,为组织提供评估人工智能在安全任务中表现的工具。它包括两个新功能:
- CyberSOC Eval:与 CrowdStrike 合作开发,此框架评估人工智能在真实安全运营中心环境中的有效性,重点关注威胁检测和响应。它即将推出。
- AutoPatchBench:测试 Llama 和其他人工智能模型在漏洞利用前识别和修补代码漏洞的能力。
Meta 的 Llama Defenders 计划为合作伙伴和开发者提供定制的人工智能安全解决方案,结合开源和早期访问工具,应对多样化挑战。
Meta 分享了其内部自动化敏感文档分类工具,该工具为敏感文档打标签,以防止在 RAG 设置等人工智能系统中未经授权的泄露或滥用。
为应对人工智能生成的音频诈骗,Meta 与 ZenDesk、Bell Canada 和 AT&T 等合作伙伴分享了 Llama Generated Audio Detector 和 Llama Audio Watermark Detector,以识别钓鱼或欺诈尝试中的欺诈性人工智能语音。
Meta 还预览了 WhatsApp 的私有处理功能,使人工智能能够在不访问消息内容的情况下总结消息或起草回复,优先考虑用户隐私。
Meta 公开分享其威胁模型,鼓励安全研究人员在发布前审查架构,展示对强大隐私措施的承诺。
Meta 的这一套全面的人工智能安全更新增强了其人工智能生态系统,同时为技术社区提供了安全开发和有效防御的工具。
另见:Microsoft 揭露 40 亿美元的人工智能驱动欺诈尝试
在阿姆斯特丹、加利福尼亚和伦敦的 AI & Big Data Expo 上了解更多关于人工智能和大数据的信息,该展会与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举办。
在此探索 TechForge 即将举办的企业技术活动和网络研讨会。
相关文章
科技巨头先是认可了人工智能基础设施的投入,随后却提高了费用
每家科技巨头都超出了预期。每项资本支出预测均有所上调。这两句话概括了2026年最重要的财报日,也几乎揭示了关于科技巨头当前人工智能基础设施支出现状的一切。微软、Alphabet、Meta和亚马逊四家科技巨头在2026年的资本支出总额介于6300亿至6500亿美元之间。第一季度的财报为这些投资是否开始产生回报提供了首个切实的衡量标准。在四家公司的财报电话会议中,答案都是肯定的。而随后四家公司不约而
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
相关专题推荐
评论 (2)
0/500
Ces outils semblent prometteurs, mais j'espère que les gros acteurs comme Meta vont vraiment s'intéresser à la sécurité dès la conception, pas seulement en réaction aux problèmes. La course à l'IA crée un terrain dangereux si la robustesse est sacrifiée pour la vitesse de déploiement. 🤔 On verra à l'usage.
A Meta está realmente investindo pesado em segurança de IA! Essas novas ferramentas do Llama parecem promissoras para desenvolvedores. Espero que essas atualizações ajudem a prevenir vazamentos de dados e viés algorítmico, problemas que têm sido frequentes. Será que outras grandes empresas, como Google e OpenAI, vão seguir o exemplo e lançar recursos semelhantes? 🤔 É uma corrida interessante para ver quem protege melhor os usuários.
Meta 发布了新的 Llama 安全工具,以加强人工智能开发并防御新兴威胁。
这些升级的 Llama 人工智能模型安全工具与 Meta 的新资源相结合,旨在增强网络安全团队利用人工智能进行防御的能力,提升所有人工智能利益相关者的安全性。
使用 Llama 模型的开发者现在可以直接在 Meta 的 Llama Protections 页面、Hugging Face 和 GitHub 上访问增强的工具。
Llama Guard 4 引入了多模态功能,支持对文本和图像的安全执法,这对日益视觉化的人工智能应用至关重要。它已集成到 Meta 的新 Llama API 中,目前处于有限预览阶段。
LlamaFirewall 是一个新增的安全中心,用于人工智能系统,协调安全模型并与 Meta 的保护工具集成,以应对提示注入攻击、不安全代码生成或恶意人工智能插件行为等风险。
Meta 还优化了 Llama Prompt Guard。更新后的 Prompt Guard 2 (86M) 模型擅长检测越狱尝试和提示注入。此外,紧凑型 Prompt Guard 2 22M 将延迟和计算成本降低了高达 75%,为注重成本的开发者保持强大的检测能力。
除了开发者,Meta 还为网络安全专业人士提供人工智能驱动的工具,以应对网络攻击,满足对高级防御的日益增长的需求。
CyberSec Eval 4 基准套件已全面升级,为组织提供评估人工智能在安全任务中表现的工具。它包括两个新功能:
- CyberSOC Eval:与 CrowdStrike 合作开发,此框架评估人工智能在真实安全运营中心环境中的有效性,重点关注威胁检测和响应。它即将推出。
- AutoPatchBench:测试 Llama 和其他人工智能模型在漏洞利用前识别和修补代码漏洞的能力。
Meta 的 Llama Defenders 计划为合作伙伴和开发者提供定制的人工智能安全解决方案,结合开源和早期访问工具,应对多样化挑战。
Meta 分享了其内部自动化敏感文档分类工具,该工具为敏感文档打标签,以防止在 RAG 设置等人工智能系统中未经授权的泄露或滥用。
为应对人工智能生成的音频诈骗,Meta 与 ZenDesk、Bell Canada 和 AT&T 等合作伙伴分享了 Llama Generated Audio Detector 和 Llama Audio Watermark Detector,以识别钓鱼或欺诈尝试中的欺诈性人工智能语音。
Meta 还预览了 WhatsApp 的私有处理功能,使人工智能能够在不访问消息内容的情况下总结消息或起草回复,优先考虑用户隐私。
Meta 公开分享其威胁模型,鼓励安全研究人员在发布前审查架构,展示对强大隐私措施的承诺。
Meta 的这一套全面的人工智能安全更新增强了其人工智能生态系统,同时为技术社区提供了安全开发和有效防御的工具。
另见:Microsoft 揭露 40 亿美元的人工智能驱动欺诈尝试
在阿姆斯特丹、加利福尼亚和伦敦的 AI & Big Data Expo 上了解更多关于人工智能和大数据的信息,该展会与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举办。
在此探索 TechForge 即将举办的企业技术活动和网络研讨会。
科技巨头先是认可了人工智能基础设施的投入,随后却提高了费用
每家科技巨头都超出了预期。每项资本支出预测均有所上调。这两句话概括了2026年最重要的财报日,也几乎揭示了关于科技巨头当前人工智能基础设施支出现状的一切。微软、Alphabet、Meta和亚马逊四家科技巨头在2026年的资本支出总额介于6300亿至6500亿美元之间。第一季度的财报为这些投资是否开始产生回报提供了首个切实的衡量标准。在四家公司的财报电话会议中,答案都是肯定的。而随后四家公司不约而
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
Ces outils semblent prometteurs, mais j'espère que les gros acteurs comme Meta vont vraiment s'intéresser à la sécurité dès la conception, pas seulement en réaction aux problèmes. La course à l'IA crée un terrain dangereux si la robustesse est sacrifiée pour la vitesse de déploiement. 🤔 On verra à l'usage.
A Meta está realmente investindo pesado em segurança de IA! Essas novas ferramentas do Llama parecem promissoras para desenvolvedores. Espero que essas atualizações ajudem a prevenir vazamentos de dados e viés algorítmico, problemas que têm sido frequentes. Será que outras grandes empresas, como Google e OpenAI, vão seguir o exemplo e lançar recursos semelhantes? 🤔 É uma corrida interessante para ver quem protege melhor os usuários.





首页






