选项
首页
新闻
Meta 增强人工智能安全,推出高级 Llama 工具

Meta 增强人工智能安全,推出高级 Llama 工具

2025-08-09
123

Meta 发布了新的 Llama 安全工具,以加强人工智能开发并防御新兴威胁。

这些升级的 Llama 人工智能模型安全工具与 Meta 的新资源相结合,旨在增强网络安全团队利用人工智能进行防御的能力,提升所有人工智能利益相关者的安全性。

使用 Llama 模型的开发者现在可以直接在 Meta 的 Llama Protections 页面、Hugging Face 和 GitHub 上访问增强的工具。

Llama Guard 4 引入了多模态功能,支持对文本和图像的安全执法,这对日益视觉化的人工智能应用至关重要。它已集成到 Meta 的新 Llama API 中,目前处于有限预览阶段。

LlamaFirewall 是一个新增的安全中心,用于人工智能系统,协调安全模型并与 Meta 的保护工具集成,以应对提示注入攻击、不安全代码生成或恶意人工智能插件行为等风险。

Meta 还优化了 Llama Prompt Guard。更新后的 Prompt Guard 2 (86M) 模型擅长检测越狱尝试和提示注入。此外,紧凑型 Prompt Guard 2 22M 将延迟和计算成本降低了高达 75%,为注重成本的开发者保持强大的检测能力。

除了开发者,Meta 还为网络安全专业人士提供人工智能驱动的工具,以应对网络攻击,满足对高级防御的日益增长的需求。

CyberSec Eval 4 基准套件已全面升级,为组织提供评估人工智能在安全任务中表现的工具。它包括两个新功能:

  • CyberSOC Eval:与 CrowdStrike 合作开发,此框架评估人工智能在真实安全运营中心环境中的有效性,重点关注威胁检测和响应。它即将推出。
  • AutoPatchBench:测试 Llama 和其他人工智能模型在漏洞利用前识别和修补代码漏洞的能力。

Meta 的 Llama Defenders 计划为合作伙伴和开发者提供定制的人工智能安全解决方案,结合开源和早期访问工具,应对多样化挑战。

Meta 分享了其内部自动化敏感文档分类工具,该工具为敏感文档打标签,以防止在 RAG 设置等人工智能系统中未经授权的泄露或滥用。

为应对人工智能生成的音频诈骗,Meta 与 ZenDesk、Bell Canada 和 AT&T 等合作伙伴分享了 Llama Generated Audio Detector 和 Llama Audio Watermark Detector,以识别钓鱼或欺诈尝试中的欺诈性人工智能语音。

Meta 还预览了 WhatsApp 的私有处理功能,使人工智能能够在不访问消息内容的情况下总结消息或起草回复,优先考虑用户隐私。

Meta 公开分享其威胁模型,鼓励安全研究人员在发布前审查架构,展示对强大隐私措施的承诺。

Meta 的这一套全面的人工智能安全更新增强了其人工智能生态系统,同时为技术社区提供了安全开发和有效防御的工具。

另见:Microsoft 揭露 40 亿美元的人工智能驱动欺诈尝试

在阿姆斯特丹、加利福尼亚和伦敦的 AI & Big Data Expo 上了解更多关于人工智能和大数据的信息,该展会与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举办。

在此探索 TechForge 即将举办的企业技术活动和网络研讨会。

相关文章
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能 WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能 广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
Meta AI 现已在 Facebook Marketplace 上回复买家消息 Meta AI 现已在 Facebook Marketplace 上回复买家消息 Facebook周四宣布,Facebook Marketplace推出了新的Meta AI功能,包括对买家咨询的自动回复。该平台还利用AI加速商品上架、总结卖家资料,并允许卖家在商品列表中提供配送服务。鉴于卖家通常会收到大量买家咨询,Facebook正通过由Meta AI驱动的自动回复功能简化这一流程。当买家询问商品库存情况时,卖家可利用Meta AI根据商品详情(如描述、库存、自提地点和价格)自
Meta签署协议,采购数百万颗亚马逊AI处理器 Meta签署协议,采购数百万颗亚马逊AI处理器 亚马逊已与Meta达成一项重要合作,再次依托其自主设计的芯片。亚马逊周五证实,Meta已同意部署数百万颗AWS Graviton芯片,以满足其不断增长的人工智能需求。需注意,AWS Graviton是一款基于ARM架构的CPU(中央处理器,用于通用计算),而非GPU(图形处理器)。虽然GPU仍是训练大型模型的首选芯片,但一旦模型训练完成,基于这些模型构建的AI代理正推动着所需芯片类型的转变。这些代
相关专题推荐
商业 最佳人工智能招聘工具:筛选简历并自动安排候选人面试
最佳人工智能招聘工具:筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案,可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名,对比免费与付费选项。立即找到最适合您的招聘助手,优化您的招聘流程!

10 个工具
xix.ai
生产率 AI个人健康与专注力教练:缓解倦怠,提升精神能量
AI个人健康与专注力教练:缓解倦怠,提升精神能量

立即访问 XIX.AI,探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具,助您缓解倦怠、提升精神能量。通过真实案例分析,对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具
xix.ai
聊天机器人 备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系
备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人,助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人,并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣,立即开始建立联系吧。

10 个工具
xix.ai
教育与学习 最佳AI数据科学导师:精通SQL、Pandas及机器学习工作流程
最佳AI数据科学导师:精通SQL、Pandas及机器学习工作流程

探索2026年最优秀的人工智能数据科学导师,帮助他们掌握SQL、Pandas以及机器学习工作流程。在XIX.AI上查看我们精心挑选的顶级导师名单,获得强大而具有变革性的指导。通过对比免费和付费选项,并结合实际应用案例进行了解,今天就开启你的数据科学精通之路吧。

10 个工具
xix.ai
聊天机器人 最佳AI调情与对话训练工具:实时提升社交魅力与自信
最佳AI调情与对话训练工具:实时提升社交魅力与自信

在 XIX.AI 上探索 2026 年最优秀的 AI 调情与对话训练工具。我们精心挑选的高评分工具助您实时提升社交魅力与自信。探索这些必试的、颠覆性的工具,查看免费版与付费版的对比,并了解每周更新的排行榜。立即开启您的社交优势。

10 个工具
xix.ai
代码 最适合自动化单元测试的最佳AI工具:一键生成Jest、PyTest和JUnit测试用例
最适合自动化单元测试的最佳AI工具:一键生成Jest、PyTest和JUnit测试用例

探索2026年最新评选出的顶级AI工具,这些工具专为自动化单元测试而设计。我们精心挑选了那些功能强大、能够改变开发流程的工具,它们能够帮助您快速生成Jest、PyTest和JUnit测试用例。在XIX.AI平台上,您可以免费查看各种选项,并通过实际测试结果以及每周更新的排名来了解它们的优劣。立即利用这些AI工具,提升您的开发效率吧!

10 个工具
xix.ai
评论 (2)
0/500
WillieCarter
WillieCarter 2026-01-22 22:30:58

Ces outils semblent prometteurs, mais j'espère que les gros acteurs comme Meta vont vraiment s'intéresser à la sécurité dès la conception, pas seulement en réaction aux problèmes. La course à l'IA crée un terrain dangereux si la robustesse est sacrifiée pour la vitesse de déploiement. 🤔 On verra à l'usage.

RyanAdams
RyanAdams 2026-01-18 08:30:43

A Meta está realmente investindo pesado em segurança de IA! Essas novas ferramentas do Llama parecem promissoras para desenvolvedores. Espero que essas atualizações ajudem a prevenir vazamentos de dados e viés algorítmico, problemas que têm sido frequentes. Será que outras grandes empresas, como Google e OpenAI, vão seguir o exemplo e lançar recursos semelhantes? 🤔 É uma corrida interessante para ver quem protege melhor os usuários.

OR