选项
首页
新闻
Meta 增强人工智能安全,推出高级 Llama 工具

Meta 增强人工智能安全,推出高级 Llama 工具

2025-08-09
1

Meta 发布了新的 Llama 安全工具,以加强人工智能开发并防御新兴威胁。

这些升级的 Llama 人工智能模型安全工具与 Meta 的新资源相结合,旨在增强网络安全团队利用人工智能进行防御的能力,提升所有人工智能利益相关者的安全性。

使用 Llama 模型的开发者现在可以直接在 Meta 的 Llama Protections 页面、Hugging Face 和 GitHub 上访问增强的工具。

Llama Guard 4 引入了多模态功能,支持对文本和图像的安全执法,这对日益视觉化的人工智能应用至关重要。它已集成到 Meta 的新 Llama API 中,目前处于有限预览阶段。

LlamaFirewall 是一个新增的安全中心,用于人工智能系统,协调安全模型并与 Meta 的保护工具集成,以应对提示注入攻击、不安全代码生成或恶意人工智能插件行为等风险。

Meta 还优化了 Llama Prompt Guard。更新后的 Prompt Guard 2 (86M) 模型擅长检测越狱尝试和提示注入。此外,紧凑型 Prompt Guard 2 22M 将延迟和计算成本降低了高达 75%,为注重成本的开发者保持强大的检测能力。

除了开发者,Meta 还为网络安全专业人士提供人工智能驱动的工具,以应对网络攻击,满足对高级防御的日益增长的需求。

CyberSec Eval 4 基准套件已全面升级,为组织提供评估人工智能在安全任务中表现的工具。它包括两个新功能:

  • CyberSOC Eval:与 CrowdStrike 合作开发,此框架评估人工智能在真实安全运营中心环境中的有效性,重点关注威胁检测和响应。它即将推出。
  • AutoPatchBench:测试 Llama 和其他人工智能模型在漏洞利用前识别和修补代码漏洞的能力。

Meta 的 Llama Defenders 计划为合作伙伴和开发者提供定制的人工智能安全解决方案,结合开源和早期访问工具,应对多样化挑战。

Meta 分享了其内部自动化敏感文档分类工具,该工具为敏感文档打标签,以防止在 RAG 设置等人工智能系统中未经授权的泄露或滥用。

为应对人工智能生成的音频诈骗,Meta 与 ZenDesk、Bell Canada 和 AT&T 等合作伙伴分享了 Llama Generated Audio Detector 和 Llama Audio Watermark Detector,以识别钓鱼或欺诈尝试中的欺诈性人工智能语音。

Meta 还预览了 WhatsApp 的私有处理功能,使人工智能能够在不访问消息内容的情况下总结消息或起草回复,优先考虑用户隐私。

Meta 公开分享其威胁模型,鼓励安全研究人员在发布前审查架构,展示对强大隐私措施的承诺。

Meta 的这一套全面的人工智能安全更新增强了其人工智能生态系统,同时为技术社区提供了安全开发和有效防御的工具。

另见:Microsoft 揭露 40 亿美元的人工智能驱动欺诈尝试

在阿姆斯特丹、加利福尼亚和伦敦的 AI & Big Data Expo 上了解更多关于人工智能和大数据的信息,该展会与智能自动化大会、BlockX、数字化转型周和网络安全与云博览会同期举办。

在此探索 TechForge 即将举办的企业技术活动和网络研讨会。

相关文章
Meta为AI人才提供高薪,否认1亿美元签约奖金 Meta为AI人才提供高薪,否认1亿美元签约奖金 Meta正以数百万美元的丰厚薪酬吸引AI研究人员加入其新的超级智能实验室。然而,一位被招募的研究人员和泄露的内部会议言论表示,关于1亿美元“签约奖金”的说法不实。据The Verge周四报道,在一次泄露的公司全体会议上,Meta高管回应了关于OpenAI首席执行官Sam Altman声称Meta向顶尖研究人员提供奖金的问题。Meta的首席技术官Andrew Bosworth表示,只有极少数高级领导
NotebookLM推出顶级出版物和专家精选笔记本 NotebookLM推出顶级出版物和专家精选笔记本 谷歌正在增强其人工智能驱动的研究和笔记工具NotebookLM,使其成为一个综合知识中心。周一,该公司推出了一套由知名作者、出版物、研究人员和非营利组织精心策划的笔记本集合,使用户能够探索健康、旅行、财务等多样化主题。首批内容包括《经济学人》、《大西洋月刊》、知名教授、作者以及莎士比亚作品的贡献,展示了NotebookLM在深入主题探索中的实际应用。谷歌解释说,用户可以访问原始资料,提出问题,深入
Meta加强努力遏制Facebook上的非原创内容 Meta加强努力遏制Facebook上的非原创内容 周一,Meta宣布了更严格的措施,以处理在Facebook上发布非原创内容的账户,针对那些反复使用他人文本、图片或视频的账户。该公司报告称,今年已移除约1000万个冒充知名内容创作者的账户。此外,Meta已处理了50万个涉及垃圾行为或虚假互动的账户,采取措施如降低评论排名和限制内容分发,以阻碍变现努力。此举是在YouTube更新其非原创内容政策后不久,特别是在人工智能技术进步使得大规模生产或重复视
评论 (0)
0/200
返回顶部
OR