Meta增強AI安全以先進Llama工具
Meta已發布全新Llama安全工具,以強化AI開發並防範新興威脅。
這些升級的Llama AI模型安全工具與Meta的新資源搭配,旨在賦能網路安全團隊利用AI進行防禦,提升所有AI利益相關者的安全性。
使用Llama模型的開發者現可直接在Meta的Llama Protections頁面、Hugging Face及GitHub上獲得增強工具。
Llama Guard 4引入多模態功能,支持文字與圖像的安全執行,這對於日益視覺化的AI應用至關重要。它已整合至Meta的新Llama API,目前處於有限預覽階段。
LlamaFirewall作為新成員,成為AI系統的安全中心,協調安全模型並與Meta的保護工具整合,以對抗提示注入攻擊、不安全程式碼生成或惡意AI外掛行為等風險。
Meta還優化了Llama Prompt Guard。更新後的Prompt Guard 2 (86M)模型擅長檢測越獄嘗試與提示注入。此外,精簡的Prompt Guard 2 22M將延遲與運算成本降低高達75%,為注重成本的開發者維持強大檢測能力。
除了開發者,Meta還為網路安全專業人士提供AI驅動工具,以對抗網路攻擊,滿足對先進防禦日益增長的需求。
CyberSec Eval 4基準套件已全面改進,為組織提供評估AI在安全任務中表現的工具。它包含兩個新功能:
- CyberSOC Eval:與CrowdStrike合作開發,此框架評估AI在真實安全運營中心環境中的有效性,聚焦於威脅檢測與應對。它即將推出。
- AutoPatchBench:測試Llama及其他AI模型在漏洞利用前識別並修補程式碼漏洞的能力。
Meta的Llama Defenders計畫為合作夥伴與開發者提供客製化的AI安全解決方案,結合開源與早期存取工具,應對多樣化挑戰。
Meta分享其內部自動化敏感文件分類工具,該工具標記敏感文件,以防止在AI系統(如RAG設置)中發生未授權洩露或誤用。
為對抗AI生成音頻詐騙,Meta與ZenDesk、Bell Canada及AT&T等合作夥伴分享Llama生成音頻檢測器與Llama音頻水印檢測器,以識別釣魚或詐騙中的欺詐AI語音。
Meta還預覽了WhatsApp的私有處理功能,使AI能在不存取訊息內容的情況下摘要訊息或起草回覆,優先保障用戶隱私。
Meta公開其威脅模型,鼓勵安全研究人員在發布前審查架構,展現對強大隱私措施的承諾。
Meta這一系列全面的AI安全更新,強化了其AI生態系統,同時為科技社群提供安全開發與有效防禦的工具。
另見:Microsoft揭露40億美元的AI驅動詐騙企圖
在阿姆斯特丹、加州及倫敦的AI與大數據博覽會上探索更多關於AI與大數據的資訊,該活動與智能自動化會議、BlockX、數位轉型週及網路安全與雲端博覽會同期舉辦。
在此探索TechForge即將舉辦的企業技術活動與網路研討會。
相關文章
科技巨頭先是認可人工智慧基礎設施的支出,隨後卻提高了帳單金額
每家雲端公司都超出預期。每項資本支出預測均上調。這短短兩句話便概括了 2026 年最重要的財報日,也幾乎揭示了關於科技巨頭當前人工智慧基礎設施支出現狀的一切關鍵資訊。微軟、Alphabet、Meta 和亞馬遜四家企業在 2026 年的資本支出總額合計介於 6,300 億至 6,500 億美元之間。第一季的財報成為檢驗這些投資是否開始產生回報的首個實質指標。在四家公司的財報電話會議中,答案都是肯定
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
相關專題推薦
評論 (2)
0/500
Ces outils semblent prometteurs, mais j'espère que les gros acteurs comme Meta vont vraiment s'intéresser à la sécurité dès la conception, pas seulement en réaction aux problèmes. La course à l'IA crée un terrain dangereux si la robustesse est sacrifiée pour la vitesse de déploiement. 🤔 On verra à l'usage.
A Meta está realmente investindo pesado em segurança de IA! Essas novas ferramentas do Llama parecem promissoras para desenvolvedores. Espero que essas atualizações ajudem a prevenir vazamentos de dados e viés algorítmico, problemas que têm sido frequentes. Será que outras grandes empresas, como Google e OpenAI, vão seguir o exemplo e lançar recursos semelhantes? 🤔 É uma corrida interessante para ver quem protege melhor os usuários.
Meta已發布全新Llama安全工具,以強化AI開發並防範新興威脅。
這些升級的Llama AI模型安全工具與Meta的新資源搭配,旨在賦能網路安全團隊利用AI進行防禦,提升所有AI利益相關者的安全性。
使用Llama模型的開發者現可直接在Meta的Llama Protections頁面、Hugging Face及GitHub上獲得增強工具。
Llama Guard 4引入多模態功能,支持文字與圖像的安全執行,這對於日益視覺化的AI應用至關重要。它已整合至Meta的新Llama API,目前處於有限預覽階段。
LlamaFirewall作為新成員,成為AI系統的安全中心,協調安全模型並與Meta的保護工具整合,以對抗提示注入攻擊、不安全程式碼生成或惡意AI外掛行為等風險。
Meta還優化了Llama Prompt Guard。更新後的Prompt Guard 2 (86M)模型擅長檢測越獄嘗試與提示注入。此外,精簡的Prompt Guard 2 22M將延遲與運算成本降低高達75%,為注重成本的開發者維持強大檢測能力。
除了開發者,Meta還為網路安全專業人士提供AI驅動工具,以對抗網路攻擊,滿足對先進防禦日益增長的需求。
CyberSec Eval 4基準套件已全面改進,為組織提供評估AI在安全任務中表現的工具。它包含兩個新功能:
- CyberSOC Eval:與CrowdStrike合作開發,此框架評估AI在真實安全運營中心環境中的有效性,聚焦於威脅檢測與應對。它即將推出。
- AutoPatchBench:測試Llama及其他AI模型在漏洞利用前識別並修補程式碼漏洞的能力。
Meta的Llama Defenders計畫為合作夥伴與開發者提供客製化的AI安全解決方案,結合開源與早期存取工具,應對多樣化挑戰。
Meta分享其內部自動化敏感文件分類工具,該工具標記敏感文件,以防止在AI系統(如RAG設置)中發生未授權洩露或誤用。
為對抗AI生成音頻詐騙,Meta與ZenDesk、Bell Canada及AT&T等合作夥伴分享Llama生成音頻檢測器與Llama音頻水印檢測器,以識別釣魚或詐騙中的欺詐AI語音。
Meta還預覽了WhatsApp的私有處理功能,使AI能在不存取訊息內容的情況下摘要訊息或起草回覆,優先保障用戶隱私。
Meta公開其威脅模型,鼓勵安全研究人員在發布前審查架構,展現對強大隱私措施的承諾。
Meta這一系列全面的AI安全更新,強化了其AI生態系統,同時為科技社群提供安全開發與有效防禦的工具。
另見:Microsoft揭露40億美元的AI驅動詐騙企圖
在阿姆斯特丹、加州及倫敦的AI與大數據博覽會上探索更多關於AI與大數據的資訊,該活動與智能自動化會議、BlockX、數位轉型週及網路安全與雲端博覽會同期舉辦。
在此探索TechForge即將舉辦的企業技術活動與網路研討會。
科技巨頭先是認可人工智慧基礎設施的支出,隨後卻提高了帳單金額
每家雲端公司都超出預期。每項資本支出預測均上調。這短短兩句話便概括了 2026 年最重要的財報日,也幾乎揭示了關於科技巨頭當前人工智慧基礎設施支出現狀的一切關鍵資訊。微軟、Alphabet、Meta 和亞馬遜四家企業在 2026 年的資本支出總額合計介於 6,300 億至 6,500 億美元之間。第一季的財報成為檢驗這些投資是否開始產生回報的首個實質指標。在四家公司的財報電話會議中,答案都是肯定
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
Ces outils semblent prometteurs, mais j'espère que les gros acteurs comme Meta vont vraiment s'intéresser à la sécurité dès la conception, pas seulement en réaction aux problèmes. La course à l'IA crée un terrain dangereux si la robustesse est sacrifiée pour la vitesse de déploiement. 🤔 On verra à l'usage.
A Meta está realmente investindo pesado em segurança de IA! Essas novas ferramentas do Llama parecem promissoras para desenvolvedores. Espero que essas atualizações ajudem a prevenir vazamentos de dados e viés algorítmico, problemas que têm sido frequentes. Será que outras grandes empresas, como Google e OpenAI, vão seguir o exemplo e lançar recursos semelhantes? 🤔 É uma corrida interessante para ver quem protege melhor os usuários.





首頁






