選項
首頁
新聞
Meta增強AI安全以先進Llama工具

Meta增強AI安全以先進Llama工具

2025-08-09
121

Meta已發布全新Llama安全工具,以強化AI開發並防範新興威脅。

這些升級的Llama AI模型安全工具與Meta的新資源搭配,旨在賦能網路安全團隊利用AI進行防禦,提升所有AI利益相關者的安全性。

使用Llama模型的開發者現可直接在Meta的Llama Protections頁面、Hugging Face及GitHub上獲得增強工具。

Llama Guard 4引入多模態功能,支持文字與圖像的安全執行,這對於日益視覺化的AI應用至關重要。它已整合至Meta的新Llama API,目前處於有限預覽階段。

LlamaFirewall作為新成員,成為AI系統的安全中心,協調安全模型並與Meta的保護工具整合,以對抗提示注入攻擊、不安全程式碼生成或惡意AI外掛行為等風險。

Meta還優化了Llama Prompt Guard。更新後的Prompt Guard 2 (86M)模型擅長檢測越獄嘗試與提示注入。此外,精簡的Prompt Guard 2 22M將延遲與運算成本降低高達75%,為注重成本的開發者維持強大檢測能力。

除了開發者,Meta還為網路安全專業人士提供AI驅動工具,以對抗網路攻擊,滿足對先進防禦日益增長的需求。

CyberSec Eval 4基準套件已全面改進,為組織提供評估AI在安全任務中表現的工具。它包含兩個新功能:

  • CyberSOC Eval:與CrowdStrike合作開發,此框架評估AI在真實安全運營中心環境中的有效性,聚焦於威脅檢測與應對。它即將推出。
  • AutoPatchBench:測試Llama及其他AI模型在漏洞利用前識別並修補程式碼漏洞的能力。

Meta的Llama Defenders計畫為合作夥伴與開發者提供客製化的AI安全解決方案,結合開源與早期存取工具,應對多樣化挑戰。

Meta分享其內部自動化敏感文件分類工具,該工具標記敏感文件,以防止在AI系統(如RAG設置)中發生未授權洩露或誤用。

為對抗AI生成音頻詐騙,Meta與ZenDesk、Bell Canada及AT&T等合作夥伴分享Llama生成音頻檢測器與Llama音頻水印檢測器,以識別釣魚或詐騙中的欺詐AI語音。

Meta還預覽了WhatsApp的私有處理功能,使AI能在不存取訊息內容的情況下摘要訊息或起草回覆,優先保障用戶隱私。

Meta公開其威脅模型,鼓勵安全研究人員在發布前審查架構,展現對強大隱私措施的承諾。

Meta這一系列全面的AI安全更新,強化了其AI生態系統,同時為科技社群提供安全開發與有效防禦的工具。

另見:Microsoft揭露40億美元的AI驅動詐騙企圖

在阿姆斯特丹、加州及倫敦的AI與大數據博覽會上探索更多關於AI與大數據的資訊,該活動與智能自動化會議、BlockX、數位轉型週及網路安全與雲端博覽會同期舉辦。

在此探索TechForge即將舉辦的企業技術活動與網路研討會。

相關文章
科技巨頭先是認可人工智慧基礎設施的支出,隨後卻提高了帳單金額 科技巨頭先是認可人工智慧基礎設施的支出,隨後卻提高了帳單金額 每家雲端公司都超出預期。每項資本支出預測均上調。這短短兩句話便概括了 2026 年最重要的財報日,也幾乎揭示了關於科技巨頭當前人工智慧基礎設施支出現狀的一切關鍵資訊。微軟、Alphabet、Meta 和亞馬遜四家企業在 2026 年的資本支出總額合計介於 6,300 億至 6,500 億美元之間。第一季的財報成為檢驗這些投資是否開始產生回報的首個實質指標。在四家公司的財報電話會議中,答案都是肯定
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要 巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要 儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者 YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者 週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
相關專題推薦
寫作 最佳 AI 仙俠與武俠助手:撰寫史詩級的修煉歷程與武術動作設計
最佳 AI 仙俠與武俠助手:撰寫史詩級的修煉歷程與武術動作設計

探索 2026 年最優秀的 AI 助手,助您創作史詩級仙俠與武俠故事。XIX.AI 精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,助您駕馭修煉進程與武術動作設計。透過實際測試,比較免費與付費選項的差異。釋放您的創作潛能,今天就開始動筆吧!

10 個工具
xix.ai
代碼 AI移動應用開發工具:根據提示生成跨平臺的Flutter與React Native程式碼
AI移動應用開發工具:根據提示生成跨平臺的Flutter與React Native程式碼

探索2026年最適合Flutter和React Native的最佳AI移動應用開發工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您根據提示生成跨平臺程式碼。透過實際測試來對比免費選項和付費選項,讓開發更加高效,從而打造出更出色的應用程式。現在就訪問XIX.AI檢視排名吧!

10 個工具
xix.ai
代碼 最佳 AI Chrome 擴充功能生成工具:無需任何程式設計經驗即可建立自訂瀏覽器擴充功能
最佳 AI Chrome 擴充功能生成工具:無需任何程式設計經驗即可建立自訂瀏覽器擴充功能

在 XIX.AI 探索 2026 年最佳的 AI Chrome 擴充功能生成工具。我們精心挑選的清單收錄了評價最高、絕對值得一試的工具,讓您無需編寫任何程式碼即可建立客製化的瀏覽器擴充功能。比較免費與付費選項、查看實際測試結果,並釋放您的生產力。立即探索最新排行榜,找到最適合您的工具!

10 個工具
xix.ai
文字轉語音 最佳人工智慧多語言文字轉語音技術:能夠生成50多種語言的逼真原聲發音
最佳人工智慧多語言文字轉語音技術:能夠生成50多種語言的逼真原聲發音

探索2026年最優秀的人工智慧多語言文字轉語音工具,這些工具能夠生成50多種語言中具有真實母語口音的語音。檢視我們精心挑選的排名榜單,瞭解免費版本與付費版本的差異,並透過實際測試來驗證它們的效果。在XIX.AI上找到最適合你的語音工具,立即開啟全球交流的新篇章吧。

10 個工具
xix.ai
會議助理 最適合提升協作效率的最佳人工智慧會議自動化工具
最適合提升協作效率的最佳人工智慧會議自動化工具

探索2026年最新評選出的頂級AI會議自動化工具,讓協作變得更智慧、更高效。我們精心挑選的這些工具能夠有效實現筆記、總結和待辦事項的自動化處理。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項的差異。立即訪問XIX.AI,發現最適合您需求的工具,提升團隊生產力吧。

10 個工具
xix.ai
迅速的 適用於「基礎架構即代碼」的 AI 提示:安全部署 Terraform 與 Docker 配置
適用於「基礎架構即代碼」的 AI 提示:安全部署 Terraform 與 Docker 配置

探索 2026 年最新、評價最高的「基礎架構即代碼」(Infrastructure-as-Code)AI 提示語。XIX.AI 精心挑選的清單,能協助您安全地部署 Terraform 與 Docker 設定、自動化雲端環境建置,並提升 DevOps 生產力。透過實際測試比較免費與付費選項。立即探索,釋放您的 AI 優勢。

10 個工具
xix.ai
評論 (2)
0/500
WillieCarter
WillieCarter 2026-01-22 22:30:58

Ces outils semblent prometteurs, mais j'espère que les gros acteurs comme Meta vont vraiment s'intéresser à la sécurité dès la conception, pas seulement en réaction aux problèmes. La course à l'IA crée un terrain dangereux si la robustesse est sacrifiée pour la vitesse de déploiement. 🤔 On verra à l'usage.

RyanAdams
RyanAdams 2026-01-18 08:30:43

A Meta está realmente investindo pesado em segurança de IA! Essas novas ferramentas do Llama parecem promissoras para desenvolvedores. Espero que essas atualizações ajudem a prevenir vazamentos de dados e viés algorítmico, problemas que têm sido frequentes. Será que outras grandes empresas, como Google e OpenAI, vão seguir o exemplo e lançar recursos semelhantes? 🤔 É uma corrida interessante para ver quem protege melhor os usuários.

OR