AMD 的 vLLM-ATOM 外掛程式可提升家用大型 AI 模型的推論效能

首頁

新聞

2026-05-24

DonaldRoberts

AMD 已正式推出專為部署大型語言模型而設計的 vLLM-ATOM 外掛程式。此外掛程式旨在大幅提升 DeepSeek-R1 和 Kimi-K2 等國內主流大型模型在 AMD 硬體上的推論效能，且完全不會干擾現有工作流程。

作為專為高並發場景打造的開源推論框架，vLLM 以其卓越的記憶體效率而聞名。AMD 推出的這款新插件為其 Instinct 系列 GPU 提供了更為客製化的優化方案，讓開發者能夠以最小的學習成本完成技術遷移。

無縫的效能提升

vLLM-ATOM 外掛的核心優勢在於其「零成本」部署。使用者無需修改現有的 API 或端到端工作流程。該外掛會在後台自動管理並優化請求調度與核心調校，讓現行服務能順暢過渡至 AMD 硬體後端。

在架構上，此外掛程式分為三層：最上層確保與 OpenAI 介面的相容性，中層負責模型執行與路由，底層則提供核心 GPU 核心程式。此設計有效整合了專家混合（MoE）與量化技術，確保能為大規模部署提供強大的支援。

橫跨運算生態系統的廣泛相容性

此插件針對 AMD 的 Instinct MI350 和 MI400 系列高效能 GPU 設計。它不僅支援 Qwen3 和 GLM 等中國領先的大型語言模型，更全面涵蓋多種應用場景，包括密集型模型、專家混合模型以及視覺語言模型 (VLMs)。

一項人類學研究指出，經過潤飾的人工智慧產出內容會削弱人類的思考能力當你看到人工智慧瞬間產出一段結構完善、邏輯清晰的程式碼或文件時，是否會不假思索地選擇相信它？根據AIbase 的報導，領先的人工智慧公司Anthropic最近發布了一份名為《AI 流暢度指數》的研究報告。在分析了近 10,000 份匿名Claude對話樣本後，這項研究揭露了一個令人擔憂的趨勢：AI 產出的內容看起來越是精緻，使用者就越不願意去查證事實。報告揭示，當Claude產出小型應用程式、網

英國各政府部門就人工智慧資料中心的能源需求產生分歧英國政府正面臨一項重大挑戰：在推動清潔能源的同時，力求成為人工智慧領域的全球領導者。然而，負責這些目標的各部會之間卻顯現出嚴重的分歧。科學、創新與技術部（DSIT）與能源安全及淨零部（DESNZ）對於人工智慧資料中心的未來電力需求，持著截然不同的預測。DSIT預測，到2030年，人工智慧資料中心將需要6吉瓦的電力；而DESNZ的估計則不到該數字的十分之一。這項差距引起了非營利組織「Foxglo

中國網絡空間管理局規定，人工智慧生成及虛構的短影片必須標註中國網絡信息辦公室已推出一項全面計劃，旨在規範短視頻內容標註，要求各平台提供六項必備標籤——包括「AI生成內容」——這標誌著短視頻治理進入了強制透明化的新時代。為解決內容來源不明及難以區分事實與虛構等問題，監管機構在先前與抖音、快手、騰訊及百度等主要平台進行的試點計畫基礎上，現已將內容標註列為短影片發布流程中的強制步驟。發布者必須從六個選項中選擇其一：「虛構戲劇化」、「AI生成」、「含行銷資訊」

相關專題推薦

漫畫創作

漫畫頂尖 AI 自動上色工具：零一致性錯誤地套用平面色彩

立即前往 XIX.AI，探索 2026 年最優秀的漫畫 AI 自動上色工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的解決方案，這些工具能以零一致性錯誤的方式套用平面色彩，大幅提升您的工作效率。透過免費與付費版本的比較、實際測試結果，以及每週更新的排行榜，找到最適合您的工具。立即解鎖您的 AI 優勢。