Meta 的 AI 模型表現出色，但其開源定位正逐漸削弱

首頁

新聞

2026-05-29

JeffreyMartinez

# Gemini # llama # meta ai # Generative AI # AI benchmarks # Mark Zuckerberg # AI model launch # AI race # Alexandr Wang # Claude Opus # frontier ai # GPT-5.4 # HealthBench # Meta AI model # Meta Superintelligence Labs # multimodal AI # Muse Spark # open-source AI

開源 AI 領域向來提供豐富的選擇。多年來，開發者可以使用 Mistral、Falcon 等模型，以及日益增多的開源重量級替代方案。但 Meta 推出 Llama 後，徹底改變了遊戲規則。這家擁有 30 億用戶、龐大運算能力，並具備科技巨頭權威的公司，如今正公開進行開發——開發者社群也因此矚目。

到了 2026 年初，Llama 生態系統的下載量已突破 12 億次——相當於每天約 100 萬次。這為 2026 年 4 月 8 日發生的事件奠定了基礎：當時 Meta 推出了 Muse Spark。這是 Meta 一年來首個重大新 AI 模型，也是其新成立的 Meta 超級智慧實驗室（Meta Superintelligence Labs）推出的首款產品。

Muse Spark 在 Llama 4 有所欠缺的領域表現出色，在基準測試中能與領先的前沿模型一較高下，但卻是完全專有的。沒有免費下載、沒有公開權重，除非獲得 Meta 許可，否則無法基於它進行開發。

Meta 投入 143 億美元，從 Scale AI 挖角 Alexandr Wang 領軍進行 AI 全面革新，隨後耗時九個月將整個 AI 技術堆疊徹底拆解並從頭重建。其成果便是 Muse Spark。如今，曾協助 Llama 取得成功的開發者社群，被要求等待未來的開源版本——且無法保證會有明確的時間表。

什麼是 Muse Spark？

Muse Spark 是一款原生多模態推理模型，內建工具使用能力、視覺思考鏈及多代理協調功能。它目前驅動著 Meta AI，該服務已覆蓋 Meta 旗下應用程式中超過 30 億用戶。透過從頭重建技術基礎架構，Meta 打造出一個模型，其能力可媲美舊版中型 Llama 4 變體，卻僅需前代模型十分之一的運算資源。

這項效率數據意義重大。以 Meta 的規模而言，運算成本會迅速累積，而以遠低於前代模型的成本運行前沿級模型，將從根本上改變在數十億次日常互動中部署該模型的經濟效益。

基準測試結果呈現出喜憂參半的局面。在人工智慧指數 v4.0 中，Muse Spark 獲得 52 分，排名第四，僅次於 Gemini 3.1 Pro、GPT-5.4 及 Claude Opus 4.6。Meta 並未宣稱已打造出全球最佳模型——這與先前過度承諾、導致 Llama 4 信譽受損的做法形成鮮明對比。

Muse Spark 真正脫穎而出的領域在於醫療健康。在測試開放式健康查詢的 HealthBench Hard 評測中，其得分達 42.8 分，遠超 Gemini 3.1 Pro 的 20.6 分、GPT-5.4 的 40.1 分以及 Grok 4.2 的 20.3 分。健康領域是 Meta 的明確優先事項；該公司表示，已與超過 1,000 名醫師合作，為該模型精心策劃訓練資料。

Muse Spark 還提供三種互動模式：用於快速回答的「即時模式」、用於多步驟推理任務的「思考模式」，以及「沉思模式」——該模式能協調多個代理的並行推理，以抗衡 Gemini Deep Think 和 GPT Pro 最嚴苛的推理模式。

開源的退卻

Muse Spark 故事的這一面向並未出現在基準測試表格中。與 Meta 先前任何人都能下載並在自有設備上運行的開放權重模型不同，Muse Spark 完全屬於專有技術。該公司表示將透過 API 向精選合作夥伴提供該模型的私有預覽版，使其限制程度甚至比 Meta 競爭對手的付費模型還要嚴格。

王直接回應了這項變動，表示：「九個月前，我們從頭重建了 AI 技術堆疊。全新的基礎設施、架構與資料管道。這只是第一步。更大的模型已經在開發中，並計劃將未來版本開源。」

開發者社群的反應普遍持懷疑態度。部分人認為這是 Llama 4 未能獲得預期關注後，不得不採取的轉向策略；另一些人則視此為 Meta 在擁有值得保護的資產後，便將大門緊閉。如今，當這些沒有開源歷史的競爭對手持續推出免費可用的模型權重時，開發者社群卻被要求耐心等待。

分發優先於基準測試

與此同時，Meta 並未坐等開發者社群轉變態度。Muse Spark 將於未來數週內，率先在 Facebook、Instagram、WhatsApp 和 Messenger 內上線，並應用於 Meta 的 Ray-Ban AI 智慧眼鏡。這條部署路徑的影響力，恐怕遠勝於任何基準測試結果。OpenAI 和 Anthropic 主要向開發者及企業銷售；Meta 則直接部署給每日使用其應用程式的超過三十億用戶。

Meta 進軍健康領域確實引發了值得關注的隱私問題。Muse Spark 使用者需使用現有的 Meta 帳戶登入才能使用，雖然 Meta 並未明確表示個人帳戶資訊會被 AI 使用，但該公司通常是利用公開的用戶數據進行訓練，且將 Muse Spark 定位為個人超級智能產品。

在產品發布當天，Meta 股價上漲超過 9%，這顯示投資者將 Muse Spark 的推出視為證據，證明這筆對王（Wang）的 143 億美元投資以及長達九個月的重建工作確實產出了實質成果。承諾的開源版本是否真的會問世，是開發者社群每季都會追問的問題。答案將決定 Meta 人工智慧故事的這一章節將如何被後世銘記。

另請參閱：《Meta-Manus 評測：企業 AI 採購者需了解的跨境合規風險》

想向業界領袖深入了解人工智慧與大數據？歡迎參加將於阿姆斯特丹、加州及倫敦舉辦的「AI & Big Data Expo」。這場綜合性盛會隸屬於 TechEx 系列，並與其他頂尖科技活動同期舉行。點擊此處獲取更多資訊。

AI News 由 TechForge Media 提供技術支援。點此探索其他即將舉行的企業科技活動與線上研討會。

真正的差異：不在於某件事，而在於另一件事有時候，事物不僅是某種東西，同時也是另一種東西。在人工智慧生成的文字中，「這不僅是……，更是……」這類句式已變得如此常見，以至於它現在不僅僅是合成內容的線索——幾乎可以說是鐵證。正因如此，當我看到《巴倫周刊》的一份報告，指出這種句式在企業通訊中如何激增時，我不僅感到好奇——更真心覺得頗具諧趣。該報告不僅評論了此句式的出現頻率，更透過搜尋市場情報公司AlphaSense的資料庫，量化了其在企業新聞稿

亞馬遜推出由 Alexa+ 驅動的搜尋列 AI 購物助理無論你喜不喜歡，亞馬遜正將人工智慧置於購物體驗的核心。週三，該公司推出了「Alexa for Shopping」，這是一款由 Alexa+ 驅動的全新個人化 AI 購物助理。值得注意的是，這項新服務取代了 2024 年推出的生成式 AI 購物助理「Rufus」。據亞馬遜表示，「Alexa for Shopping」可在行動裝置、桌面電腦及 Echo Show 智慧螢幕上提供支援語音與觸控的購物體

Google 地圖將進行重大 AI 升級 Google 為其地圖與地理空間服務推出了全新的生成式 AI 功能，專為企業用戶設計。這些功能於本週在拉斯維加斯舉行的 Cloud Next 大會上發表，將為 Google 地圖帶來更強大的視覺與數據分析能力。新工具之一是「地圖影像定位」（Maps Imagery Grounding），它讓企業用戶能透過 AI 在 Google 街景中生成逼真的場景。這有助於將電影場景或施工現場等專案視覺化呈現。

相關專題推薦

商業