Meta 推出新款 AI 晶片,挑戰 NVIDIA H100 的效能
為降低對外部 AI 晶片供應鏈的高度依賴,社群媒體龍頭 Meta 已正式推出其最新一代自研 AI 晶片。這款名為MTIA3 的加速器不僅在內部基準測試中表現優異,Meta 更在官方聲明中宣稱,其在特定工作負載下的推論效率已超越 NVIDIA 的旗艦級 H100 GPU。

客製化優勢:專為推薦系統與推論而打造
有別於 NVIDIA 專注於通用運算,Meta 的新晶片採取「深度客製化」路線。其核心使命在於優化驅動 Instagram 和 Facebook 的龐大推薦演算法,並支援 Llama 系列大型語言模型的即時推論:
能效顯著提升:透過針對特定工作負載簡化電路設計,MTIA3 在處理大規模推薦模型時,功耗遠低於通用型 GPU。
更高的運算密度:新架構提升了記憶體頻寬與互連效率,使單一機架能支援比以往配置更強大的運算叢集。
戰略轉向:從「採購者」到「自建生態系」
儘管 Meta 仍是 NVIDIA 的最大客戶之一,但這款晶片的強勢推出傳遞了一個明確訊號:
降低營運成本:大規模部署自研晶片將逐步削減 Meta 每年在 AI 基礎設施上的巨額支出。
軟硬體協同優化:透過在基礎層面將自研晶片與自家 PyTorch 框架深度整合,Meta 能比競爭對手更快速地部署最新 AI 演算法。
供應鏈安全:在運算資源緊缺的背景下,自主研發是 Meta 的關鍵戰略護城河,確保其全球 AI 發展藍圖能抵禦外部干擾。
產業影響:科技巨頭更深入涉足晶片製造
Meta 的突破意味著矽谷巨頭之間的競爭已從軟體層面全面延伸至電晶體層級。隨著 MTIA 系列持續演進,AI 晶片市場正從 NVIDIA 的「單極主導」轉向通用運算與客製化運算並存的多樣化格局。
Meta首席科學家Yann LeCun表示,硬體自主是邁向通用人工智慧(AGI)的必要步驟。隨著新晶片進入量產,Meta計劃在未來一年內將大部分推論工作負載遷移至其專有平台——此舉勢將重塑全球AI基礎設施的格局。
相關文章
Github Copilot的基於令牌的計費方式引發了開發者的強烈不滿
微軟GitHub Copilot的黃金時代可能即將結束,尤其是對個人使用者而言。該公司正從統一的訂閱費模式轉向基於代幣的計費方式,這可能會大幅增加使用成本。雖然大型企業或許還能承受這種變化,但小型企業和自由職業者可能會發現新的收費機制讓他們的月預算難以承受。這些變更將於6月1日正式生效,屆時使用者將按照工作中消耗的代幣數量來支付費用,而不再是按每次請求收取固定費用。一些開發者受到這一財務變動的影響,在Reddit和X平臺上表達了他們對這種看似過高的成本增加的擔憂。一位Redditor最近寫道:“
SpaceX的IPO申請檔案重點體現了其在衛星網際網路和人工智慧領域的發展雄心
在為即將進行的IPO提交的S-1註冊檔案中,SpaceX公佈了一系列令人矚目的業務資料,這些資料凸顯了其在航空航天通訊和人工智慧領域的強大實力:Starlink使用者數突破1000萬:截至2026年第一季度,全球付費Starlink使用者數量已達到1030萬,這一數字在過去一年內翻了一番。這一增長充分證明了作為全球最大的近地軌道衛星星座,Starlink在寬頻和行動通訊領域的領先地位。目前該衛星網路由大約9600顆衛星組成,這些衛星佔在軌所有活躍衛星總數的65%。Grok與X人工智慧生態體系:通
阿里巴巴Tuhao M890上市,憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代
2026年5月20日,在阿里雲峰會上,阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”,從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎:騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890,該晶片集訓練與推理功能於一體。效能提升:M890擁有144GB的記憶體,其效能是前代產品振武810E的三倍。
相關專題推薦
評論 (0)
0/500
為降低對外部 AI 晶片供應鏈的高度依賴,社群媒體龍頭 Meta 已正式推出其最新一代自研 AI 晶片。這款名為MTIA3 的加速器不僅在內部基準測試中表現優異,Meta 更在官方聲明中宣稱,其在特定工作負載下的推論效率已超越 NVIDIA 的旗艦級 H100 GPU。

客製化優勢:專為推薦系統與推論而打造
有別於 NVIDIA 專注於通用運算,Meta 的新晶片採取「深度客製化」路線。其核心使命在於優化驅動 Instagram 和 Facebook 的龐大推薦演算法,並支援 Llama 系列大型語言模型的即時推論:
能效顯著提升:透過針對特定工作負載簡化電路設計,MTIA3 在處理大規模推薦模型時,功耗遠低於通用型 GPU。
更高的運算密度:新架構提升了記憶體頻寬與互連效率,使單一機架能支援比以往配置更強大的運算叢集。
戰略轉向:從「採購者」到「自建生態系」
儘管 Meta 仍是 NVIDIA 的最大客戶之一,但這款晶片的強勢推出傳遞了一個明確訊號:
降低營運成本:大規模部署自研晶片將逐步削減 Meta 每年在 AI 基礎設施上的巨額支出。
軟硬體協同優化:透過在基礎層面將自研晶片與自家 PyTorch 框架深度整合,Meta 能比競爭對手更快速地部署最新 AI 演算法。
供應鏈安全:在運算資源緊缺的背景下,自主研發是 Meta 的關鍵戰略護城河,確保其全球 AI 發展藍圖能抵禦外部干擾。
產業影響:科技巨頭更深入涉足晶片製造
Meta 的突破意味著矽谷巨頭之間的競爭已從軟體層面全面延伸至電晶體層級。隨著 MTIA 系列持續演進,AI 晶片市場正從 NVIDIA 的「單極主導」轉向通用運算與客製化運算並存的多樣化格局。
Meta首席科學家Yann LeCun表示,硬體自主是邁向通用人工智慧(AGI)的必要步驟。隨著新晶片進入量產,Meta計劃在未來一年內將大部分推論工作負載遷移至其專有平台——此舉勢將重塑全球AI基礎設施的格局。
Github Copilot的基於令牌的計費方式引發了開發者的強烈不滿
微軟GitHub Copilot的黃金時代可能即將結束,尤其是對個人使用者而言。該公司正從統一的訂閱費模式轉向基於代幣的計費方式,這可能會大幅增加使用成本。雖然大型企業或許還能承受這種變化,但小型企業和自由職業者可能會發現新的收費機制讓他們的月預算難以承受。這些變更將於6月1日正式生效,屆時使用者將按照工作中消耗的代幣數量來支付費用,而不再是按每次請求收取固定費用。一些開發者受到這一財務變動的影響,在Reddit和X平臺上表達了他們對這種看似過高的成本增加的擔憂。一位Redditor最近寫道:“
SpaceX的IPO申請檔案重點體現了其在衛星網際網路和人工智慧領域的發展雄心
在為即將進行的IPO提交的S-1註冊檔案中,SpaceX公佈了一系列令人矚目的業務資料,這些資料凸顯了其在航空航天通訊和人工智慧領域的強大實力:Starlink使用者數突破1000萬:截至2026年第一季度,全球付費Starlink使用者數量已達到1030萬,這一數字在過去一年內翻了一番。這一增長充分證明了作為全球最大的近地軌道衛星星座,Starlink在寬頻和行動通訊領域的領先地位。目前該衛星網路由大約9600顆衛星組成,這些衛星佔在軌所有活躍衛星總數的65%。Grok與X人工智慧生態體系:通
阿里巴巴Tuhao M890上市,憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代
2026年5月20日,在阿里雲峰會上,阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”,從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎:騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890,該晶片集訓練與推理功能於一體。效能提升:M890擁有144GB的記憶體,其效能是前代產品振武810E的三倍。





首頁






