選項
首頁
新聞
Google推出了新芯片,以削減主要的隱藏AI成本

Google推出了新芯片,以削減主要的隱藏AI成本

2025-04-22
117

Google推出了新芯片,以削減主要的隱藏AI成本

在Google Cloud Next 25活動中,Google展示了其最新一代張量處理單元(TPU),名為Ironwood。這款新晶片標誌著Google焦點的重大轉變,強調其用於推理而非訓練。傳統上,TPU用於訓練神經網路,這一過程主要由AI專家和數據科學家主導。然而,隨著Ironwood的推出,Google現正針對數百萬甚至數十億用戶的即時預測需求。

Ironwood TPU

Ironwood TPU的推出正值AI產業的關鍵時刻,焦點正從實驗性項目轉向企業對AI模型的實際應用。像Google的Gemini這樣的高級AI模型的出現,提升了推理能力,對推理期間的計算能力需求激增。這一轉變正在推高成本,正如Google在描述Ironwood時所強調:「推理和多步驟推理正在將計算需求的增量——以及成本——從訓練轉向推理時間(測試時間擴展)。」Ironwood代表了Google致力於優化性能和效率,特別是在日益昂貴的推理領域。

推理晶片

Google與TPU的歷程已超過十年,Ironwood之前已有六代。訓練晶片的生產量較低,而推理晶片則服務於需要從訓練模型中進行日常預測的廣大受眾,是一個高產量市場。此前,Google的第六代TPU Trillium被定位為同時適用於訓練和推理。然而,Ironwood主要聚焦於推理,標誌著與這種雙用途方法的顯著背離。

必要的投資

這種焦點的轉變可能預示著Google對外部晶片製造商如Intel、AMD和Nvidia的依賴發生變化。根據KeyBanc Capital Markets的數據,這些供應商歷來主導Google的雲計算運營,佔據了99%的處理器使用量。通過投資自有TPU,Google可能旨在減少對這些供應商的依賴,並可能節省AI基礎設施不斷上升的成本。股票分析師,如DA Davidson的Gil Luria,估計如果Google直接向Nvidia的客戶銷售TPU,去年可能已創造高達240億美元的收入。

Ironwood vs. Trillium

Google在活動中展示了Ironwood相較於Trillium的技術優勢。Ironwood的每瓦性能是Trillium的兩倍,達到每秒29.3萬億浮點運算。它還擁有192GB的高頻寬記憶體(HBM),是Trillium的六倍,記憶體頻寬達到每秒7.2太比特,是Trillium的4.5倍。這些增強旨在促進更大的數據移動並減少晶片上進行張量操作時的延遲,正如Google所述:「Ironwood設計用於在執行大規模張量操作時,最大限度減少晶片上的數據移動和延遲。」

擴展AI基礎設施

記憶體和頻寬的進步是Google擴展其AI基礎設施策略的核心。擴展涉及有效利用分組晶片以並行解決問題,提升性能和利用率。這對經濟原因至關重要,因為更高的利用率意味著更少浪費昂貴的資源。Google此前已強調Trillium能夠擴展至數十萬個晶片,同樣地,他們也強調Ironwood能夠組成「數十萬個Ironwood晶片,以快速推進GenAI計算的前沿。」

除了硬體公告外,Google還推出了Pathways on Cloud,這是一款將AI計算任務分發到不同機器的軟體解決方案。此前該軟體僅供內部使用,現在已向公眾開放,進一步增強了Google的AI基礎設施能力。

相關文章
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。國際數學奧林匹克的重要性自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽
AI驅動的視差製作工具:打造動態2.5D動畫 AI驅動的視差製作工具:打造動態2.5D動畫 將靜態圖像轉化為引人入勝的2.5D動畫,使用Parallax Maker。此開源工具賦予藝術家和遊戲開發者為其作品注入深度與動態的能力。透過利用Stability AI API,Parallax Maker確保即使在普通硬體上也能實現流暢的工作流程。探索此工具的功能以及如何提升您的創意項目。主要亮點Parallax Maker是一個用於製作2.5D動畫的開源解決方案。它將圖像轉化為與Blender
評論 (17)
0/200
EllaJohnson
EllaJohnson 2025-08-16 05:00:59

Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔

RalphSanchez
RalphSanchez 2025-08-15 07:01:00

Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.

GaryGonzalez
GaryGonzalez 2025-04-24 15:26:40

Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞

WalterWalker
WalterWalker 2025-04-24 12:26:10

Googleの新しいTPU、Ironwoodは推論タスクに革命をもたらす!効率化に焦点を当てるのは素晴らしいですね。ただ、古いモデルと互換性がないのがちょっと残念。将来のAI開発に期待しています!🤖

ChristopherAllen
ChristopherAllen 2025-04-24 09:03:04

La nueva TPU de Google, Ironwood, es increíble para tareas de inferencia. ¡Me encanta que se estén enfocando en la eficiencia! Aunque me molesta un poco que no sea compatible con modelos anteriores. ¡Espero ver más avances pronto! 🚀

TerryScott
TerryScott 2025-04-24 04:52:06

TPU mới của Google, Ironwood, thật sự là một bước tiến lớn cho các nhiệm vụ suy luận! Tôi thích cách họ tập trung vào hiệu quả. Tuy nhiên, việc không tương thích với các mô hình cũ khiến tôi hơi thất vọng. Mong chờ những phát triển AI trong tương lai! 🤓

回到頂部
OR