選項
首頁
新聞
Google推出了新芯片,以削減主要的隱藏AI成本

Google推出了新芯片,以削減主要的隱藏AI成本

2025-04-22
135

Google推出了新芯片,以削減主要的隱藏AI成本

在Google Cloud Next 25活動中,Google展示了其最新一代張量處理單元(TPU),名為Ironwood。這款新晶片標誌著Google焦點的重大轉變,強調其用於推理而非訓練。傳統上,TPU用於訓練神經網路,這一過程主要由AI專家和數據科學家主導。然而,隨著Ironwood的推出,Google現正針對數百萬甚至數十億用戶的即時預測需求。

Ironwood TPU

Ironwood TPU的推出正值AI產業的關鍵時刻,焦點正從實驗性項目轉向企業對AI模型的實際應用。像Google的Gemini這樣的高級AI模型的出現,提升了推理能力,對推理期間的計算能力需求激增。這一轉變正在推高成本,正如Google在描述Ironwood時所強調:「推理和多步驟推理正在將計算需求的增量——以及成本——從訓練轉向推理時間(測試時間擴展)。」Ironwood代表了Google致力於優化性能和效率,特別是在日益昂貴的推理領域。

推理晶片

Google與TPU的歷程已超過十年,Ironwood之前已有六代。訓練晶片的生產量較低,而推理晶片則服務於需要從訓練模型中進行日常預測的廣大受眾,是一個高產量市場。此前,Google的第六代TPU Trillium被定位為同時適用於訓練和推理。然而,Ironwood主要聚焦於推理,標誌著與這種雙用途方法的顯著背離。

必要的投資

這種焦點的轉變可能預示著Google對外部晶片製造商如Intel、AMD和Nvidia的依賴發生變化。根據KeyBanc Capital Markets的數據,這些供應商歷來主導Google的雲計算運營,佔據了99%的處理器使用量。通過投資自有TPU,Google可能旨在減少對這些供應商的依賴,並可能節省AI基礎設施不斷上升的成本。股票分析師,如DA Davidson的Gil Luria,估計如果Google直接向Nvidia的客戶銷售TPU,去年可能已創造高達240億美元的收入。

Ironwood vs. Trillium

Google在活動中展示了Ironwood相較於Trillium的技術優勢。Ironwood的每瓦性能是Trillium的兩倍,達到每秒29.3萬億浮點運算。它還擁有192GB的高頻寬記憶體(HBM),是Trillium的六倍,記憶體頻寬達到每秒7.2太比特,是Trillium的4.5倍。這些增強旨在促進更大的數據移動並減少晶片上進行張量操作時的延遲,正如Google所述:「Ironwood設計用於在執行大規模張量操作時,最大限度減少晶片上的數據移動和延遲。」

擴展AI基礎設施

記憶體和頻寬的進步是Google擴展其AI基礎設施策略的核心。擴展涉及有效利用分組晶片以並行解決問題,提升性能和利用率。這對經濟原因至關重要,因為更高的利用率意味著更少浪費昂貴的資源。Google此前已強調Trillium能夠擴展至數十萬個晶片,同樣地,他們也強調Ironwood能夠組成「數十萬個Ironwood晶片,以快速推進GenAI計算的前沿。」

除了硬體公告外,Google還推出了Pathways on Cloud,這是一款將AI計算任務分發到不同機器的軟體解決方案。此前該軟體僅供內部使用,現在已向公眾開放,進一步增強了Google的AI基礎設施能力。

相關文章
AI Powered Cover Letters:期刊投稿專家指南 AI Powered Cover Letters:期刊投稿專家指南 在現今競爭激烈的學術出版環境中,撰寫一封有效的求職信對您的稿件能否被接受起著舉足輕重的作用。探索像 ChatGPT 之類的人工智能工具如何簡化這項重要任務,幫助您撰寫出精緻、專業的求職信,吸引期刊編輯的注意。我們的全面指南揭示了逐步優化您的投稿包並最大化出版成功率的策略。重點必要的研究準備:彙整所有稿件細節和期刊規格。AI 輔助撰稿:使用 ChatGPT 生成初始求職信模板。個人客製化:完善 AI
美國將因社交媒體法規制裁外國官員 美國將因社交媒體法規制裁外國官員 美國站出來反對全球數位內容法規美國國務院本周針對歐洲的數位治理政策發出尖銳的外交譴責,顯示在網路平台控制權上的緊張關係正不斷升級。國務卿 Marco Rubio 公布了一項新的簽證限制政策,針對參與美國認為影響美國數位空間的過度審查的外國官員。新簽證限制說明根據週三公佈的政策,美國將拒絕被判定為正在執行影響美國受保護言論的海外內容規定的外國公民入境。Rubio 強調兩項主要的違法行為:
AI 驅動的 YouTube 影片摘要器終極指南 AI 驅動的 YouTube 影片摘要器終極指南 在資訊豐富的數位環境中,AI 驅動的 YouTube 影片摘要器已成為有效率內容消費不可或缺的工具。本深入指南將探討如何使用尖端的 NLP 技術,特別是 Hugging Face 的 BART 模型結合 YouTube 的 Transcript API,建立精密的摘要工具。無論您是要開發生產力工具、增強可及性解決方案,或是創造教育資源,本指南都能提供您所需的一切,讓您能以文字與音訊輸出功能來實作專
評論 (18)
0/200
JustinKing
JustinKing 2025-08-28 09:01:29

Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎

EllaJohnson
EllaJohnson 2025-08-16 05:00:59

Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔

RalphSanchez
RalphSanchez 2025-08-15 07:01:00

Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.

GaryGonzalez
GaryGonzalez 2025-04-24 15:26:40

Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞

WalterWalker
WalterWalker 2025-04-24 12:26:10

Googleの新しいTPU、Ironwoodは推論タスクに革命をもたらす!効率化に焦点を当てるのは素晴らしいですね。ただ、古いモデルと互換性がないのがちょっと残念。将来のAI開発に期待しています!🤖

ChristopherAllen
ChristopherAllen 2025-04-24 09:03:04

La nueva TPU de Google, Ironwood, es increíble para tareas de inferencia. ¡Me encanta que se estén enfocando en la eficiencia! Aunque me molesta un poco que no sea compatible con modelos anteriores. ¡Espero ver más avances pronto! 🚀

回到頂部
OR