Google推出了新芯片,以削减主要的隐藏AI成本

在Google Cloud Next 25活动中,Google发布了其最新一代张量处理单元(TPU),名为Ironwood。这一新芯片标志着Google的重点发生重大转变,强调用于推理而非训练。传统上,TPU主要用于训练神经网络,这一过程由AI专家和数据科学家主导。然而,Ironwood的目标是满足数百万甚至数十亿用户的实时预测需求。
Ironwood TPU
Ironwood TPU的推出正值AI行业关键时刻,焦点从实验项目转向企业对AI模型的实际应用。像Google的Gemini这样的高级AI模型提升了推理能力,导致推理期间对计算能力的需求激增。这一转变正在推高成本,正如Google在描述Ironwood时所强调:“推理和多步骤推理正将计算需求的增量——以及成本——从训练转向推理时间(测试时扩展)。”Ironwood代表了Google在优化性能和效率方面的承诺,特别是在推理这一日益昂贵的领域。
推理芯片
Google与TPU的历程超过十年,Ironwood之前已有六代。虽然训练芯片产量较低,但推理芯片面向需要从训练模型中进行日常预测的更广泛受众,属于高产量市场。此前,Google的第六代TPU Trillium被定位为兼具训练和推理能力。然而,Ironwood主要聚焦于推理,标志着与这种双用途方法的显著背离。
必要投资
这一重点转变可能预示着Google对Intel、AMD和Nvidia等外部芯片制造商依赖的改变。据KeyBanc Capital Markets统计,这些供应商历来主导Google的云计算业务,占用了99%的处理器。通过投资自有TPU,Google可能旨在减少对这些供应商的依赖,并可能节省AI基础设施不断上升的成本。股票分析师如DA Davidson的Gil Luria估计,如果Google直接向Nvidia的客户销售TPU,去年可能产生高达240亿美元的收入。
Ironwood vs. Trillium
Google在活动中展示了Ironwood相较Trillium的技术优势。Ironwood的每瓦性能是Trillium的两倍,达到每秒29.3万亿次浮点运算。它还配备192GB高带宽内存(HBM),是Trillium的六倍,内存带宽达到每秒7.2太比特,是Trillium的4.5倍。这些增强旨在促进更大的数据移动并减少芯片上张量操作时的延迟,正如Google所述:“Ironwood旨在最小化芯片上的数据移动和延迟,同时进行大规模张量操作。”
扩展AI基础设施
内存和带宽的进步是Google扩展AI基础设施战略的核心。扩展涉及高效利用分组芯片并行解决问题,提升性能和利用率。这对经济原因至关重要,因为更高的利用率意味着减少昂贵资源的浪费。Google此前强调Trillium能够扩展到数十万芯片,同样,他们也强调Ironwood能够组成“数十万Ironwood芯片,以快速推进GenAI计算的前沿。”
除了硬件发布,Google还推出了Pathways on Cloud,这是一个将AI计算任务分配到不同机器上的软件解决方案。此前仅限内部使用,该软件现已向公众开放,进一步增强了Google的AI基础设施能力。
相关文章
人工智能通过令人惊叹的数字转换,在元宇宙中重塑迈克尔-杰克逊的形象
人工智能正在从根本上重塑我们对创造力、娱乐和文化遗产的理解。对人工智能生成的迈克尔-杰克逊演绎的探索,揭示了尖端技术如何为传奇文化人物注入新的生命。从超级英雄的化身到奇幻境界的战士,这些突破性的转变展示了人工智能重塑流行音乐之王的非凡能力,同时也拓展了数字艺术和虚拟世界体验的视野。主要见解人工智能通过富有想象力的角色转换重新定义迈克尔-杰克逊戏剧性的可视化包括超级英雄、绝地武士和装甲骑士角色探索数
训练能否减轻人工智能引发的认知卸载效应?
最近,Unite.ai 网站发表了一篇题为《ChatGPT 可能正在耗尽你的大脑》的调查文章:人工智能时代的认知债务",揭示了麻省理工学院的相关研究。记者亚历克斯-麦克法兰(Alex McFarland)详细列举了令人信服的证据,证明过度依赖人工智能会侵蚀人的基本认知能力,尤其是批判性思维和判断能力。虽然这些发现与许多其他研究结果一致,但目前的紧迫挑战是制定切实可行的解决方案,让企业在利用人工智能
轻松生成人工智能驱动的图表和可视化效果,以获得更好的数据洞察力
现代数据分析要求复杂信息的直观可视化。人工智能驱动的图表生成解决方案已成为不可或缺的资产,彻底改变了专业人员将原始数据转化为引人入胜的可视化故事的方式。这些智能系统无需手动创建图表,同时还能保持精确性,使技术用户和非技术用户都能通过自动可视化发现可行的见解。主要亮点自动可视化:立即将结构化和非结构化数据转换为专业级图表。自然语言处理:通过对话命令生成可视化,无需编码。全面的图表支持:生成条形图、饼
评论 (18)
0/200
JustinKing
2025-08-28 09:01:29
Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎
0
EllaJohnson
2025-08-16 05:00:59
Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔
0
RalphSanchez
2025-08-15 07:01:00
Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.
0
GaryGonzalez
2025-04-24 15:26:40
Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞
0
WalterWalker
2025-04-24 12:26:10
Googleの新しいTPU、Ironwoodは推論タスクに革命をもたらす!効率化に焦点を当てるのは素晴らしいですね。ただ、古いモデルと互換性がないのがちょっと残念。将来のAI開発に期待しています!🤖
0
ChristopherAllen
2025-04-24 09:03:04
La nueva TPU de Google, Ironwood, es increíble para tareas de inferencia. ¡Me encanta que se estén enfocando en la eficiencia! Aunque me molesta un poco que no sea compatible con modelos anteriores. ¡Espero ver más avances pronto! 🚀
0
在Google Cloud Next 25活动中,Google发布了其最新一代张量处理单元(TPU),名为Ironwood。这一新芯片标志着Google的重点发生重大转变,强调用于推理而非训练。传统上,TPU主要用于训练神经网络,这一过程由AI专家和数据科学家主导。然而,Ironwood的目标是满足数百万甚至数十亿用户的实时预测需求。
Ironwood TPU
Ironwood TPU的推出正值AI行业关键时刻,焦点从实验项目转向企业对AI模型的实际应用。像Google的Gemini这样的高级AI模型提升了推理能力,导致推理期间对计算能力的需求激增。这一转变正在推高成本,正如Google在描述Ironwood时所强调:“推理和多步骤推理正将计算需求的增量——以及成本——从训练转向推理时间(测试时扩展)。”Ironwood代表了Google在优化性能和效率方面的承诺,特别是在推理这一日益昂贵的领域。
推理芯片
Google与TPU的历程超过十年,Ironwood之前已有六代。虽然训练芯片产量较低,但推理芯片面向需要从训练模型中进行日常预测的更广泛受众,属于高产量市场。此前,Google的第六代TPU Trillium被定位为兼具训练和推理能力。然而,Ironwood主要聚焦于推理,标志着与这种双用途方法的显著背离。
必要投资
这一重点转变可能预示着Google对Intel、AMD和Nvidia等外部芯片制造商依赖的改变。据KeyBanc Capital Markets统计,这些供应商历来主导Google的云计算业务,占用了99%的处理器。通过投资自有TPU,Google可能旨在减少对这些供应商的依赖,并可能节省AI基础设施不断上升的成本。股票分析师如DA Davidson的Gil Luria估计,如果Google直接向Nvidia的客户销售TPU,去年可能产生高达240亿美元的收入。
Ironwood vs. Trillium
Google在活动中展示了Ironwood相较Trillium的技术优势。Ironwood的每瓦性能是Trillium的两倍,达到每秒29.3万亿次浮点运算。它还配备192GB高带宽内存(HBM),是Trillium的六倍,内存带宽达到每秒7.2太比特,是Trillium的4.5倍。这些增强旨在促进更大的数据移动并减少芯片上张量操作时的延迟,正如Google所述:“Ironwood旨在最小化芯片上的数据移动和延迟,同时进行大规模张量操作。”
扩展AI基础设施
内存和带宽的进步是Google扩展AI基础设施战略的核心。扩展涉及高效利用分组芯片并行解决问题,提升性能和利用率。这对经济原因至关重要,因为更高的利用率意味着减少昂贵资源的浪费。Google此前强调Trillium能够扩展到数十万芯片,同样,他们也强调Ironwood能够组成“数十万Ironwood芯片,以快速推进GenAI计算的前沿。”
除了硬件发布,Google还推出了Pathways on Cloud,这是一个将AI计算任务分配到不同机器上的软件解决方案。此前仅限内部使用,该软件现已向公众开放,进一步增强了Google的AI基础设施能力。




Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎




Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔




Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.




Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞




Googleの新しいTPU、Ironwoodは推論タスクに革命をもたらす!効率化に焦点を当てるのは素晴らしいですね。ただ、古いモデルと互換性がないのがちょっと残念。将来のAI開発に期待しています!🤖




La nueva TPU de Google, Ironwood, es increíble para tareas de inferencia. ¡Me encanta que se estén enfocando en la eficiencia! Aunque me molesta un poco que no sea compatible con modelos anteriores. ¡Espero ver más avances pronto! 🚀












