Google推出了新芯片,以削减主要的隐藏AI成本

在Google Cloud Next 25活动中,Google发布了其最新一代张量处理单元(TPU),名为Ironwood。这一新芯片标志着Google的重点发生重大转变,强调用于推理而非训练。传统上,TPU主要用于训练神经网络,这一过程由AI专家和数据科学家主导。然而,Ironwood的目标是满足数百万甚至数十亿用户的实时预测需求。
Ironwood TPU
Ironwood TPU的推出正值AI行业关键时刻,焦点从实验项目转向企业对AI模型的实际应用。像Google的Gemini这样的高级AI模型提升了推理能力,导致推理期间对计算能力的需求激增。这一转变正在推高成本,正如Google在描述Ironwood时所强调:“推理和多步骤推理正将计算需求的增量——以及成本——从训练转向推理时间(测试时扩展)。”Ironwood代表了Google在优化性能和效率方面的承诺,特别是在推理这一日益昂贵的领域。
推理芯片
Google与TPU的历程超过十年,Ironwood之前已有六代。虽然训练芯片产量较低,但推理芯片面向需要从训练模型中进行日常预测的更广泛受众,属于高产量市场。此前,Google的第六代TPU Trillium被定位为兼具训练和推理能力。然而,Ironwood主要聚焦于推理,标志着与这种双用途方法的显著背离。
必要投资
这一重点转变可能预示着Google对Intel、AMD和Nvidia等外部芯片制造商依赖的改变。据KeyBanc Capital Markets统计,这些供应商历来主导Google的云计算业务,占用了99%的处理器。通过投资自有TPU,Google可能旨在减少对这些供应商的依赖,并可能节省AI基础设施不断上升的成本。股票分析师如DA Davidson的Gil Luria估计,如果Google直接向Nvidia的客户销售TPU,去年可能产生高达240亿美元的收入。
Ironwood vs. Trillium
Google在活动中展示了Ironwood相较Trillium的技术优势。Ironwood的每瓦性能是Trillium的两倍,达到每秒29.3万亿次浮点运算。它还配备192GB高带宽内存(HBM),是Trillium的六倍,内存带宽达到每秒7.2太比特,是Trillium的4.5倍。这些增强旨在促进更大的数据移动并减少芯片上张量操作时的延迟,正如Google所述:“Ironwood旨在最小化芯片上的数据移动和延迟,同时进行大规模张量操作。”
扩展AI基础设施
内存和带宽的进步是Google扩展AI基础设施战略的核心。扩展涉及高效利用分组芯片并行解决问题,提升性能和利用率。这对经济原因至关重要,因为更高的利用率意味着减少昂贵资源的浪费。Google此前强调Trillium能够扩展到数十万芯片,同样,他们也强调Ironwood能够组成“数十万Ironwood芯片,以快速推进GenAI计算的前沿。”
除了硬件发布,Google还推出了Pathways on Cloud,这是一个将AI计算任务分配到不同机器上的软件解决方案。此前仅限内部使用,该软件现已向公众开放,进一步增强了Google的AI基础设施能力。
相关文章
ChatGPT成人模式再次推迟;奥特曼:优先考虑智能
OpenAI再次推迟推出备受争议的功能,转而专注于个性化和主动交互“不适当内容”是否应成为高效AI工具的一部分,这一问题在科技界早已引发热议。 OpenAI曾承诺让ChatGPT更好地理解成年用户,但再次令期待这一变革的人们失望。据IT之家报道,该公司近日确认,原定于2026年第一季度推出的所谓“成人模式”已再次推迟。这并非萨姆·阿尔特曼(Sam Altman)首次食言。早在2025年底,他就曾宣
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助
据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医
Cursor Composer 2 与 Claude Opus 4.6:基准测试引发新一轮人工智能编程争论
3月19日,Cursor正式发布了其自主研发的编程模型Composer 2。 这一消息在开发者社区中立即引发热议——据 Cursor 称,Composer 2 在 Terminal-Bench 2.0 测试中获得了 61.7% 的得分,在相同的测试条件下,这一成绩显著超过了 Claude Opus 4.6 的 58.0%。Anthropic的旗舰模型竟被自家IDE内置的模型超越?随着消息传开,相关
相关专题推荐
评论 (18)
0/500
Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎
Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔
Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.
Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞

在Google Cloud Next 25活动中,Google发布了其最新一代张量处理单元(TPU),名为Ironwood。这一新芯片标志着Google的重点发生重大转变,强调用于推理而非训练。传统上,TPU主要用于训练神经网络,这一过程由AI专家和数据科学家主导。然而,Ironwood的目标是满足数百万甚至数十亿用户的实时预测需求。
Ironwood TPU
Ironwood TPU的推出正值AI行业关键时刻,焦点从实验项目转向企业对AI模型的实际应用。像Google的Gemini这样的高级AI模型提升了推理能力,导致推理期间对计算能力的需求激增。这一转变正在推高成本,正如Google在描述Ironwood时所强调:“推理和多步骤推理正将计算需求的增量——以及成本——从训练转向推理时间(测试时扩展)。”Ironwood代表了Google在优化性能和效率方面的承诺,特别是在推理这一日益昂贵的领域。
推理芯片
Google与TPU的历程超过十年,Ironwood之前已有六代。虽然训练芯片产量较低,但推理芯片面向需要从训练模型中进行日常预测的更广泛受众,属于高产量市场。此前,Google的第六代TPU Trillium被定位为兼具训练和推理能力。然而,Ironwood主要聚焦于推理,标志着与这种双用途方法的显著背离。
必要投资
这一重点转变可能预示着Google对Intel、AMD和Nvidia等外部芯片制造商依赖的改变。据KeyBanc Capital Markets统计,这些供应商历来主导Google的云计算业务,占用了99%的处理器。通过投资自有TPU,Google可能旨在减少对这些供应商的依赖,并可能节省AI基础设施不断上升的成本。股票分析师如DA Davidson的Gil Luria估计,如果Google直接向Nvidia的客户销售TPU,去年可能产生高达240亿美元的收入。
Ironwood vs. Trillium
Google在活动中展示了Ironwood相较Trillium的技术优势。Ironwood的每瓦性能是Trillium的两倍,达到每秒29.3万亿次浮点运算。它还配备192GB高带宽内存(HBM),是Trillium的六倍,内存带宽达到每秒7.2太比特,是Trillium的4.5倍。这些增强旨在促进更大的数据移动并减少芯片上张量操作时的延迟,正如Google所述:“Ironwood旨在最小化芯片上的数据移动和延迟,同时进行大规模张量操作。”
扩展AI基础设施
内存和带宽的进步是Google扩展AI基础设施战略的核心。扩展涉及高效利用分组芯片并行解决问题,提升性能和利用率。这对经济原因至关重要,因为更高的利用率意味着减少昂贵资源的浪费。Google此前强调Trillium能够扩展到数十万芯片,同样,他们也强调Ironwood能够组成“数十万Ironwood芯片,以快速推进GenAI计算的前沿。”
除了硬件发布,Google还推出了Pathways on Cloud,这是一个将AI计算任务分配到不同机器上的软件解决方案。此前仅限内部使用,该软件现已向公众开放,进一步增强了Google的AI基础设施能力。
ChatGPT成人模式再次推迟;奥特曼:优先考虑智能
OpenAI再次推迟推出备受争议的功能,转而专注于个性化和主动交互“不适当内容”是否应成为高效AI工具的一部分,这一问题在科技界早已引发热议。 OpenAI曾承诺让ChatGPT更好地理解成年用户,但再次令期待这一变革的人们失望。据IT之家报道,该公司近日确认,原定于2026年第一季度推出的所谓“成人模式”已再次推迟。这并非萨姆·阿尔特曼(Sam Altman)首次食言。早在2025年底,他就曾宣
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助
据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医
Cursor Composer 2 与 Claude Opus 4.6:基准测试引发新一轮人工智能编程争论
3月19日,Cursor正式发布了其自主研发的编程模型Composer 2。 这一消息在开发者社区中立即引发热议——据 Cursor 称,Composer 2 在 Terminal-Bench 2.0 测试中获得了 61.7% 的得分,在相同的测试条件下,这一成绩显著超过了 Claude Opus 4.6 的 58.0%。Anthropic的旗舰模型竟被自家IDE内置的模型超越?随着消息传开,相关
Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎
Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔
Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.
Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞





首页






