选项
首页
新闻
Google推出了新芯片,以削减主要的隐藏AI成本

Google推出了新芯片,以削减主要的隐藏AI成本

2025-04-22
192

Google推出了新芯片,以削减主要的隐藏AI成本

在Google Cloud Next 25活动中,Google发布了其最新一代张量处理单元(TPU),名为Ironwood。这一新芯片标志着Google的重点发生重大转变,强调用于推理而非训练。传统上,TPU主要用于训练神经网络,这一过程由AI专家和数据科学家主导。然而,Ironwood的目标是满足数百万甚至数十亿用户的实时预测需求。

Ironwood TPU

Ironwood TPU的推出正值AI行业关键时刻,焦点从实验项目转向企业对AI模型的实际应用。像Google的Gemini这样的高级AI模型提升了推理能力,导致推理期间对计算能力的需求激增。这一转变正在推高成本,正如Google在描述Ironwood时所强调:“推理和多步骤推理正将计算需求的增量——以及成本——从训练转向推理时间(测试时扩展)。”Ironwood代表了Google在优化性能和效率方面的承诺,特别是在推理这一日益昂贵的领域。

推理芯片

Google与TPU的历程超过十年,Ironwood之前已有六代。虽然训练芯片产量较低,但推理芯片面向需要从训练模型中进行日常预测的更广泛受众,属于高产量市场。此前,Google的第六代TPU Trillium被定位为兼具训练和推理能力。然而,Ironwood主要聚焦于推理,标志着与这种双用途方法的显著背离。

必要投资

这一重点转变可能预示着Google对Intel、AMD和Nvidia等外部芯片制造商依赖的改变。据KeyBanc Capital Markets统计,这些供应商历来主导Google的云计算业务,占用了99%的处理器。通过投资自有TPU,Google可能旨在减少对这些供应商的依赖,并可能节省AI基础设施不断上升的成本。股票分析师如DA Davidson的Gil Luria估计,如果Google直接向Nvidia的客户销售TPU,去年可能产生高达240亿美元的收入。

Ironwood vs. Trillium

Google在活动中展示了Ironwood相较Trillium的技术优势。Ironwood的每瓦性能是Trillium的两倍,达到每秒29.3万亿次浮点运算。它还配备192GB高带宽内存(HBM),是Trillium的六倍,内存带宽达到每秒7.2太比特,是Trillium的4.5倍。这些增强旨在促进更大的数据移动并减少芯片上张量操作时的延迟,正如Google所述:“Ironwood旨在最小化芯片上的数据移动和延迟,同时进行大规模张量操作。”

扩展AI基础设施

内存和带宽的进步是Google扩展AI基础设施战略的核心。扩展涉及高效利用分组芯片并行解决问题,提升性能和利用率。这对经济原因至关重要,因为更高的利用率意味着减少昂贵资源的浪费。Google此前强调Trillium能够扩展到数十万芯片,同样,他们也强调Ironwood能够组成“数十万Ironwood芯片,以快速推进GenAI计算的前沿。”

除了硬件发布,Google还推出了Pathways on Cloud,这是一个将AI计算任务分配到不同机器上的软件解决方案。此前仅限内部使用,该软件现已向公众开放,进一步增强了Google的AI基础设施能力。

相关文章
BuzzFeed 推出专注于垃圾应用的 AI 子公司 BuzzFeed 推出专注于垃圾应用的 AI 子公司 在面临重大经营危机的背景下,曾经的数字媒体巨头BuzzFeed正启动一项由人工智能驱动的雄心勃勃的自救实验。 在最近举行的SXSW大会上,联合创始人兼首席执行官乔纳·佩雷蒂宣布成立一家名为Branch Office的子公司,旨在通过一系列由人工智能驱动的消费者应用程序,重新定义“软件即内容”的商业模式。核心产品组合:融合网络梗与社交媒体Branch Office 推出了三款核心应用,每款都旨在捕捉
ChatGPT成人模式再次推迟;奥特曼:优先考虑智能 ChatGPT成人模式再次推迟;奥特曼:优先考虑智能 OpenAI再次推迟推出备受争议的功能,转而专注于个性化和主动交互“不适当内容”是否应成为高效AI工具的一部分,这一问题在科技界早已引发热议。 OpenAI曾承诺让ChatGPT更好地理解成年用户,但再次令期待这一变革的人们失望。据IT之家报道,该公司近日确认,原定于2026年第一季度推出的所谓“成人模式”已再次推迟。这并非萨姆·阿尔特曼(Sam Altman)首次食言。早在2025年底,他就曾宣
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助 百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助 据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医
相关专题推荐
图像编辑 用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计
用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计

2026最新推荐:探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具,帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项,查看实际测试结果,从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析,让您立即开始将故事可视化呈现吧!

10 个工具
xix.ai
写作 最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告
最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告

在XIX.AI上,发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能,帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名,您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧!

10 个工具
xix.ai
商业 最佳 AI 合同审查软件:即时发现法律漏洞与合规风险
最佳 AI 合同审查软件:即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具,能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名,对比免费与付费选项。找到能彻底改变游戏规则的解决方案,实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具
xix.ai
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
写作 顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷
顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷

探索2026年最优秀的AI人物设定生成工具,助您塑造鲜活立体的角色。XIX.AI精心筛选的这份清单汇集了广受好评、颠覆传统的工具,能够生成具有内在逻辑的动机和致命缺陷。通过实际测试对比免费与付费选项。立即释放您的叙事潜能。

10 个工具
xix.ai
评论 (18)
0/500
JustinKing
JustinKing 2025-08-28 09:01:29

Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎

EllaJohnson
EllaJohnson 2025-08-16 05:00:59

Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔

RalphSanchez
RalphSanchez 2025-08-15 07:01:00

Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.

GaryGonzalez
GaryGonzalez 2025-04-24 15:26:40

Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞

WalterWalker
WalterWalker 2025-04-24 12:26:10

Googleの新しいTPU、Ironwoodは推論タスクに革命をもたらす!効率化に焦点を当てるのは素晴らしいですね。ただ、古いモデルと互換性がないのがちょっと残念。将来のAI開発に期待しています!🤖

ChristopherAllen
ChristopherAllen 2025-04-24 09:03:04

La nueva TPU de Google, Ironwood, es increíble para tareas de inferencia. ¡Me encanta que se estén enfocando en la eficiencia! Aunque me molesta un poco que no sea compatible con modelos anteriores. ¡Espero ver más avances pronto! 🚀

OR