选项
首页
新闻
从 MIPS 到 exaflops,短短几十年:计算能力正在爆炸,将改变 AI

从 MIPS 到 exaflops,短短几十年:计算能力正在爆炸,将改变 AI

2025-06-25
69

在最近的Nvidia GTC大会上,这家科技巨头公布了一项突破性成就:首个人单机架服务器系统能够达到一exaflop的性能。这是一个令人难以置信的每秒十亿亿次浮点运算(FLOPS)。这一壮举由Nvidia最新的GB200 NVL72系统驱动,该系统搭载了尖端的Blackwell图形处理单元(GPUs)。为了便于理解,这个系统可以装进一个标准的计算机机架,高度约6英尺,深度略超3英尺,宽度不到2英尺。

缩小exaflop:从Frontier到Blackwell

这一消息让我思考我们在短短几年内取得了多大的进步。全球首台exaflop级计算机“Frontier”于2022年在橡树岭国家实验室安装。由HPE制造并搭载AMD GPUs和CPUs,它占地足足74个机架。相比之下,Nvidia的新系统将73倍的性能压缩到单个机架中。这相当于三年内每年性能翻三倍!这充分证明了计算密度、能源效率和架构设计方面的惊人进步。

值得注意的是,虽然这两个系统都达到了exaflop的里程碑,但它们的设计用途不同。Nvidia的exaflop评级基于较低精度的数学运算——4位和8位浮点运算,非常适合AI工作负载,如训练和运行大型语言模型(LLMs)。这些计算更注重速度而非精度。另一方面,Frontier的exaflop评级来自64位双精度数学运算,这是科学模拟的金标准,精度至关重要。

我们进步神速

这种进步速度几乎令人难以置信,尤其是当我回想起自己计算职业生涯的早期。我的第一份工作是在DEC KL 1090上做程序员,这是DEC的PDP-10系列分时主机的组成部分。那台机器的运行速度仅为每秒180万条指令(MIPS)。它通过硬连线连接到阴极射线管(CRT)显示器,没有任何图形显示——只有屏幕上的文本。当然,那时也没有互联网。远程用户必须通过电话线使用最高速度为1200比特每秒的调制解调器连接。

DEC系统10;来源:Joe Mabel,CC BY-SA 3.0。

计算能力提升5000亿倍

虽然MIPS和FLOPS的比较并非完全等同,但它让我们感受到计算能力的惊人飞跃。MIPS衡量整数处理速度,适用于通用计算和商业应用。而FLOPS则衡量浮点性能,对科学工作负载和现代AI背后的繁重计算至关重要,例如训练和运行机器学习(ML)模型所需的矩阵运算和线性代数。

以这些为粗略参考,Nvidia的新系统大约比老式DEC机器强大5000亿倍。这是计算能力在单一职业生涯中指数级增长的惊人例证。这让人不禁思考:如果我们在40年内取得了如此成就,未来五年会带来什么?

Nvidia已经给出了一些线索。在GTC大会上,他们分享了一份路线图,预测基于“Vera Rubin”Ultra架构的下一代全机架系统将提供当前Blackwell Ultra机架14倍的性能。未来一两年内,我们有望看到AI优化工作负载达到14到15 exaflops的性能。

这不仅仅关乎原始性能。将如此强大的性能压缩到单个机架意味着更少的空间占用、更少的材料使用,以及可能更低的每运算能耗。不过,我们也不能忘记,这些系统的绝对能耗需求仍然巨大。

AI真的需要这么多计算能力吗?

虽然这些性能提升令人印象深刻,但AI行业现在正面临一个重大问题:我们到底需要多少计算能力,代价又是什么?建设大规模新AI数据中心的竞赛,受到exaflop级计算和日益强大的AI模型需求的推动。

最雄心勃勃的项目是耗资5000亿美元的Stargate项目,计划在美国建设20个数据中心,每个占地50万平方英尺。全球范围内还有一波其他超大规模项目正在进行或筹备中,各公司和国家竞相为未来AI工作负载建设基础设施。

一些分析师担心我们可能在过度建设。在中国DeepSeek发布的R1推理模型使用远少于同行的计算资源后,担忧进一步加剧。微软近期取消了与多家数据中心提供商的租约,引发了人们对其AI基础设施需求的重新思考。

然而,《The Register》指出,这种撤资可能更多是因为计划中的数据中心无法满足下一代AI系统的电力和冷却需求。AI模型已经开始挑战当前基础设施的极限。《MIT Technology Review》报道称,中国许多数据中心由于基于过时规格建设而陷入困境甚至失败。

AI推理需要更多FLOPS

推理模型通过称为推理的过程在运行时完成大部分繁重工作。这些模型支持一些最先进且资源密集的应用,如深度研究助手和新兴的代理AI系统。

尽管DeepSeek-R1最初让业界认为未来AI可能需要更少的计算能力,但Nvidia首席执行官黄仁勋强烈反驳了这一观点。在接受CNBC采访时,他表示相反的结论:“这与大家的结论完全相反。”他补充说,推理AI消耗的计算资源是非推理AI的100倍。

随着AI从推理模型发展到自主代理及更远领域,对计算能力的需求可能会再次激增。下一个突破可能出现在AI代理协调、融合模拟或大规模数字孪生等领域——这些都得益于我们刚刚见证的计算飞跃。

几乎与此同时,OpenAI宣布了400亿美元的新融资,这是科技行业有史以来最大的私募融资轮次。他们在博客中表示,这笔资金“使我们能够进一步推动AI研究的边界,扩展我们的计算基础设施,并为每周使用ChatGPT的5亿人提供越来越强大的工具。”

为什么如此多的资本流入AI?原因从竞争力到国家安全不一而足,但一个突出因素是:据麦肯锡估计,AI每年可为企业增加4.4万亿美元的利润。

接下来会怎样?无人知晓

信息系统的核心在于简化复杂性,无论是过去我用Fortran编写的紧急车辆路由系统,用COBOL构建的学生成绩报告工具,还是现代AI系统加速药物发现,目标始终如一:理解世界。

现在,随着强大AI的到来,我们正在跨越一个门槛。人类首次可能拥有足够的计算能力和智能来解决曾经遥不可及的问题。

《纽约时报》专栏作家Kevin Roose很好地捕捉了这一时刻:“每周,我都会遇到致力于AI的工程师和企业家,他们告诉我,变革——巨大的变革、震撼世界的变革、我们从未见过的变革——即将来临。”这还不包括每周涌现的突破。

就在过去几天,我们看到OpenAI的GPT-4o能够从文本生成几乎完美的图像,Google发布了可能是迄今最先进的推理模型Gemini 2.5 Pro,Runway推出了一款具有镜头间角色和场景一致性的视频模型,VentureBeat指出,这一点至今仍是大多数AI视频生成器的难题。

接下来会发生什么,真的无人能预测。我们不知道强大的AI会是突破还是崩溃,会帮助解决核聚变能源问题,还是带来新的生物风险。但随着未来五年越来越多的FLOPS上线,有一点似乎是确定的:创新将快速而有力地到来。随着FLOPS的扩展,我们关于责任、监管和克制的对话也必须同步进行。

Gary Grossman是Edelman技术实践执行副总裁兼Edelman AI卓越中心的全球负责人。

相关文章
两人因计划向中国非法出口人工智能芯片而被起诉 两人因计划向中国非法出口人工智能芯片而被起诉 美国司法部(DOJ)周二宣布,两名中国公民因涉嫌策划向中国非法出口价值数千万美元的高性能人工智能芯片而被捕。据司法部称,耿川(Chuan Geng)和杨世伟(Shiwei Yang)于 8 月 2 日在加利福尼亚州被捕,并面临《出口管制改革法》(Export Control Reform Act)的指控,这是一项重罪,可能被判处 20 年监禁。耿川和杨世伟被指控通过其位于加州的公司 ALX Sol
甲骨文400亿美元英伟达芯片投资助推德克萨斯AI数据中心 甲骨文400亿美元英伟达芯片投资助推德克萨斯AI数据中心 据《金融时报》报道,甲骨文计划投资约400亿美元购买英伟达芯片,为OpenAI在德克萨斯州开发的大型新数据中心提供动力。这是迄今为止最大的芯片收购交易之一,凸显了对AI计算资源激增的需求。该设施位于德克萨斯州阿比林,是美国首个“星门”数据中心。由OpenAI和软银支持,这是构建大规模AI基础设施的更广泛计划的一部分。该德克萨斯中心计划于明年完工,将提供1.2吉瓦的计算能力,使其跻身全球最大数据中心
英伟达的收益:超越出口限制,聚焦新硬件需求 英伟达的收益:超越出口限制,聚焦新硬件需求 英伟达将于周三市场收盘后公布其2026财年第一季度财报,截至4月27日结束。虽然美国芯片出口管制引发了对英伟达全球芯片销售及未来前景的担忧,但一些专家认为,这并非公司即将发布财报的关键焦点。扎克斯投资研究公司高级股票策略师凯文·库克,拥有十年英伟达研究经验,他在接受TechCrunch采访时表示,英伟达自2月起开始发货的GB200 NVL72硬件——一款单机架百亿亿次计算计算机——更值得投资者关注
评论 (4)
0/200
JackMoore
JackMoore 2025-08-27 23:01:28

Mind-blowing speed! Nvidia's exaflop system is a game-changer for AI. Can't wait to see what crazy innovations come next! 🚀

StephenRoberts
StephenRoberts 2025-08-12 17:00:59

Mind-blowing speed! Nvidia’s exaflop system is a game-changer for AI. Can’t wait to see what crazy applications come out of this! 🚀

MarkGonzalez
MarkGonzalez 2025-07-28 09:20:21

Mind blown! An exaflop in a single rack? Nvidia's pushing AI into hyperspace. Can't wait to see what crazy applications come next. 🚀

MatthewHill
MatthewHill 2025-07-22 09:25:03

Mind blown by this exaflop server rack! Nvidia's pushing AI compute to insane levels. Can't wait to see what crazy applications come out of this power. 🚀

返回顶部
OR