選項
首頁
新聞
從 MIPS 到艾弗洛普僅僅數十年:計算能力正在爆炸,將改變 AI

從 MIPS 到艾弗洛普僅僅數十年:計算能力正在爆炸,將改變 AI

2025-06-25
69

在最近的Nvidia GTC大會上,這家科技巨頭展示了突破性成就:首個單機架伺服器系統,能達到每秒十億億次浮點運算(exaflop)。這是由Nvidia最新GB200 NVL72系統驅動,搭載尖端的Blackwell圖形處理單元(GPUs)。為便於理解,此系統僅佔據約6英尺高、3英尺多深、不到2英尺寬的標準機架。

縮小exaflop:從Frontier到Blackwell

這項宣布讓我思考我們在短短几年內的進展。全球首個exaflop電腦“Frontier”於2022年在橡樹嶺國家實驗室安裝,由HPE打造,搭載AMD GPUs和CPUs,佔據74個機架。相比之下,Nvidia新系統將73倍性能濃縮於單一機架,相當於連續三年每年性能翻三倍!這證明了計算密度、能源效率和架構設計的驚人進步。

值得注意的是,兩系統雖都達到exascale里程碑,卻用途不同。Nvidia的exaflop基於低精度數學(4位和8位浮點運算),最適合AI工作負載,如訓練和運行大型語言模型(LLMs),注重速度而非精度。而Frontier的exaflop則來自64位雙精度數學,是科學模擬的黃金標準,精確度至關重要。

進展神速

這樣的進展速度幾乎令人難以置信,尤其是回想我計算生涯早期。我的第一份工作是在DEC KL 1090上編程,那是DEC PDP-10系列分時主機,僅每秒180萬指令(MIPS)。它通過硬線連接到陰極射線管(CRT)顯示器,無圖形顯示,只有文字。當然,那時也沒有互聯網,遠程用戶需通過最高1200比特每秒的調製解調器連線。

DEC系統10;來源:喬·梅布爾,CC BY-SA 3.0。

5000億倍的計算能力

雖然MIPS與FLOPS不可直接比較,但能感受計算能力的驚人飛躍。MIPS測量整數處理速度,適合通用計算和商業應用;FLOPS測量浮點性能,對科學工作負載和現代AI(如訓練機器學習模型所需的矩陣數學和線性代數)至關重要。

以此粗略估計,Nvidia新系統比舊DEC機器強大約5000億倍。這是計算能力在單一職業生涯中呈指數增長的驚人例證。讓人不禁思考:如果40年達成如此成就,未來五年又會如何?

Nvidia在GTC分享了路線圖,預測其基於“Vera Rubin”Ultra架構的下一代全機架系統將提供當前Blackwell Ultra機架14倍的性能,預計未來一兩年內實現14至15 exaflops的AI優化工作。

不僅是原始性能,將如此性能壓縮至單一機架意味著更少空間、更少材料和更低的操作能耗。當然,這些系統的絕對電力需求仍相當巨大。

AI真需要這麼多計算能力嗎?

雖然性能提升令人印象深刻,AI產業正面臨重大問題:我們到底需要多少計算能力,代價如何?興建大型AI數據中心的競賽由exascale計算和日益強大的AI模型需求驅動。

最雄心勃勃的項目是5000億美元的Stargate計畫,計劃在美國建設20個各50萬平方英尺的數據中心。全球還有其他超大規模項目正在進行或籌備,以應對未來AI工作負載的基礎設施需求。

一些分析師擔心可能過度建設。中國DeepSeek的推理模型R1發布後,因其計算需求遠低於同類模型,引發關注。微軟近期取消與多家數據中心供應商的租約,引發對其AI基礎設施需求的重新思考。

然而,《The Register》認為,這種撤退可能與計畫中的數據中心無法滿足下一代AI系統的電力和冷卻需求有關。AI模型已推到當前基礎設施的極限。《MIT科技評論》報導,中國許多數據中心因基於過時規格而難以應對。

AI推理需要更多FLOPS

推理模型在運行時通過推理過程承擔大部分重負,這些模型驅動了一些最先進且資源密集的應用,如深度研究助手和新興的代理AI系統。

雖然DeepSeek-R1一度讓業界認為未來AI可能需要較少計算能力,Nvidia CEO黃仁勳強烈反駁。在CNBC採訪中,他表示相反結論:“每個人都得出完全相反的結論。”他補充,推理AI消耗的計算能力比非推理AI多100倍。

隨著AI從推理模型進化到自主代理,計算需求可能再次激增。下一突破或許在AI代理協調、融合模擬或大規模數位孿生等領域,皆由這樣的計算飛躍實現。

恰如其分,OpenAI宣布400億美元新融資,創下私人科技融資紀錄。他們在博客中表示,這筆資金“使我們能進一步推進AI研究前沿,擴展計算基礎設施,並為每週使用ChatGPT的5億人提供更強大的工具。”

為何如此多資金湧入AI?原因從競爭力到國家安全不一而足,但麥肯錫指出,AI可能每年為企業增加4.4兆美元利潤。

未來如何?無人能料

資訊系統的核心在於簡化複雜性,無論是我曾用Fortran編寫的緊急車輛路由系統、用COBOL打造的學生成績報告工具,還是加速藥物發現的現代AI系統,目標始終一致:理解世界。

如今,隨著強大AI即將問世,我們正跨越門檻。首次,我們可能擁有足夠的計算能力和智能,來解決曾經超乎人類能力範圍的問題。

《紐約時報》專欄作家凱文·盧斯精準捕捉這一刻:“每週,我遇到從事AI的工程師和企業家,他們告訴我,變革——重大變革、撼動世界的變革、前所未有的轉型——即將到來。”這還不包括每週湧現的突破。

過去幾天,OpenAI的GPT-4o幾乎能從文字生成完美圖像,Google發布可能是迄今最先進的推理模型Gemini 2.5 Pro,Runway推出具備逐鏡頭角色和場景一致性的視頻模型,VentureBeat指出,這是大多數AI視頻生成器至今未能實現的。

未來如何,無人能料。我們不知強大AI是突破還是崩潰,是否能解決融合能源問題或引發新生物風險。但隨著未來五年更多FLOPS上線,創新將快速且強勢到來。隨著FLOPS規模擴大,關於責任、監管和克制的對話也必須同步跟進。

蓋瑞·格羅斯曼是Edelman技術實務執行副總裁暨Edelman AI卓越中心全球負責人。

相關文章
兩人因非法向中國出口 AI 晶片而被起訴 兩人因非法向中國出口 AI 晶片而被起訴 美國司法部(DOJ)週二宣佈,兩名中國公民因涉嫌策劃向中國非法出口價值數千萬美元的高性能 AI 晶片而被捕。據司法部表示,耿川和楊世偉於 8 月 2 日在加州被捕,並面臨《出口管制改革法案》(Export Control Reform Act)的指控,此項重罪可判處 20 年徒刑。耿氏和楊氏被控蓄意透過其位於加州的公司 ALX Solutions 向中國出口包括 GPU 在內的「敏感技術」。雖然司
甲骨文40億美元Nvidia晶片投資推動德州AI數據中心 甲骨文40億美元Nvidia晶片投資推動德州AI數據中心 據《金融時報》報導,甲骨文計劃投資約40億美元於Nvidia晶片,為OpenAI在德州開發的大型新數據中心提供動力。這筆交易是迄今為止最大的晶片收購之一,凸顯了對AI運算資源的激增需求。該設施位於德州阿比林,是美國首個「星門」數據中心。由OpenAI和軟銀支持,屬於建設大規模AI基礎設施的更廣泛計劃的一部分。該德州中心預計明年完工,將提供1.2吉瓦的運算能力,位列全球最大之列。甲骨文計劃採購約40
輝達的財報:超越出口限制,聚焦新硬體需求 輝達的財報:超越出口限制,聚焦新硬體需求 輝達將於週三收盤後公布其2026財年第一季度財報,結束於4月27日。雖然美國對晶片出口的管制引發了對輝達全球晶片銷售及未來展望的擔憂,但一些專家認為,這並非公司即將公布的財報之關鍵焦點。在Zacks投資研究擁有十年輝達專業經驗的高級股票策略師凱文·庫克(Kevin Cook)向TechCrunch表示,輝達自2月起開始出貨的GB200 NVL72硬體——一台單機架百億億次計算機——更值得投資者關注
評論 (4)
0/200
JackMoore
JackMoore 2025-08-27 23:01:28

Mind-blowing speed! Nvidia's exaflop system is a game-changer for AI. Can't wait to see what crazy innovations come next! 🚀

StephenRoberts
StephenRoberts 2025-08-12 17:00:59

Mind-blowing speed! Nvidia’s exaflop system is a game-changer for AI. Can’t wait to see what crazy applications come out of this! 🚀

MarkGonzalez
MarkGonzalez 2025-07-28 09:20:21

Mind blown! An exaflop in a single rack? Nvidia's pushing AI into hyperspace. Can't wait to see what crazy applications come next. 🚀

MatthewHill
MatthewHill 2025-07-22 09:25:03

Mind blown by this exaflop server rack! Nvidia's pushing AI compute to insane levels. Can't wait to see what crazy applications come out of this power. 🚀

回到頂部
OR