選項
首頁
新聞
從 MIPS 到艾弗洛普僅僅數十年:計算能力正在爆炸,將改變 AI

從 MIPS 到艾弗洛普僅僅數十年:計算能力正在爆炸,將改變 AI

2025-06-25
30

在最近的 Nvidia GTC 大會上,這家科技巨頭揭露了一項突破性成就:首個單機架伺服器系統能達到一艾弗洛普。這是一個令人震驚的每秒十億億次浮點運算(FLOPS)。這項壯舉由 Nvidia 最新的 GB200 NVL72 系統驅動,搭載尖端的 Blackwell 圖形處理單元(GPU)。為了讓大家更直觀理解,這個系統安裝在一個標準電腦機架中,大約 6 英尺高,略超過 3 英尺深,寬度不到 2 英尺。

縮小艾弗洛普:從 Frontier 到 Blackwell

這項宣布讓我思考我們在短短幾年內走了多遠。世界上第一台具備艾弗洛普能力的電腦「Frontier」於 2022 年在橡樹嶺國家實驗室安裝。由 HPE 打造並搭載 AMD GPU 和 CPU,它佔用了巨大的 74 個機架。相比之下,Nvidia 的新系統將 73 倍的性能壓縮到單一機架中。這相當於連續三年每年性能翻三倍!這證明了計算密度、能源效率和架構設計的驚人進步。

值得注意的是,雖然這兩個系統都達到了艾弗洛普里程碑,但它們的設計目的不同。Nvidia 的艾弗洛普評級基於較低精度的數學運算——4 位元和 8 位元浮點運算——非常適合 AI 工作負載,例如訓練和運行大型語言模型(LLM)。這些計算優先速度而非精度。另一方面,Frontier 的艾弗洛普評級來自 64 位元雙精度數學,這是科學模擬中精度至關重要的金標準。

我們走得很遠(非常快)

這種進展的速度幾乎令人難以置信,尤其是當我回想我在計算領域職業生涯的早期。我的第一份工作是在 DEC KL 1090 上作為程式設計師,這是 DEC PDP-10 系列分時主機的一部分。那台機器以每秒 180 萬次指令(MIPS)的速度緩慢運行。它通過硬連線電纜連接到陰極射線管(CRT)顯示器,幾乎沒有圖形可言——只有螢幕上的文字。當然,當時也沒有互聯網。遠端用戶必須通過電話線使用最高速率為每秒 1,200 位的數據機連線。

DEC System 10;來源:Joe Mabel,CC BY-SA 3.0。

5000 億倍的計算能力

雖然將 MIPS 與 FLOPS 直接比較並非完全對等,但它讓我們感受到計算能力的驚人飛躍。MIPS 衡量整數處理速度,適用於通用計算和商業應用。FLOPS 則衡量浮點性能,對科學工作負載和現代 AI 的繁重任務至關重要,例如訓練和運行機器學習(ML)模型所需的矩陣數學和線性代數。

以這些作為粗略參考,Nvidia 的新系統大約比舊的 DEC 機器強大 5000 億倍。這是一個在單一職業生涯中計算能力指數成長的驚人例子。它讓人不禁思考:如果我們在 40 年內取得了這麼多成就,接下來的五年會帶來什麼?

Nvidia 提供了一些線索。在 GTC 上,他們分享了一個路線圖,預測下一代基於「Vera Rubin」Ultra 架構的完整機架系統將提供當前 Blackwell Ultra 機架 14 倍的性能。我們預計在未來一兩年內,AI 優化工作將達到 14 到 15 艾弗洛普。

這不僅僅是關於原始性能。將這種性能壓縮到單一機架意味著更少的物理空間、更少的材料,以及每操作可能更低的能源使用。當然,我們也不能忘記這些系統的絕對電力需求仍然巨大。

AI 真的需要那麼多計算能力嗎?

雖然這些性能提升令人印象深刻,但 AI 產業現在正面臨一個大問題:我們到底需要多少計算能力,代價是什麼?建造大型新 AI 數據中心的競賽受到艾弗洛普級計算和日益強大的 AI 模型需求的驅動。

最雄心勃勃的項目是價值 5000 億美元的 Stargate 計劃,計劃在美國建設 20 個數據中心,每個面積 50 萬平方英尺。全球範圍內還有其他超大規模項目正在進行或計劃中,企業和國家競相為未來的 AI 工作負載建設基礎設施。

一些分析師擔心我們可能正在過度建設。在中國 DeepSeek 發布使用顯著較少計算的推理模型 R1 後,這些擔憂加劇。Microsoft 最近取消了與多家數據中心提供商的租約,引發了他們可能正在重新思考 AI 基礎設施需求的猜測。

然而,《The Register》表示,這種撤退可能更多是因為計劃中的數據中心無法滿足下一代 AI 系統的電力和冷卻需求。AI 模型已經在挑戰當前基礎設施的極限。《MIT Technology Review》報導,中國的許多數據中心因為依據過時規格建造而掙扎並失敗。

AI 推理需要更多 FLOPS

推理模型在運行時通過稱為推理的過程執行大部分繁重工作。這些模型驅動了一些最先進且資源密集的應用,例如深度研究助理和新興的代理型 AI 系統。

雖然 DeepSeek-R1 最初讓業界認為未來的 AI 可能需要更少的計算能力,但 Nvidia 執行長 Jensen Huang 強烈反駁。在接受 CNBC 採訪時,他主張相反的觀點:「這與大家的結論完全相反。」他補充說,推理 AI 消耗的計算能力是非推理 AI 的 100 倍。

隨著 AI 從推理模型發展到自主代理及更進一步,計算能力的需求可能再次激增。下一波突破可能出現在 AI 代理協調、融合模擬或大規模數位雙生等領域——這一切都得益於我們剛剛見證的計算飛躍。

彷彿恰逢其時,OpenAI 宣布了 400 億美元的新融資,這是有史以來最大的私人科技融資輪。在一篇部落格文章中,他們表示這筆資金「使我們能夠進一步推動 AI 研究的邊界,擴展我們的計算基礎設施,並為每週使用 ChatGPT 的 5 億人提供越來越強大的工具。」

為什麼如此多的資本流入 AI?原因從競爭力到國家安全不一而足,但一個因素尤為突出:根據 McKinsey 的說法,AI 可能每年為企業增加 4.4 兆美元的利潤。

接下來會發生什麼?無人能猜

資訊系統的核心在於簡化複雜性,無論是我曾用 Fortran 編寫的緊急車輛路線系統,用 COBOL 構建的學生成就報告工具,還是現代 AI 系統加速藥物發現。目標始終如一:理解世界。

現在,隨著強大 AI 的即將到來,我們正在跨越一個門檻。我們可能首次擁有足夠的計算能力和智慧來解決曾經超出人類能力的問題。

《紐約時報》專欄作家 Kevin Roose 很好地捕捉了這一刻:「每週,我都會遇到從事 AI 工作的工程師和企業家,他們告訴我,改變——巨大的改變、震撼世界的改變、我們從未見過的轉型——即將到來。」這還不包括每週到來的新突破。

就在過去幾天,我們看到 OpenAI 的 GPT-4o 從文字生成近乎完美的圖像,Google 發布了可能是迄今最先進的推理模型 Gemini 2.5 Pro,以及 Runway 推出了一個具有拍攝間角色和場景一致性的視頻模型,據 VentureBeat 報導,這是大多數 AI 視頻生成器至今未能實現的。

接下來會發生什麼,真的無人能猜。我們不知道強大的 AI 會是突破還是崩潰,是否會幫助解決融合能源問題或引發新的生物風險。但隨著未來五年越來越多的 FLOPS 上線,有一件事似乎是肯定的:創新將來得很快——且勢不可擋。隨著 FLOPS 的擴展,我們關於責任、監管和克制的對話也必須同步進行。

Gary Grossman 是 Edelman 技術實務執行副總裁暨 Edelman AI 卓越中心全球負責人。

相關文章
新研究揭示大規模語言模型實際記憶的數據量 新研究揭示大規模語言模型實際記憶的數據量 AI模型實際記憶多少?新研究揭示驚人見解我們都知道,像ChatGPT、Claude和Gemini這樣的大規模語言模型(LLMs)是在龐大數據集上訓練的——來自書籍、網站、程式碼,甚至圖像和音頻等多媒體的數兆字詞。但這些數據到底發生了什麼?這些模型真的理解語言,還是僅僅在重複記憶的片段?來自Meta、Google DeepMind、Cornell和NVIDIA的一項突破性新研究終於給出了具體答案——
NVIDIA提供AI工廠數位雙生藍圖 NVIDIA提供AI工廠數位雙生藍圖 NVIDIA揭曉AI工廠數位雙生藍圖重大擴展在2025年台北Computex的重大宣布中,NVIDIA大幅擴展了其AI工廠數位雙生藍圖的範圍,現 Facetune with AI工廠數位雙生的需求激增,推動了數位基礎設施的可能邊界。新合作夥伴推動AI工廠生態系統藍圖已通過與AI工廠電力、冷卻和網路生態系統的新合作得到增強。Delta Electronics、Jacobs和Siemens等行業巨頭與
華為超節點384打亂英偉達AI市場壟斷 華為超節點384打亂英偉達AI市場壟斷 華為在人工智慧處理架構上的突破:超節點384在人工智慧不斷發展的背景下,華為憑藉其超節點384架構在處理器設計上取得了巨大的進步。這一突破發生在中美科技緊張局勢升級的情況下,展現了華為在逆境中的韌性和創意。該發佈會於上周在深圳舉行的鯤鵬昇騰開發者大會上進行。在會議期間,公司領導展示了超節點384如何直接挑戰Nvidia在人工智慧處理器市場上的長期主導地位。在
評論 (2)
0/200
MarkGonzalez
MarkGonzalez 2025-07-28 09:20:21

Mind blown! An exaflop in a single rack? Nvidia's pushing AI into hyperspace. Can't wait to see what crazy applications come next. 🚀

MatthewHill
MatthewHill 2025-07-22 09:25:03

Mind blown by this exaflop server rack! Nvidia's pushing AI compute to insane levels. Can't wait to see what crazy applications come out of this power. 🚀

回到頂部
OR