選項
首頁
消息
從 MIPS 到艾弗洛普僅僅數十年:計算能力正在爆炸,將改變 AI

從 MIPS 到艾弗洛普僅僅數十年:計算能力正在爆炸,將改變 AI

2025-06-25
0

在最近的 Nvidia GTC 大會上,這家科技巨頭揭露了一項突破性成就:首個單機架伺服器系統能達到一艾弗洛普。這是一個令人震驚的每秒十億億次浮點運算(FLOPS)。這項壯舉由 Nvidia 最新的 GB200 NVL72 系統驅動,搭載尖端的 Blackwell 圖形處理單元(GPU)。為了讓大家更直觀理解,這個系統安裝在一個標準電腦機架中,大約 6 英尺高,略超過 3 英尺深,寬度不到 2 英尺。

縮小艾弗洛普:從 Frontier 到 Blackwell

這項宣布讓我思考我們在短短幾年內走了多遠。世界上第一台具備艾弗洛普能力的電腦「Frontier」於 2022 年在橡樹嶺國家實驗室安裝。由 HPE 打造並搭載 AMD GPU 和 CPU,它佔用了巨大的 74 個機架。相比之下,Nvidia 的新系統將 73 倍的性能壓縮到單一機架中。這相當於連續三年每年性能翻三倍!這證明了計算密度、能源效率和架構設計的驚人進步。

值得注意的是,雖然這兩個系統都達到了艾弗洛普里程碑,但它們的設計目的不同。Nvidia 的艾弗洛普評級基於較低精度的數學運算——4 位元和 8 位元浮點運算——非常適合 AI 工作負載,例如訓練和運行大型語言模型(LLM)。這些計算優先速度而非精度。另一方面,Frontier 的艾弗洛普評級來自 64 位元雙精度數學,這是科學模擬中精度至關重要的金標準。

我們走得很遠(非常快)

這種進展的速度幾乎令人難以置信,尤其是當我回想我在計算領域職業生涯的早期。我的第一份工作是在 DEC KL 1090 上作為程式設計師,這是 DEC PDP-10 系列分時主機的一部分。那台機器以每秒 180 萬次指令(MIPS)的速度緩慢運行。它通過硬連線電纜連接到陰極射線管(CRT)顯示器,幾乎沒有圖形可言——只有螢幕上的文字。當然,當時也沒有互聯網。遠端用戶必須通過電話線使用最高速率為每秒 1,200 位的數據機連線。

DEC System 10;來源:Joe Mabel,CC BY-SA 3.0。

5000 億倍的計算能力

雖然將 MIPS 與 FLOPS 直接比較並非完全對等,但它讓我們感受到計算能力的驚人飛躍。MIPS 衡量整數處理速度,適用於通用計算和商業應用。FLOPS 則衡量浮點性能,對科學工作負載和現代 AI 的繁重任務至關重要,例如訓練和運行機器學習(ML)模型所需的矩陣數學和線性代數。

以這些作為粗略參考,Nvidia 的新系統大約比舊的 DEC 機器強大 5000 億倍。這是一個在單一職業生涯中計算能力指數成長的驚人例子。它讓人不禁思考:如果我們在 40 年內取得了這麼多成就,接下來的五年會帶來什麼?

Nvidia 提供了一些線索。在 GTC 上,他們分享了一個路線圖,預測下一代基於「Vera Rubin」Ultra 架構的完整機架系統將提供當前 Blackwell Ultra 機架 14 倍的性能。我們預計在未來一兩年內,AI 優化工作將達到 14 到 15 艾弗洛普。

這不僅僅是關於原始性能。將這種性能壓縮到單一機架意味著更少的物理空間、更少的材料,以及每操作可能更低的能源使用。當然,我們也不能忘記這些系統的絕對電力需求仍然巨大。

AI 真的需要那麼多計算能力嗎?

雖然這些性能提升令人印象深刻,但 AI 產業現在正面臨一個大問題:我們到底需要多少計算能力,代價是什麼?建造大型新 AI 數據中心的競賽受到艾弗洛普級計算和日益強大的 AI 模型需求的驅動。

最雄心勃勃的項目是價值 5000 億美元的 Stargate 計劃,計劃在美國建設 20 個數據中心,每個面積 50 萬平方英尺。全球範圍內還有其他超大規模項目正在進行或計劃中,企業和國家競相為未來的 AI 工作負載建設基礎設施。

一些分析師擔心我們可能正在過度建設。在中國 DeepSeek 發布使用顯著較少計算的推理模型 R1 後,這些擔憂加劇。Microsoft 最近取消了與多家數據中心提供商的租約,引發了他們可能正在重新思考 AI 基礎設施需求的猜測。

然而,《The Register》表示,這種撤退可能更多是因為計劃中的數據中心無法滿足下一代 AI 系統的電力和冷卻需求。AI 模型已經在挑戰當前基礎設施的極限。《MIT Technology Review》報導,中國的許多數據中心因為依據過時規格建造而掙扎並失敗。

AI 推理需要更多 FLOPS

推理模型在運行時通過稱為推理的過程執行大部分繁重工作。這些模型驅動了一些最先進且資源密集的應用,例如深度研究助理和新興的代理型 AI 系統。

雖然 DeepSeek-R1 最初讓業界認為未來的 AI 可能需要更少的計算能力,但 Nvidia 執行長 Jensen Huang 強烈反駁。在接受 CNBC 採訪時,他主張相反的觀點:「這與大家的結論完全相反。」他補充說,推理 AI 消耗的計算能力是非推理 AI 的 100 倍。

隨著 AI 從推理模型發展到自主代理及更進一步,計算能力的需求可能再次激增。下一波突破可能出現在 AI 代理協調、融合模擬或大規模數位雙生等領域——這一切都得益於我們剛剛見證的計算飛躍。

彷彿恰逢其時,OpenAI 宣布了 400 億美元的新融資,這是有史以來最大的私人科技融資輪。在一篇部落格文章中,他們表示這筆資金「使我們能夠進一步推動 AI 研究的邊界,擴展我們的計算基礎設施,並為每週使用 ChatGPT 的 5 億人提供越來越強大的工具。」

為什麼如此多的資本流入 AI?原因從競爭力到國家安全不一而足,但一個因素尤為突出:根據 McKinsey 的說法,AI 可能每年為企業增加 4.4 兆美元的利潤。

接下來會發生什麼?無人能猜

資訊系統的核心在於簡化複雜性,無論是我曾用 Fortran 編寫的緊急車輛路線系統,用 COBOL 構建的學生成就報告工具,還是現代 AI 系統加速藥物發現。目標始終如一:理解世界。

現在,隨著強大 AI 的即將到來,我們正在跨越一個門檻。我們可能首次擁有足夠的計算能力和智慧來解決曾經超出人類能力的問題。

《紐約時報》專欄作家 Kevin Roose 很好地捕捉了這一刻:「每週,我都會遇到從事 AI 工作的工程師和企業家,他們告訴我,改變——巨大的改變、震撼世界的改變、我們從未見過的轉型——即將到來。」這還不包括每週到來的新突破。

就在過去幾天,我們看到 OpenAI 的 GPT-4o 從文字生成近乎完美的圖像,Google 發布了可能是迄今最先進的推理模型 Gemini 2.5 Pro,以及 Runway 推出了一個具有拍攝間角色和場景一致性的視頻模型,據 VentureBeat 報導,這是大多數 AI 視頻生成器至今未能實現的。

接下來會發生什麼,真的無人能猜。我們不知道強大的 AI 會是突破還是崩潰,是否會幫助解決融合能源問題或引發新的生物風險。但隨著未來五年越來越多的 FLOPS 上線,有一件事似乎是肯定的:創新將來得很快——且勢不可擋。隨著 FLOPS 的擴展,我們關於責任、監管和克制的對話也必須同步進行。

Gary Grossman 是 Edelman 技術實務執行副總裁暨 Edelman AI 卓越中心全球負責人。

相關文章
華為スーパーノード384、NVIDIAのAI市場支配を乱す 華為スーパーノード384、NVIDIAのAI市場支配を乱す HuaweiのAI処理アーキテクチャにおける革新:スーパーノード384人工知能の進化する世界の中で、Huaweiはスーパーノード384アーキテクチャを発表し、プロセッサ設計において大きな飛躍を遂げました。この革新は、米中技術摩擦が高まる中での発表であり、困難に直面してもHuaweiの粘り強さと創造力を示しています。この発表は、先週深センで開催されたKunpe
クラウドを活用したNvidiaのヒューマノイドロボティクス進展 クラウドを活用したNvidiaのヒューマノイドロボティクス進展 NVIDIAは人型ロボティクスの領域にフルスロットルで突入しており、その動きにはブレがありません。台湾でのComputex 2025展示会では、ロボティクス開発の地平線を再定義する一連の革新が発表されました。その中でも注目すべきは、NVIDIA Isaac GR00T N1.5です。これは、人型ロボットの推論やスキルに関するオープンで完全にカスタマイズ可能な
WindowsのNvidia AIアシスタントにSpotify、Twitchプラグイン追加 WindowsのNvidia AIアシスタントにSpotify、Twitchプラグイン追加 Nvidiaは、Windows上でG-Assist AIアシスタントを新たな高みへと引き上げています。ゲームやシステム設定の調整だけでなく、昨月PCゲーム体験を向上させるチャットボットとしてリリースされたG-Assistが、今度はプラグインサポートを導入して進化しています。このアップデートにより、AIはその範囲を拡大し、Spotifyの操作やお気に入りのスト
評論 (0)
0/200
回到頂部
OR