lựa chọn
Trang chủ
Tin tức
Từ MIPS đến exaflops chỉ trong vài thập kỷ: Sức mạnh tính toán đang bùng nổ, và nó sẽ biến đổi AI

Từ MIPS đến exaflops chỉ trong vài thập kỷ: Sức mạnh tính toán đang bùng nổ, và nó sẽ biến đổi AI

Ngày 25 tháng 6 năm 2025
0

Tại hội nghị Nvidia GTC gần đây, gã khổng lồ công nghệ đã công bố một thành tựu đột phá: hệ thống máy chủ single-rack đầu tiên có khả năng đạt một exaflop. Đó là một con số đáng kinh ngạc, một tỷ tỷ phép tính dấu phẩy động (FLOPS) mỗi giây. Thành tựu này được cung cấp bởi hệ thống GB200 NVL72 mới nhất của Nvidia, với các đơn vị xử lý đồ họa (GPUs) Blackwell tiên tiến. Để dễ hình dung, hệ thống này nằm gọn trong một giá máy tính tiêu chuẩn cao khoảng 6 feet, sâu hơn 3 feet một chút, và rộng chưa đến 2 feet.

Thu nhỏ một Exaflop: Từ Frontier đến Blackwell

Thông báo này khiến tôi suy nghĩ về việc chúng ta đã tiến xa như thế nào chỉ trong vài năm. Máy tính có khả năng đạt exaflop đầu tiên trên thế giới, "Frontier," được lắp đặt tại Phòng thí nghiệm Quốc gia Oak Ridge vào năm 2022. Được xây dựng bởi HPE và sử dụng GPUs và CPUs của AMD, nó chiếm tới 74 giá máy. Ngược lại, hệ thống mới của Nvidia có hiệu suất gấp 73 lần chỉ trong một giá máy. Tương đương với việc tăng gấp ba hiệu suất mỗi năm trong ba năm liên tiếp! Đây là minh chứng cho những bước tiến vượt bậc trong mật độ tính toán, hiệu quả năng lượng, và thiết kế kiến trúc.

Cũng cần lưu ý rằng mặc dù cả hai hệ thống đều đạt cột mốc exascale, chúng được thiết kế cho các mục đích khác nhau. Định mức exaflop của Nvidia dựa trên phép toán độ chính xác thấp—4-bit và 8-bit—lý tưởng cho các khối lượng công việc AI như huấn luyện và chạy các mô hình ngôn ngữ lớn (LLMs). Những phép tính này ưu tiên tốc độ hơn độ chính xác. Trong khi đó, định mức exaflop của Frontier đến từ phép toán độ chính xác kép 64-bit, tiêu chuẩn vàng cho các mô phỏng khoa học nơi độ chính xác là tối quan trọng.

Chúng ta đã đi một chặng đường dài (rất nhanh)

Tốc độ tiến bộ này gần như khó tin, đặc biệt khi tôi nhớ lại những ngày đầu trong sự nghiệp tính toán của mình. Công việc đầu tiên của tôi là lập trình viên trên DEC KL 1090, thuộc dòng máy tính lớn PDP-10 của DEC. Máy đó hoạt động với tốc độ khiêm tốn 1,8 triệu lệnh mỗi giây (MIPS). Nó kết nối với các màn hình ống tia cathode (CRT) qua cáp cứng, không có đồ họa gì đáng kể—chỉ có văn bản trên màn hình. Và dĩ nhiên, không có Internet. Người dùng từ xa phải kết nối qua đường dây điện thoại với modem tối đa 1.200 bit mỗi giây.

Hệ thống DEC 10; Nguồn: Bởi Joe Mabel, CC BY-SA 3.0.

500 tỷ lần sức mạnh tính toán

Mặc dù so sánh MIPS với FLOPS không phải là so sánh trực tiếp, nhưng nó cho chúng ta cảm nhận về bước nhảy vọt đáng kinh ngạc trong sức mạnh tính toán. MIPS đo tốc độ xử lý số nguyên, phù hợp cho tính toán đa năng và ứng dụng kinh doanh. FLOPS, mặt khác, đo hiệu suất dấu phẩy động, quan trọng cho các khối lượng công việc khoa học và công việc nặng đằng sau AI hiện đại, như toán ma trận và đại số tuyến tính cần để huấn luyện và chạy các mô hình học máy (ML).

Dùng các chỉ số này làm hướng dẫn sơ bộ, hệ thống mới của Nvidia mạnh hơn khoảng 500 tỷ lần so với máy DEC cũ. Đây là một ví dụ ấn tượng về sự tăng trưởng theo cấp số nhân của sức mạnh tính toán trong một sự nghiệp. Nó khiến bạn tự hỏi: Nếu chúng ta đã đạt được nhiều như vậy trong 40 năm, 5 năm tới sẽ mang lại điều gì?

Nvidia đã đưa ra một số gợi ý. Tại GTC, họ chia sẻ lộ trình dự đoán rằng hệ thống full-rack thế hệ tiếp theo, dựa trên kiến trúc "Vera Rubin" Ultra, sẽ mang lại hiệu suất gấp 14 lần so với giá Blackwell Ultra hiện tại. Chúng ta đang nói về khoảng 14 đến 15 exaflops cho công việc tối ưu hóa AI trong một hoặc hai năm tới.

Không chỉ là sức mạnh thô. Việc nén hiệu suất này vào một giá máy duy nhất đồng nghĩa với ít không gian vật lý hơn, ít vật liệu hơn, và có khả năng tiêu thụ năng lượng thấp hơn cho mỗi phép tính. Tuy nhiên, đừng quên rằng nhu cầu năng lượng tuyệt đối của các hệ thống này vẫn rất lớn.

AI có thực sự cần tất cả sức mạnh tính toán đó không?

Mặc dù những cải tiến về hiệu suất này rất ấn tượng, ngành AI hiện đang đối mặt với một câu hỏi lớn: Chúng ta thực sự cần bao nhiêu sức mạnh tính toán, và với chi phí nào? Cuộc đua xây dựng các trung tâm dữ liệu AI khổng lồ mới được thúc đẩy bởi nhu cầu tính toán exascale và các mô hình AI ngày càng mạnh mẽ.

Dự án tham vọng nhất là Dự án Stargate trị giá 500 tỷ USD, với kế hoạch xây dựng 20 trung tâm dữ liệu trên khắp Hoa Kỳ, mỗi trung tâm rộng nửa triệu feet vuông. Có một làn sóng các dự án siêu quy mô khác đang được tiến hành hoặc lên kế hoạch trên khắp thế giới khi các công ty và quốc gia chạy đua xây dựng hạ tầng cho các khối lượng công việc AI tương lai.

Một số nhà phân tích lo ngại rằng chúng ta có thể đang xây dựng quá mức. Nỗi lo tăng lên sau khi ra mắt R1, một mô hình suy luận từ DeepSeek của Trung Quốc, sử dụng ít sức mạnh tính toán hơn đáng kể so với các đối thủ. Việc Microsoft gần đây hủy bỏ hợp đồng thuê với nhiều nhà cung cấp trung tâm dữ liệu đã làm dấy lên suy đoán rằng họ có thể đang đánh giá lại nhu cầu hạ tầng AI của mình.

Tuy nhiên, The Register cho rằng việc rút lui này có thể liên quan nhiều hơn đến việc các trung tâm dữ liệu được lên kế hoạch không thể đáp ứng nhu cầu điện và làm mát của các hệ thống AI thế hệ mới. Các mô hình AI đã đang đẩy giới hạn của hạ tầng hiện tại. MIT Technology Review báo cáo rằng nhiều trung tâm dữ liệu ở Trung Quốc đang gặp khó khăn và thất bại vì được xây dựng theo các thông số kỹ thuật lỗi thời.

Suy luận AI đòi hỏi nhiều FLOPS hơn

Các mô hình suy luận thực hiện phần lớn công việc nặng nhọc trong thời gian thực thông qua một quá trình gọi là suy luận. Những mô hình này cung cấp năng lượng cho một số ứng dụng tiên tiến và tốn tài nguyên nhất, như trợ lý nghiên cứu sâu và làn sóng mới của các hệ thống AI tự hành.

Mặc dù DeepSeek-R1 ban đầu khiến ngành công nghiệp nghĩ rằng AI tương lai có thể cần ít sức mạnh tính toán hơn, CEO Nvidia Jensen Huang đã phản bác mạnh mẽ. Trong một cuộc phỏng vấn với CNBC, ông lập luận ngược lại: "Đó là kết luận hoàn toàn trái ngược với suy nghĩ của mọi người." Ông nói thêm rằng AI suy luận tiêu thụ sức mạnh tính toán gấp 100 lần so với AI không suy luận.

Khi AI tiến hóa từ các mô hình suy luận đến các tác nhân tự hành và hơn thế nữa, nhu cầu về sức mạnh tính toán có khả năng sẽ tăng vọt trở lại. Những đột phá tiếp theo có thể đến từ các lĩnh vực như phối hợp tác nhân AI, mô phỏng năng lượng tổng hợp, hoặc các mô hình số quy mô lớn—tất cả đều được kích hoạt bởi bước nhảy vọt về tính toán mà chúng ta vừa chứng kiến.

Đúng như dự đoán, OpenAI đã công bố khoản tài trợ mới trị giá 40 tỷ USD, vòng gọi vốn tư nhân lớn nhất trong lịch sử công nghệ. Trong một bài đăng trên blog, họ cho biết khoản tài trợ này "cho phép chúng tôi đẩy nhanh hơn nữa ranh giới nghiên cứu AI, mở rộng quy mô hạ tầng tính toán và mang lại các công cụ ngày càng mạnh mẽ hơn cho 500 triệu người dùng ChatGPT mỗi tuần."

Tại sao có nhiều vốn khổng lồ đổ vào AI? Lý do trải dài từ tính cạnh tranh đến lợi nhuận, nhưng một yếu tố nổi bật: Theo McKinsey, AI có thể tăng lợi nhuận doanh nghiệp lên 4,4 nghìn tỷ mỗi năm.

Điều gì tiếp theo? Không ai đoán được

Về cốt lõi, các hệ thống thông tin là về việc đơn giản hóa sự phức tạp, dù là hệ thống định tuyến xe khẩn cấp mà tôi từng viết bằng Fortran, một công cụ báo cáo thành tích học sinh được xây dựng bằng xAI, hay các hệ thống AI hiện đại thúc đẩy phát triển thuốc mới.

Bây giờ, với AI mạnh mẽ trong tầm tay, chúng ta đang vượt qua một ngưỡng mới. Lần đầu tiên, chúng ta có thể có đủ sức mạnh tính toán và trí tuệ để giải quyết những vấn đề từng vượt quá tầm tay con người.

Cột nhà báo Kevin Roose của New York Times đã nắm bắt khoảnh khắc này rất tốt: "Hàng tuần, tôi gặp các kỹ sư và doanh nghiệp làm việc trên AI nói với tôi rằng sự thay đổi—sự thay đổi lớn, thay đổi thế giới, loại biến đổi mà chúng ta chưa từng thấy trước đây—đang ở ngay trước mắt." Và đó thậm chí chưa kể đến những đột phá xuất hiện mỗi tuần.

Chỉ trong vài ngày qua, chúng ta đã thấy GPT-4o của OpenAI tạo ra hình ảnh gần như hoàn hảo từ văn bản, Google phát hành mô hình suy luận có thể là tiên tiến nhất từ trước đến nay trong Gemini 2.5, với Runway tiết lộ một mô hình video có tính nhất quán nhân vật và cảnh quay, điều mà VentureBeat lưu ý là đã vượt qua hầu hết các trình tạo video AI cho đến nay.

Điều gì sẽ đến tiếp theo thực sự là bất kỳ ai đoán của ai. Chúng ta không biết liệu AI mạnh mẽ sẽ là một đột phá hay một sự sụp đổ, liệu nó sẽ giúp giải quyết năng lượng tổng hợp hay mở ra những rủi ro sinh học mới. Nhưng với ngày càng nhiều FLOPS được đưa vào hoạt động trong 5 năm tới, một điều dường như chắc chắn: Đổi mới sẽ đến nhanh—và với sức mạnh. Khi FLOPS tăng quy mô, các cuộc trò chuyện của chúng ta về trách nhiệm, quy định và kiềm chế cũng phải vậy.

Gary Grossman là EVP của thực hành công nghệ tại Edelman và lãnh đạo toàn cầu của Trung tâm Xuất sắc AI của Edelman.

Bài viết liên quan
華為スーパーノード384、NVIDIAのAI市場支配を乱す 華為スーパーノード384、NVIDIAのAI市場支配を乱す HuaweiのAI処理アーキテクチャにおける革新:スーパーノード384人工知能の進化する世界の中で、Huaweiはスーパーノード384アーキテクチャを発表し、プロセッサ設計において大きな飛躍を遂げました。この革新は、米中技術摩擦が高まる中での発表であり、困難に直面してもHuaweiの粘り強さと創造力を示しています。この発表は、先週深センで開催されたKunpe
クラウドを活用したNvidiaのヒューマノイドロボティクス進展 クラウドを活用したNvidiaのヒューマノイドロボティクス進展 NVIDIAは人型ロボティクスの領域にフルスロットルで突入しており、その動きにはブレがありません。台湾でのComputex 2025展示会では、ロボティクス開発の地平線を再定義する一連の革新が発表されました。その中でも注目すべきは、NVIDIA Isaac GR00T N1.5です。これは、人型ロボットの推論やスキルに関するオープンで完全にカスタマイズ可能な
WindowsのNvidia AIアシスタントにSpotify、Twitchプラグイン追加 WindowsのNvidia AIアシスタントにSpotify、Twitchプラグイン追加 Nvidiaは、Windows上でG-Assist AIアシスタントを新たな高みへと引き上げています。ゲームやシステム設定の調整だけでなく、昨月PCゲーム体験を向上させるチャットボットとしてリリースされたG-Assistが、今度はプラグインサポートを導入して進化しています。このアップデートにより、AIはその範囲を拡大し、Spotifyの操作やお気に入りのスト
Nhận xét (0)
0/200
Quay lại đầu
OR