Nvidia tiến bước trong robot hình người nhờ hỗ trợ đám mây
NVIDIA đang lao vào lĩnh vực robot hình nhân với tốc độ tối đa và họ không hề e dè. Tại Triển lãm Computex 2025 ở Đài Loan, họ đã công bố loạt đổi mới có khả năng định hình lại bức tranh phát triển của ngành robot. Trong số đó, ngôi sao của buổi triển lãm là NVIDIA Isaac GR00T N1.5, phiên bản mới nhất của nền tảng mô hình mở, có thể tùy chỉnh hoàn toàn của NVIDIA cho lý trí và kỹ năng của robot hình nhân. Cùng với đó, NVIDIA giới thiệu Isaac GR00T-Dreams, một bản thiết kế được thiết kế để tạo dữ liệu động giả, và hệ thống mạnh mẽ NVIDIA Blackwell, có khả năng đẩy nhanh quá trình phát triển của robot hình nhân.
Nhiều nhà phát triển robot hình nhân hàng đầu, bao gồm Agility Robotics, Boston Dynamics, Fourier, Foxlink, Galbot, Mentee Robotics, NEURA Robotics, General Robotics, Skild AI và XPENG Robotics, đã tham gia vào hành trình này, tận dụng nền tảng công nghệ Isaac của NVIDIA để khai phá giới hạn của robot hình nhân.
CEO của NVIDIA, Jensen Huang, không giấu nổi sự phấn khích khi nói rằng, "AI vật lý và robot sẽ mang lại cuộc cách mạng công nghiệp tiếp theo. Từ trí tuệ nhân tạo cho robot đến thế giới mô phỏng để luyện tập, hoặc máy tính siêu thông minh AI để đào tạo mô hình cơ sở, NVIDIA cung cấp các khối xây dựng cho từng giai đoạn của hành trình phát triển robot."
Bản thiết kế mới Isaac GR00T tạo dữ liệu đóng khoảng cách dữ liệu
Bạn đã từng nghĩ về việc sở hữu một robot hình nhân của riêng mình chưa? Trong bài phát biểu chính tại Computex, Huang đã trưng bày NVIDIA Isaac GR00T-Dreams, một bản thiết kế đột phá có khả năng tạo ra lượng lớn dữ liệu động giả, hay còn gọi là轨迹 thần kinh. Đây là kho báu đối với các nhà phát triển AI vật lý, giúp họ dạy cho robot hàng loạt hành vi mới và cách thích nghi với môi trường thay đổi liên tục.
Quy trình bắt đầu với việc các nhà phát triển tiền huấn luyện mô hình cơ sở Cosmos (WFMs) cho robot của họ. Sau đó, chỉ với một hình ảnh làm đầu vào, GR00T-Dreams tạo ra các video về robot thực hiện các nhiệm vụ mới trong các bối cảnh mới. Nó sau đó trích xuất các token hành động – những mẩu dữ liệu nhỏ dễ tiêu hóa mà robot dùng để học các nhiệm vụ mới này.
GR00T-Dreams hoạt động song song với bản thiết kế Isaac GR00T-Mimic, được giới thiệu trước đó tại hội nghị NVIDIA GTC vào tháng Ba. Trong khi GR00T-Mimic tận dụng NVIDIA Omniverse và NVIDIA Cosmos để tăng cường dữ liệu hiện có, GR00T-Dreams sử dụng Cosmos để tạo ra hoàn toàn dữ liệu từ đầu.
Jim Fan, giám đốc AI của NVIDIA và nhà khoa học nổi tiếng, chia sẻ sự hào hứng trong một buổi họp báo, "NVIDIA có chiến lược robot rất mạnh mẽ, xoay quanh cái mà Jensen gọi là 'ba vấn đề máy tính'. Ông giải thích rằng máy tính OVX xử lý mô phỏng và các engine đồ họa vật lý, tạo ra dữ liệu mà máy tính DGX sau đó dùng để đào tạo mô hình cơ sở. Dữ liệu này sau đó được triển khai lên máy tính HX, chạy chương trình trên biên cho các nền tảng như robot hình nhân."
Fan tự hào gọi Gr00t là chu kỳ sống của AI vật lý và các quy trình làm việc dựa trên robot, nhấn mạnh rằng "đây là hiện thân của ba vấn đề máy tính." Ông nhấn mạnh hai bước tiến lớn trong Dự án Gr00t: Gr00t Dreams và Gr00t N1.5, hài hước thêm rằng ông rất tự hào về những cái tên này.
Về Gr00t Dreams, Fan mô tả nó là một mô hình tạo video để đào tạo robot. Ông trưng bày nhiều video, tất cả đều được tạo bởi NVIDIA Cosmos, giải thích rằng "chúng tôi đã tìm ra cách áp dụng mô hình tạo video tiên tiến như Cosmos để giúp robot hình nhân. Về cơ bản, cách thức hoạt động là chúng tôi hiệu chỉnh Cosmos trên video robot từ phòng thí nghiệm của chúng tôi, do đó mô hình video này bây giờ đã được tùy chỉnh cho robot của chúng tôi. Sau đó, chúng ta có thể sử dụng mô hình đã hiệu chỉnh này để tạo, nguyên lý, vô số video giấc mơ bằng cách gợi ý mô hình theo các cách khác nhau. Và giờ đây, điều đó trở thành dữ liệu giả để bổ sung bộ dữ liệu thực tế của robot. Như nhiều người trong số các bạn có thể biết, thu thập dữ liệu trên robot thực rất mất thời gian và tốn kém vì bạn bị giới hạn bởi 24 giờ mỗi ngày cho mỗi robot, đúng không? Đây là hệ thống vật lý, nhưng với Gr00t Dreams, quy trình mới này, bộ thuật toán mới, giờ đây chúng ta có thể phá vỡ giới hạn vật lý cơ bản này và nhân đôi dữ liệu ở quy mô chưa từng có."
Kết quả? Các robot có thể cầm nắm các vật thể chính xác, bất kể đó là dưa chuột, đổ nước cam, hay mở laptop. Đây là hành động mà robot chưa từng được huấn luyện, Fan lưu ý, nhưng nhờ huấn luyện với mô hình video, robot có thể "hiểu về vật lý và ý nghĩa của các động từ" và học cách thực hiện chúng.
Các mô hình Isaac GR00T mới thúc đẩy sự phát triển của robot hình nhân
Bản thiết kế Isaac GR00T-Dreams của NVIDIA không chỉ là lời nói suông; nó đã được áp dụng để tạo dữ liệu huấn luyện giả, phát triển GR00T N1.5 chỉ trong 36 giờ – một nhiệm vụ sẽ mất gần ba tháng nếu không có bản thiết kế này. GR00T N1.5 hiện có thể thích nghi tốt hơn với các môi trường mới và cấu hình không gian làm việc, cũng như nhận diện các vật thể qua hướng dẫn của người dùng. Cập nhật này đáng kể nâng cao tỷ lệ thành công của mô hình đối với các tác vụ phổ biến như sắp xếp hoặc đặt vật, và nó đã sẵn sàng được triển khai trên Jetson Thor, sẽ ra mắt vào cuối năm nay.
Mô hình cơ sở GR00T N1.5 tích hợp Gr00t Dreams vào pipeline tạo dữ liệu giả của nó. NVIDIA đã nâng cấp phần xương sống ngôn ngữ thị giác, đảm bảo rằng GR00T N1.5 sẽ có khả năng thích ứng vượt trội và tuân thủ tốt hơn với các hướng dẫn ngôn ngữ, theo Fan.
GR00T N1.5 sẽ ra mắt tại Computex và sẽ được phát hành dưới dạng mã nguồn mở vào ngày 9 tháng 6. Còn về Gr00t Dreams, NVIDIA vẫn đang tinh chỉnh lịch trình nhưng mục tiêu là mở mã nguồn càng nhiều càng tốt, Fan thêm.
Người dùng sớm của GR00T N bao gồm AeiRobot, Foxlink, Lightwheel và NEURA Robotics. AeiRobot đang sử dụng mô hình này để cho phép ALICE4 hiểu các hướng dẫn ngôn ngữ tự nhiên và thực hiện các quy trình lấy và đặt phức tạp trong các môi trường công nghiệp. Foxlink Group đang sử dụng nó để cải thiện sự linh hoạt và hiệu quả của các cánh tay robot công nghiệp, trong khi Lightwheel đang kiểm chứng dữ liệu giả để triển khai robot hình nhân nhanh hơn trong các nhà máy. NEURA Robotics đang khám phá mô hình này để đẩy nhanh việc phát triển tự động hóa gia đình.
Các khung công cụ mô phỏng và tạo dữ liệu mới tăng tốc các pipeline huấn luyện
Việc tạo ra các robot hình nhân có kỹ năng cao không chỉ phụ thuộc vào phần cứng; nó còn đòi hỏi việc cung cấp cho chúng một lượng lớn dữ liệu đa dạng, có thể rất tốn kém và mất thời gian để thu thập và xử lý. Hơn nữa, thử nghiệm robot trong thế giới thực đi kèm với những thách thức và rủi ro riêng.
Để lấp đầy những khoảng trống này, NVIDIA đã giới thiệu một số công nghệ mô phỏng:
- NVIDIA Cosmos Reason, một WFM mới sử dụng suy luận chuỗi tư duy để giúp tạo dữ liệu tổng hợp chính xác và chất lượng cao cho việc đào tạo mô hình AI vật lý, hiện có sẵn trên Hugging Face.
Bài viết liên quan
華為超節點384打亂英偉達AI市場壟斷
華為在人工智慧處理架構上的突破:超節點384在人工智慧不斷發展的背景下,華為憑藉其超節點384架構在處理器設計上取得了巨大的進步。這一突破發生在中美科技緊張局勢升級的情況下,展現了華為在逆境中的韌性和創意。該發佈會於上周在深圳舉行的鯤鵬昇騰開發者大會上進行。在會議期間,公司領導展示了超節點384如何直接挑戰Nvidia在人工智慧處理器市場上的長期主導地位。在
Nvidia AI助手在Windows上新增Spotify、Twitch插件
Nvidia 將其 G-Assist AI 助理在 Windows 上提升到新的高度,不再僅限於調整遊戲和系統設置。上個月初次推出的 G-Assist 最初是一個旨在增強 PC 遊戲體驗的聊天機器人,現在則隨著插件支援的加入而進化。這次更新讓 AI 能夠擴展其功能範圍,讓你能夠控制 Spotify,檢查你喜愛的實況主是否在 Twitch 上直播,甚至監控股票
Nhận xét (0)
0/200
NVIDIA đang lao vào lĩnh vực robot hình nhân với tốc độ tối đa và họ không hề e dè. Tại Triển lãm Computex 2025 ở Đài Loan, họ đã công bố loạt đổi mới có khả năng định hình lại bức tranh phát triển của ngành robot. Trong số đó, ngôi sao của buổi triển lãm là NVIDIA Isaac GR00T N1.5, phiên bản mới nhất của nền tảng mô hình mở, có thể tùy chỉnh hoàn toàn của NVIDIA cho lý trí và kỹ năng của robot hình nhân. Cùng với đó, NVIDIA giới thiệu Isaac GR00T-Dreams, một bản thiết kế được thiết kế để tạo dữ liệu động giả, và hệ thống mạnh mẽ NVIDIA Blackwell, có khả năng đẩy nhanh quá trình phát triển của robot hình nhân.
Nhiều nhà phát triển robot hình nhân hàng đầu, bao gồm Agility Robotics, Boston Dynamics, Fourier, Foxlink, Galbot, Mentee Robotics, NEURA Robotics, General Robotics, Skild AI và XPENG Robotics, đã tham gia vào hành trình này, tận dụng nền tảng công nghệ Isaac của NVIDIA để khai phá giới hạn của robot hình nhân.
CEO của NVIDIA, Jensen Huang, không giấu nổi sự phấn khích khi nói rằng, "AI vật lý và robot sẽ mang lại cuộc cách mạng công nghiệp tiếp theo. Từ trí tuệ nhân tạo cho robot đến thế giới mô phỏng để luyện tập, hoặc máy tính siêu thông minh AI để đào tạo mô hình cơ sở, NVIDIA cung cấp các khối xây dựng cho từng giai đoạn của hành trình phát triển robot."
Bản thiết kế mới Isaac GR00T tạo dữ liệu đóng khoảng cách dữ liệu
Bạn đã từng nghĩ về việc sở hữu một robot hình nhân của riêng mình chưa? Trong bài phát biểu chính tại Computex, Huang đã trưng bày NVIDIA Isaac GR00T-Dreams, một bản thiết kế đột phá có khả năng tạo ra lượng lớn dữ liệu động giả, hay còn gọi là轨迹 thần kinh. Đây là kho báu đối với các nhà phát triển AI vật lý, giúp họ dạy cho robot hàng loạt hành vi mới và cách thích nghi với môi trường thay đổi liên tục.
Quy trình bắt đầu với việc các nhà phát triển tiền huấn luyện mô hình cơ sở Cosmos (WFMs) cho robot của họ. Sau đó, chỉ với một hình ảnh làm đầu vào, GR00T-Dreams tạo ra các video về robot thực hiện các nhiệm vụ mới trong các bối cảnh mới. Nó sau đó trích xuất các token hành động – những mẩu dữ liệu nhỏ dễ tiêu hóa mà robot dùng để học các nhiệm vụ mới này.
GR00T-Dreams hoạt động song song với bản thiết kế Isaac GR00T-Mimic, được giới thiệu trước đó tại hội nghị NVIDIA GTC vào tháng Ba. Trong khi GR00T-Mimic tận dụng NVIDIA Omniverse và NVIDIA Cosmos để tăng cường dữ liệu hiện có, GR00T-Dreams sử dụng Cosmos để tạo ra hoàn toàn dữ liệu từ đầu.
Jim Fan, giám đốc AI của NVIDIA và nhà khoa học nổi tiếng, chia sẻ sự hào hứng trong một buổi họp báo, "NVIDIA có chiến lược robot rất mạnh mẽ, xoay quanh cái mà Jensen gọi là 'ba vấn đề máy tính'. Ông giải thích rằng máy tính OVX xử lý mô phỏng và các engine đồ họa vật lý, tạo ra dữ liệu mà máy tính DGX sau đó dùng để đào tạo mô hình cơ sở. Dữ liệu này sau đó được triển khai lên máy tính HX, chạy chương trình trên biên cho các nền tảng như robot hình nhân."
Fan tự hào gọi Gr00t là chu kỳ sống của AI vật lý và các quy trình làm việc dựa trên robot, nhấn mạnh rằng "đây là hiện thân của ba vấn đề máy tính." Ông nhấn mạnh hai bước tiến lớn trong Dự án Gr00t: Gr00t Dreams và Gr00t N1.5, hài hước thêm rằng ông rất tự hào về những cái tên này.
Về Gr00t Dreams, Fan mô tả nó là một mô hình tạo video để đào tạo robot. Ông trưng bày nhiều video, tất cả đều được tạo bởi NVIDIA Cosmos, giải thích rằng "chúng tôi đã tìm ra cách áp dụng mô hình tạo video tiên tiến như Cosmos để giúp robot hình nhân. Về cơ bản, cách thức hoạt động là chúng tôi hiệu chỉnh Cosmos trên video robot từ phòng thí nghiệm của chúng tôi, do đó mô hình video này bây giờ đã được tùy chỉnh cho robot của chúng tôi. Sau đó, chúng ta có thể sử dụng mô hình đã hiệu chỉnh này để tạo, nguyên lý, vô số video giấc mơ bằng cách gợi ý mô hình theo các cách khác nhau. Và giờ đây, điều đó trở thành dữ liệu giả để bổ sung bộ dữ liệu thực tế của robot. Như nhiều người trong số các bạn có thể biết, thu thập dữ liệu trên robot thực rất mất thời gian và tốn kém vì bạn bị giới hạn bởi 24 giờ mỗi ngày cho mỗi robot, đúng không? Đây là hệ thống vật lý, nhưng với Gr00t Dreams, quy trình mới này, bộ thuật toán mới, giờ đây chúng ta có thể phá vỡ giới hạn vật lý cơ bản này và nhân đôi dữ liệu ở quy mô chưa từng có."
Kết quả? Các robot có thể cầm nắm các vật thể chính xác, bất kể đó là dưa chuột, đổ nước cam, hay mở laptop. Đây là hành động mà robot chưa từng được huấn luyện, Fan lưu ý, nhưng nhờ huấn luyện với mô hình video, robot có thể "hiểu về vật lý và ý nghĩa của các động từ" và học cách thực hiện chúng.
Các mô hình Isaac GR00T mới thúc đẩy sự phát triển của robot hình nhân
Bản thiết kế Isaac GR00T-Dreams của NVIDIA không chỉ là lời nói suông; nó đã được áp dụng để tạo dữ liệu huấn luyện giả, phát triển GR00T N1.5 chỉ trong 36 giờ – một nhiệm vụ sẽ mất gần ba tháng nếu không có bản thiết kế này. GR00T N1.5 hiện có thể thích nghi tốt hơn với các môi trường mới và cấu hình không gian làm việc, cũng như nhận diện các vật thể qua hướng dẫn của người dùng. Cập nhật này đáng kể nâng cao tỷ lệ thành công của mô hình đối với các tác vụ phổ biến như sắp xếp hoặc đặt vật, và nó đã sẵn sàng được triển khai trên Jetson Thor, sẽ ra mắt vào cuối năm nay.
Mô hình cơ sở GR00T N1.5 tích hợp Gr00t Dreams vào pipeline tạo dữ liệu giả của nó. NVIDIA đã nâng cấp phần xương sống ngôn ngữ thị giác, đảm bảo rằng GR00T N1.5 sẽ có khả năng thích ứng vượt trội và tuân thủ tốt hơn với các hướng dẫn ngôn ngữ, theo Fan.
GR00T N1.5 sẽ ra mắt tại Computex và sẽ được phát hành dưới dạng mã nguồn mở vào ngày 9 tháng 6. Còn về Gr00t Dreams, NVIDIA vẫn đang tinh chỉnh lịch trình nhưng mục tiêu là mở mã nguồn càng nhiều càng tốt, Fan thêm.
Người dùng sớm của GR00T N bao gồm AeiRobot, Foxlink, Lightwheel và NEURA Robotics. AeiRobot đang sử dụng mô hình này để cho phép ALICE4 hiểu các hướng dẫn ngôn ngữ tự nhiên và thực hiện các quy trình lấy và đặt phức tạp trong các môi trường công nghiệp. Foxlink Group đang sử dụng nó để cải thiện sự linh hoạt và hiệu quả của các cánh tay robot công nghiệp, trong khi Lightwheel đang kiểm chứng dữ liệu giả để triển khai robot hình nhân nhanh hơn trong các nhà máy. NEURA Robotics đang khám phá mô hình này để đẩy nhanh việc phát triển tự động hóa gia đình.
Các khung công cụ mô phỏng và tạo dữ liệu mới tăng tốc các pipeline huấn luyện
Việc tạo ra các robot hình nhân có kỹ năng cao không chỉ phụ thuộc vào phần cứng; nó còn đòi hỏi việc cung cấp cho chúng một lượng lớn dữ liệu đa dạng, có thể rất tốn kém và mất thời gian để thu thập và xử lý. Hơn nữa, thử nghiệm robot trong thế giới thực đi kèm với những thách thức và rủi ro riêng.
Để lấp đầy những khoảng trống này, NVIDIA đã giới thiệu một số công nghệ mô phỏng:
- NVIDIA Cosmos Reason, một WFM mới sử dụng suy luận chuỗi tư duy để giúp tạo dữ liệu tổng hợp chính xác và chất lượng cao cho việc đào tạo mô hình AI vật lý, hiện có sẵn trên Hugging Face.










