Google DeepMind Công Bố Gemini Robotics Trên Thiết Bị cho Điều Khiển Robot Ngoại Tuyến

Google DeepMind vừa công bố một cập nhật thú vị trong lĩnh vực robot—Gemini Robotics Trên Thiết Bị, một mô hình ngôn ngữ mới cho phép robot thực hiện nhiệm vụ mà không cần kết nối internet. Mô hình này được phát triển dựa trên Gemini Robotics trước đó (ra mắt vào tháng 3) nhưng có một nâng cấp quan trọng: xử lý cục bộ.

Các nhà phát triển giờ đây có thể tinh chỉnh chuyển động của robot bằng các lệnh ngôn ngữ tự nhiên, giúp dễ dàng điều chỉnh robot cho các nhiệm vụ khác nhau. Google tuyên bố hiệu suất của mô hình này gần tương đương với phiên bản dựa trên đám mây và vượt trội hơn các mô hình trên thiết bị khác (mặc dù họ không nêu rõ các mô hình nào).

Tín dụng hình ảnh: Google

Kỹ Năng Robot Trong Thế Giới Thực: Từ Giặt Là đến Dây Chuyền Lắp Ráp

Trong các bản demo, các robot sử dụng mô hình này đã thực hiện thành công:

Mở khóa kéo túi
Gấp quần áo
Thích nghi với các vật thể mới (như lắp ráp các bộ phận trên dây chuyền công nghiệp)

Ban đầu được huấn luyện cho robot ALOHA, mô hình sau đó đã được điều chỉnh để hoạt động trên:

Franka FR3 (robot công nghiệp hai tay)
Apptronik’s Apollo humanoid

Gemini Robotics SDK: Huấn Luyện Robot bằng Các Bản Thể Hiện

Google cũng công bố Gemini Robotics SDK, cho phép các nhà phát triển huấn luyện robot bằng 50-100 bản thể hiện nhiệm vụ trong trình mô phỏng vật lý MuJoCo. Điều này có thể đẩy nhanh quá trình học tập của robot cho các ứng dụng thực tế.

Bức Tranh Lớn Hơn: Sự Thúc Đẩy của AI vào Robot

Google không đơn độc trong cuộc đua này:

Nvidia đang xây dựng các mô hình nền tảng cho robot hình người
Hugging Face đang phát triển các mô hình mở—và cả robot thực tế
RLWRLD (một startup Hàn Quốc) đang phát triển các mô hình nền tảng cho robot

Tương lai của robot được hỗ trợ bởi AI đang nóng lên—và nó đang diễn ra ngoại tuyến, trên thiết bị và trong thời gian thực.

Muốn có thêm thông tin công nghệ?
Tham gia cùng chúng tôi tại TechCrunch Disrupt ở Boston, MA (ngày 15 tháng 7) để tìm hiểu sâu về AI, robot và xu hướng đầu tư mạo hiểm. Tiết kiệm hơn $200 cho vé All Stage và kết nối với các nhà lãnh đạo từ Precursor Ventures, NEA, Index Ventures và Underscore VC.

👉 ĐĂNG KÝ NGAY

Bài viết liên quan

Google thử nghiệm Tổng quan Âm thanh cho các truy vấn Tìm kiếm Tìm kiếm Google Giới thiệu Tổng quan Âm thanh cho Học tập Rảnh tayGoogle vừa triển khai một tính năng thử nghiệm mới—Tổng quan Âm thanh—cung cấp cho người dùng một cách khác để tiếp nhận kết quả tìm k

Nghiên Cứu Mới Tiết Lộ Lượng Dữ Liệu LLMs Thực Sự Ghi Nhớ AI Ghi Nhớ Bao Nhiêu? Nghiên Cứu Mới Tiết Lộ Những Hiểu Biết Bất NgờChúng ta đều biết rằng các mô hình ngôn ngữ lớn (LLMs) như ChatGPT, Claude, và Gemini được huấn luyện trên các tập dữ liệu khổng lồ—

Google Giới thiệu Nâng cấp AI và Trợ năng Mới cho Android và Chrome Google Mở rộng Tính năng AI và Trợ năng cho Android và ChromeGoogle vừa công bố một số cập nhật thú vị cho Android và Chrome, khiến chúng thông minh và dễ tiếp cận hơn bao giờ hết. Điểm nhấn lớn nhất?

Nhận xét (0)

0/200

Nộp

Tin tức hàng đầu

Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Trải nghiệm ô chữ I/O do AI hỗ trợ Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek Bên trong bước tiến AI của Google: Gemini 2.5 suy nghĩ sâu hơn, nói thông minh hơn và mã hóa nhanh hơn Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới

Hơn

Đặc trưng