Google Ra Mắt Mô Hình AI Gemini Trên Thiết Bị cho Robot
Google DeepMind Công Bố Gemini Robotics Trên Thiết Bị cho Điều Khiển Robot Ngoại Tuyến
Google DeepMind vừa công bố một cập nhật thú vị trong lĩnh vực robot—Gemini Robotics Trên Thiết Bị, một mô hình ngôn ngữ mới cho phép robot thực hiện nhiệm vụ mà không cần kết nối internet. Mô hình này được phát triển dựa trên Gemini Robotics trước đó (ra mắt vào tháng 3) nhưng có một nâng cấp quan trọng: xử lý cục bộ.
Các nhà phát triển giờ đây có thể tinh chỉnh chuyển động của robot bằng các lệnh ngôn ngữ tự nhiên, giúp dễ dàng điều chỉnh robot cho các nhiệm vụ khác nhau. Google tuyên bố hiệu suất của mô hình này gần tương đương với phiên bản dựa trên đám mây và vượt trội hơn các mô hình trên thiết bị khác (mặc dù họ không nêu rõ các mô hình nào).

Tín dụng hình ảnh: Google Kỹ Năng Robot Trong Thế Giới Thực: Từ Giặt Là đến Dây Chuyền Lắp Ráp
Trong các bản demo, các robot sử dụng mô hình này đã thực hiện thành công:
- Mở khóa kéo túi
- Gấp quần áo
- Thích nghi với các vật thể mới (như lắp ráp các bộ phận trên dây chuyền công nghiệp)
Ban đầu được huấn luyện cho robot ALOHA, mô hình sau đó đã được điều chỉnh để hoạt động trên:
- Franka FR3 (robot công nghiệp hai tay)
- Apptronik’s Apollo humanoid
Gemini Robotics SDK: Huấn Luyện Robot bằng Các Bản Thể Hiện
Google cũng công bố Gemini Robotics SDK, cho phép các nhà phát triển huấn luyện robot bằng 50-100 bản thể hiện nhiệm vụ trong trình mô phỏng vật lý MuJoCo. Điều này có thể đẩy nhanh quá trình học tập của robot cho các ứng dụng thực tế.
Bức Tranh Lớn Hơn: Sự Thúc Đẩy của AI vào Robot
Google không đơn độc trong cuộc đua này:
- Nvidia đang xây dựng các mô hình nền tảng cho robot hình người
- Hugging Face đang phát triển các mô hình mở—và cả robot thực tế
- RLWRLD (một startup Hàn Quốc) đang phát triển các mô hình nền tảng cho robot
Tương lai của robot được hỗ trợ bởi AI đang nóng lên—và nó đang diễn ra ngoại tuyến, trên thiết bị và trong thời gian thực.
Muốn có thêm thông tin công nghệ?
Tham gia cùng chúng tôi tại TechCrunch Disrupt ở Boston, MA (ngày 15 tháng 7) để tìm hiểu sâu về AI, robot và xu hướng đầu tư mạo hiểm. Tiết kiệm hơn $200 cho vé All Stage và kết nối với các nhà lãnh đạo từ Precursor Ventures, NEA, Index Ventures và Underscore VC.
👉 ĐĂNG KÝ NGAY
Bài viết liên quan
Google thử nghiệm Tổng quan Âm thanh cho các truy vấn Tìm kiếm
Tìm kiếm Google Giới thiệu Tổng quan Âm thanh cho Học tập Rảnh tayGoogle vừa triển khai một tính năng thử nghiệm mới—Tổng quan Âm thanh—cung cấp cho người dùng một cách khác để tiếp nhận kết quả tìm k
Nghiên Cứu Mới Tiết Lộ Lượng Dữ Liệu LLMs Thực Sự Ghi Nhớ
AI Ghi Nhớ Bao Nhiêu? Nghiên Cứu Mới Tiết Lộ Những Hiểu Biết Bất NgờChúng ta đều biết rằng các mô hình ngôn ngữ lớn (LLMs) như ChatGPT, Claude, và Gemini được huấn luyện trên các tập dữ liệu khổng lồ—
Google Giới thiệu Nâng cấp AI và Trợ năng Mới cho Android và Chrome
Google Mở rộng Tính năng AI và Trợ năng cho Android và ChromeGoogle vừa công bố một số cập nhật thú vị cho Android và Chrome, khiến chúng thông minh và dễ tiếp cận hơn bao giờ hết. Điểm nhấn lớn nhất?
Nhận xét (0)
0/200
Google DeepMind Công Bố Gemini Robotics Trên Thiết Bị cho Điều Khiển Robot Ngoại Tuyến
Google DeepMind vừa công bố một cập nhật thú vị trong lĩnh vực robot—Gemini Robotics Trên Thiết Bị, một mô hình ngôn ngữ mới cho phép robot thực hiện nhiệm vụ mà không cần kết nối internet. Mô hình này được phát triển dựa trên Gemini Robotics trước đó (ra mắt vào tháng 3) nhưng có một nâng cấp quan trọng: xử lý cục bộ.
Các nhà phát triển giờ đây có thể tinh chỉnh chuyển động của robot bằng các lệnh ngôn ngữ tự nhiên, giúp dễ dàng điều chỉnh robot cho các nhiệm vụ khác nhau. Google tuyên bố hiệu suất của mô hình này gần tương đương với phiên bản dựa trên đám mây và vượt trội hơn các mô hình trên thiết bị khác (mặc dù họ không nêu rõ các mô hình nào).
Kỹ Năng Robot Trong Thế Giới Thực: Từ Giặt Là đến Dây Chuyền Lắp Ráp
Trong các bản demo, các robot sử dụng mô hình này đã thực hiện thành công:
- Mở khóa kéo túi
- Gấp quần áo
- Thích nghi với các vật thể mới (như lắp ráp các bộ phận trên dây chuyền công nghiệp)
Ban đầu được huấn luyện cho robot ALOHA, mô hình sau đó đã được điều chỉnh để hoạt động trên:
- Franka FR3 (robot công nghiệp hai tay)
- Apptronik’s Apollo humanoid
Gemini Robotics SDK: Huấn Luyện Robot bằng Các Bản Thể Hiện
Google cũng công bố Gemini Robotics SDK, cho phép các nhà phát triển huấn luyện robot bằng 50-100 bản thể hiện nhiệm vụ trong trình mô phỏng vật lý MuJoCo. Điều này có thể đẩy nhanh quá trình học tập của robot cho các ứng dụng thực tế.
Bức Tranh Lớn Hơn: Sự Thúc Đẩy của AI vào Robot
Google không đơn độc trong cuộc đua này:
- Nvidia đang xây dựng các mô hình nền tảng cho robot hình người
- Hugging Face đang phát triển các mô hình mở—và cả robot thực tế
- RLWRLD (một startup Hàn Quốc) đang phát triển các mô hình nền tảng cho robot
Tương lai của robot được hỗ trợ bởi AI đang nóng lên—và nó đang diễn ra ngoại tuyến, trên thiết bị và trong thời gian thực.
Muốn có thêm thông tin công nghệ?
Tham gia cùng chúng tôi tại TechCrunch Disrupt ở Boston, MA (ngày 15 tháng 7) để tìm hiểu sâu về AI, robot và xu hướng đầu tư mạo hiểm. Tiết kiệm hơn $200 cho vé All Stage và kết nối với các nhà lãnh đạo từ Precursor Ventures, NEA, Index Ventures và Underscore VC.
👉 ĐĂNG KÝ NGAY












