Дом
Новая модель искусственного интеллекта DeepMind работает на базе роботов для повышения производительности
Google DeepMind выпускает версию своей модели искусственного интеллекта Gemini Robotics, работающую на устройстве и не требующую подключения к Интернету. Эта модель видения-языка-действия (VLA) включает в себя те же возможности ловкости, которые были представлены в марте, но Google отмечает, что теперь она достаточно компактна и эффективна, чтобы работать непосредственно на роботе.
Флагманская модель Gemini Robotics позволяет роботам выполнять различные физические задачи, даже те, которым они не были специально обучены. Она помогает обобщать новые сценарии, понимать и реагировать на инструкции, а также выполнять действия, требующие тонкого моторного контроля.
По словам Каролины Парада, руководителя отдела робототехники в Google DeepMind, оригинальная модель Gemini Robotics использует гибридный метод, который работает как на устройстве, так и в облаке. Однако в новой модели, предназначенной только для устройств, пользователи могут получить доступ к автономным возможностям, которые обеспечивают почти такую же производительность, как и флагманская версия.

Гуманоидный бот Apollo от Apptronik и система ALOHA от Google. GIF: GoogleМодель на устройстве может мгновенно справляться с несколькими задачами и адаптироваться к незнакомым ситуациям "всего за 50-100 демонстраций", объясняет Парада. Хотя изначально Google обучала модель только на своем роботе ALOHA, компания успешно адаптировала ее к другим роботизированным платформам, таким как гуманоидный робот Apollo от Apptronik и двурукий робот Franka FR3.
"Гибридная модель Gemini Robotics остается более мощной, но мы были искренне впечатлены производительностью этой версии устройства", - добавляет Парада. "Ее можно рассматривать как модель начального уровня или как идеальное решение для сред с ненадежным интернетом". Она также подходит для организаций со строгими протоколами безопасности".
В дополнение к новой модели Google выпускает комплект для разработки программного обеспечения (SDK), чтобы разработчики могли тестировать и настраивать его - это первый случай выпуска такого комплекта инструментов для одного из VLA Google DeepMind.
Модель Gemini Robotics и сопутствующий SDK будут первоначально предоставлены избранной группе доверенных тестеров, пока Google продолжает решать и минимизировать потенциальные проблемы безопасности.
Связанная статья
Kakao Mobility представляет план развития автономного вождения 4-го уровня с использованием физического ИИ
Компания Kakao Mobility планирует самостоятельно разрабатывать технологии автономного вождения 4-го уровня в рамках своей стратегии «физического ИИ».На конференции World IT Show 2026, прошедшей в сеу
Google запускает Gemini в браузере Chrome в Индии
В среду компания Google объявила о расширении интеграции Gemini в браузере Chrome на новые регионы, включая Индию, Канаду и Новую Зеландию. Это обновление позволяет пользователям настольных компьютеро
Барри Диллер: доверие к Сэму Альтману теряет значение по мере приближения эры общей искусственной интеллигенции
Миллиардер и медиа-магнат Барри Диллер не считает генерального директора OpenAI Сэма Альтмана недостойным доверия, несмотря на недавние сообщения, свидетельствующие об обратном. Выступая на этой недел
Рекомендации по связанным специальным темам
Комментарии (1)
That's a huge step forward for robotics! On-device processing is finally catching up, but I'm kinda wondering how expensive the hardware will be - can small startups afford it? 🤔 Also, curious if offline functionality means it's less likely to be updated or influenced remotely, which might be a double-edged sword.
Google DeepMind выпускает версию своей модели искусственного интеллекта Gemini Robotics, работающую на устройстве и не требующую подключения к Интернету. Эта модель видения-языка-действия (VLA) включает в себя те же возможности ловкости, которые были представлены в марте, но Google отмечает, что теперь она достаточно компактна и эффективна, чтобы работать непосредственно на роботе.
Флагманская модель Gemini Robotics позволяет роботам выполнять различные физические задачи, даже те, которым они не были специально обучены. Она помогает обобщать новые сценарии, понимать и реагировать на инструкции, а также выполнять действия, требующие тонкого моторного контроля.
По словам Каролины Парада, руководителя отдела робототехники в Google DeepMind, оригинальная модель Gemini Robotics использует гибридный метод, который работает как на устройстве, так и в облаке. Однако в новой модели, предназначенной только для устройств, пользователи могут получить доступ к автономным возможностям, которые обеспечивают почти такую же производительность, как и флагманская версия.

Модель на устройстве может мгновенно справляться с несколькими задачами и адаптироваться к незнакомым ситуациям "всего за 50-100 демонстраций", объясняет Парада. Хотя изначально Google обучала модель только на своем роботе ALOHA, компания успешно адаптировала ее к другим роботизированным платформам, таким как гуманоидный робот Apollo от Apptronik и двурукий робот Franka FR3.
"Гибридная модель Gemini Robotics остается более мощной, но мы были искренне впечатлены производительностью этой версии устройства", - добавляет Парада. "Ее можно рассматривать как модель начального уровня или как идеальное решение для сред с ненадежным интернетом". Она также подходит для организаций со строгими протоколами безопасности".
В дополнение к новой модели Google выпускает комплект для разработки программного обеспечения (SDK), чтобы разработчики могли тестировать и настраивать его - это первый случай выпуска такого комплекта инструментов для одного из VLA Google DeepMind.
Модель Gemini Robotics и сопутствующий SDK будут первоначально предоставлены избранной группе доверенных тестеров, пока Google продолжает решать и минимизировать потенциальные проблемы безопасности.
Google запускает Gemini в браузере Chrome в Индии
В среду компания Google объявила о расширении интеграции Gemini в браузере Chrome на новые регионы, включая Индию, Канаду и Новую Зеландию. Это обновление позволяет пользователям настольных компьютеро
Барри Диллер: доверие к Сэму Альтману теряет значение по мере приближения эры общей искусственной интеллигенции
Миллиардер и медиа-магнат Барри Диллер не считает генерального директора OpenAI Сэма Альтмана недостойным доверия, несмотря на недавние сообщения, свидетельствующие об обратном. Выступая на этой недел
That's a huge step forward for robotics! On-device processing is finally catching up, but I'm kinda wondering how expensive the hardware will be - can small startups afford it? 🤔 Also, curious if offline functionality means it's less likely to be updated or influenced remotely, which might be a double-edged sword.











