Google推出设备端Gemini AI机器人模型
Google DeepMind发布Gemini Robotics On-Device,支持离线机器人控制
Google DeepMind在机器人领域发布了一项激动人心的更新——Gemini Robotics On-Device,一款无需网络连接即可让机器人执行任务的新语言模型。这建立在他们早先的Gemini Robotics模型(3月发布)基础上,关键升级在于:本地处理。
开发者现可通过自然语言提示微调机器人动作,更轻松地适配不同任务。Google声称其性能几乎与云端模型相当,且优于其他设备端模型(未具体说明哪些模型)。

图片来源:Google 现实世界的机器人技能:从洗衣到流水线
在演示中,运行该模型的机器人成功完成了:
- 解开拉链包
- 折叠衣物
- 适配新物体(如在工业流水线上组装零件)
最初为ALOHA机器人训练,该模型随后适配到:
- Franka FR3(双臂工业机器人)
- Apptronik的Apollo人形机器人
Gemini Robotics SDK:通过示范训练机器人
Google还推出了Gemini Robotics SDK,允许开发者在MuJoCo物理模拟器中通过50-100次任务示范训练机器人,加速现实世界的机器人学习。
更广阔的图景:AI进军机器人领域
Google并非独行:
- Nvidia正在为人形机器人构建基础模型
- Hugging Face致力于开放模型及实际机器人
- RLWRLD(韩国初创公司)在开发机器人基础模型
AI驱动的机器人未来正在升温——而且是离线、设备端、实时进行。
想要更多科技洞察?
加入我们在马萨诸塞州波士顿(7月15日)举办的TechCrunch Disrupt,深入探讨AI、机器人和投资趋势。全阶段通行证节省200美元以上,与来自Precursor Ventures、NEA、Index Ventures和Underscore VC的领袖交流。
👉 立即注册
相关文章
谷歌测试搜索查询的音频概览
谷歌搜索引入免提学习的音频概览谷歌刚刚推出了一项实验性新功能——音频概览,为用户提供了另一种消费搜索结果的方式。该功能首先在NotebookLM(谷歌的AI驱动研究工具)中测试,现已在谷歌搜索实验室,即公司的实验功能测试平台上推出。音频概览如何工作想象你在做饭、开车,或更喜欢听而不是读——现在你可以获得搜索查询的快速语音摘要,无需滚动浏览文本。谷歌表示,这些概览由其最新的Gemini AI模型驱动
新研究揭示大语言模型实际记忆的数据量
AI模型实际记忆了多少?新研究揭示惊人见解我们都知道,像ChatGPT、Claude和Gemini这样的大型语言模型(LLMs)是在海量数据集上训练的——包括来自书籍、网站、代码,甚至图像和音频等多媒体的数万亿字词。但这些数据到底发生了什么?这些模型是真正理解语言,还是仅仅在复述记忆的片段?来自Meta、Google DeepMind、Cornell和NVIDIA的一项突破性新研究终于给出了具体答
Google推出 Android 和 Chrome 的新AI 与辅助功能升级
||Google为Android和Chrome扩展AI与辅助功能Google 刚为 Android 和 Chrome 推出了一些激动人心的更新,使它们比以往更智能、更易于访问。最大的亮点?TalkBack,Android 的内置屏幕阅读器,现在允许用户向 Gemini AI 询问关于图像和屏幕内容的问题——这对盲人或视力低下的人来说是个重大突破。 图片来源:Google TalkBack 通过
评论 (0)
0/200
Google DeepMind发布Gemini Robotics On-Device,支持离线机器人控制
Google DeepMind在机器人领域发布了一项激动人心的更新——Gemini Robotics On-Device,一款无需网络连接即可让机器人执行任务的新语言模型。这建立在他们早先的Gemini Robotics模型(3月发布)基础上,关键升级在于:本地处理。
开发者现可通过自然语言提示微调机器人动作,更轻松地适配不同任务。Google声称其性能几乎与云端模型相当,且优于其他设备端模型(未具体说明哪些模型)。
现实世界的机器人技能:从洗衣到流水线
在演示中,运行该模型的机器人成功完成了:
- 解开拉链包
- 折叠衣物
- 适配新物体(如在工业流水线上组装零件)
最初为ALOHA机器人训练,该模型随后适配到:
- Franka FR3(双臂工业机器人)
- Apptronik的Apollo人形机器人
Gemini Robotics SDK:通过示范训练机器人
Google还推出了Gemini Robotics SDK,允许开发者在MuJoCo物理模拟器中通过50-100次任务示范训练机器人,加速现实世界的机器人学习。
更广阔的图景:AI进军机器人领域
Google并非独行:
- Nvidia正在为人形机器人构建基础模型
- Hugging Face致力于开放模型及实际机器人
- RLWRLD(韩国初创公司)在开发机器人基础模型
AI驱动的机器人未来正在升温——而且是离线、设备端、实时进行。
想要更多科技洞察?
加入我们在马萨诸塞州波士顿(7月15日)举办的TechCrunch Disrupt,深入探讨AI、机器人和投资趋势。全阶段通行证节省200美元以上,与来自Precursor Ventures、NEA、Index Ventures和Underscore VC的领袖交流。
👉 立即注册



0/200
头条新闻
2025顶级AI视频生成器:Pika Labs与其他对比
Openai增强了AI语音助手以进行更好的聊天
Gemini 2.5 Pro现在比Claude,GPT-4O更便宜,更便宜
体验AI驱动的I/O填字游戏:经典文字游戏中的现代转折
创始人说
NotebookLM在全球范围内扩展,添加幻灯片并增强了事实检查
NVIDIA首席执行官阐明了对DeepSeek市场影响的误解
谷歌AI跃升内幕:Gemini 2.5思维更深、表达更智能且编码更快
AI语音克隆:掌握语音转换的终极指南
对美国数据中心的调整可以解锁76 GW的新电源容量
更多
精选
更多

Claude
认识Claude:您的AI助手智能工作是否希望您有一个知识渊博的同事,他随时准备

Cici AI
你是否曾经好奇过Cici AI到底是什么?让我告诉你,它不仅仅是一个普通的AI聊

Gemini
有没有想过关于双子座的嗡嗡声是什么?让我为您分解。双子座是由Google Dee

DeepSeek
曾经想过什么是全部意见?让我为您分解。 DeepSeek不仅是另一个AI平台;无

Grok
听说过Grok吗?这是Xai的Nifty AI助手,这一切都是为了给您直接的勺子

ChatGPT
有没有想过什么是什么?好吧,让我为您分解它 - 聊天不仅仅是您在技术领域的普通乔

OpenAI
有没有想过Openai周围的嗡嗡声是什么?好吧,让我为您分解。 Openai不仅

Tencent Hunyuan
腾讯hunyuan-large,是吗?就像腾讯技术巨头开发的AI模型的瑞士军刀一

Qwen AI
有没有想过Qwen AI是什么?好吧,让我向您介绍阿里巴巴云的这颗宝石。 Qwe

Runway
有没有想过如何将您的常规视频剪辑变成非凡的东西?好吧,让我向您介绍跑道,这是一个