选项
首页
新闻
Google推出设备端Gemini AI机器人模型

Google推出设备端Gemini AI机器人模型

2025-07-08
0

Google DeepMind发布Gemini Robotics On-Device,支持离线机器人控制

Google DeepMind在机器人领域发布了一项激动人心的更新——Gemini Robotics On-Device,一款无需网络连接即可让机器人执行任务的新语言模型。这建立在他们早先的Gemini Robotics模型(3月发布)基础上,关键升级在于:本地处理

开发者现可通过自然语言提示微调机器人动作,更轻松地适配不同任务。Google声称其性能几乎与云端模型相当,且优于其他设备端模型(未具体说明哪些模型)。

图片来源:Google

现实世界的机器人技能:从洗衣到流水线

在演示中,运行该模型的机器人成功完成了:

  • 解开拉链包
  • 折叠衣物
  • 适配新物体(如在工业流水线上组装零件)

最初为ALOHA机器人训练,该模型随后适配到:

  • Franka FR3(双臂工业机器人)
  • Apptronik的Apollo人形机器人

Gemini Robotics SDK:通过示范训练机器人

Google还推出了Gemini Robotics SDK,允许开发者在MuJoCo物理模拟器中通过50-100次任务示范训练机器人,加速现实世界的机器人学习。

更广阔的图景:AI进军机器人领域

Google并非独行:

  • Nvidia正在为人形机器人构建基础模型
  • Hugging Face致力于开放模型及实际机器人
  • RLWRLD(韩国初创公司)在开发机器人基础模型

AI驱动的机器人未来正在升温——而且是离线、设备端、实时进行。


想要更多科技洞察?
加入我们在马萨诸塞州波士顿(7月15日)举办的TechCrunch Disrupt,深入探讨AI、机器人和投资趋势。全阶段通行证节省200美元以上,与来自Precursor Ventures、NEA、Index Ventures和Underscore VC的领袖交流。

👉 立即注册

相关文章
谷歌测试搜索查询的音频概览 谷歌测试搜索查询的音频概览 谷歌搜索引入免提学习的音频概览谷歌刚刚推出了一项实验性新功能——音频概览,为用户提供了另一种消费搜索结果的方式。该功能首先在NotebookLM(谷歌的AI驱动研究工具)中测试,现已在谷歌搜索实验室,即公司的实验功能测试平台上推出。音频概览如何工作想象你在做饭、开车,或更喜欢听而不是读——现在你可以获得搜索查询的快速语音摘要,无需滚动浏览文本。谷歌表示,这些概览由其最新的Gemini AI模型驱动
新研究揭示大语言模型实际记忆的数据量 新研究揭示大语言模型实际记忆的数据量 AI模型实际记忆了多少?新研究揭示惊人见解我们都知道,像ChatGPT、Claude和Gemini这样的大型语言模型(LLMs)是在海量数据集上训练的——包括来自书籍、网站、代码,甚至图像和音频等多媒体的数万亿字词。但这些数据到底发生了什么?这些模型是真正理解语言,还是仅仅在复述记忆的片段?来自Meta、Google DeepMind、Cornell和NVIDIA的一项突破性新研究终于给出了具体答
Google推出 Android 和 Chrome 的新AI 与辅助功能升级 Google推出 Android 和 Chrome 的新AI 与辅助功能升级 ||Google为Android和Chrome扩展AI与辅助功能Google 刚为 Android 和 Chrome 推出了一些激动人心的更新,使它们比以往更智能、更易于访问。最大的亮点?TalkBack,Android 的内置屏幕阅读器,现在允许用户向 Gemini AI 询问关于图像和屏幕内容的问题——这对盲人或视力低下的人来说是个重大突破。 图片来源:Google TalkBack 通过
评论 (0)
0/200
返回顶部
OR