DeepMind 的新人工智能让机器人通过网络搜索完成任务
谷歌 DeepMind 宣布,其增强型人工智能模型现在可以让机器人处理更复杂的任务,甚至可以利用网络资源提供帮助。在一次新闻发布会上,谷歌DeepMind公司机器人技术主管卡罗琳娜-帕拉达(Carolina Parada)解释说,该公司最新的人工智能模型能够使机器人在物理环境中执行动作之前 "提前规划多个步骤"。
该系统由最新发布的双子座机器人1.5和具身推理模型Gemini Robotics-ER 1.5驱动,它们是谷歌DeepMind今年3月发布的人工智能模型的升级版本。机器人不再局限于执行单个任务,如折叠一张纸或拉开一个包的拉链。它们现在可以根据深色和浅色对衣物进行分类,根据伦敦当前的天气情况打包行李,以及根据从网络搜索中获取的特定地点指南协助进行垃圾、堆肥和回收分类等活动。
"帕拉达指出:"以前的型号在执行单个指令方面表现出色,通用性很高。"通过这次更新,我们正在从单一步骤指令转向真正理解和解决问题的物理任务。
为了实现这一目标,机器人采用了升级后的 Gemini Robotics-ER 1.5 模型来解读周围环境,并利用谷歌搜索等数字工具获取更多信息。然后,Gemini Robotics-ER 1.5 会将这些发现转化为 Gemini Robotics 1.5 的纯语言指令,让机器人利用模型的视觉和语言能力来执行每个步骤。

谷歌 DeepMind 的人工智能模型协同协助机器人规划和执行任务 :谷歌相关内容
- 谷歌 DeepMind 的优化人工智能模型可直接在机器人身上运行
此外,谷歌DeepMind还透露,Gemini Robotics 1.5可以让机器人相互 "学习",而不管它们的硬件配置如何。该公司发现,在 ALOHA2 机器人--一个拥有两个机械臂的系统--上演示的任务可以直接在双臂弗兰卡机器人和 Apptronik 的仿人机器人阿波罗上执行。"谷歌 DeepMind 软件工程师卡尼什卡-拉奥(Kanishka Rao)在发布会上表示:"这提供了两个关键优势:首先,我们可以使用单一模型控制高度多样化的机器人,包括仿人机器人。"其次,一个机器人获得的技能现在可以转移到另一个机器人身上"。
作为此次推广活动的一部分,谷歌DeepMind将通过谷歌人工智能工作室(Google AI Studio)中的Gemini API向开发者提供Gemini Robotics-ER 1.5,而Gemini Robotics 1.5仍然只对选定的合作伙伴开放。
相关文章
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
Kakao Mobility 概述了面向物理人工智能的 L4 级自动驾驶路线图
Kakao Mobility 计划内部自主研发 L4 级自动驾驶技术,作为其物理人工智能战略的一部分。在首尔COEX举行的2026世界IT展上,Kakao Mobility副总裁兼物理AI部门负责人金镇奎(Kim Jin-kyu)介绍了该路线图。他的演讲聚焦于物理AI时代基于出行平台构建的自动驾驶服务。据韩联社报道,这场题为“超越构想,付诸行动:AI驱动现实”的活动汇聚了来自17个国家的460
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
相关专题推荐
评论 (1)
0/500
谷歌 DeepMind 宣布,其增强型人工智能模型现在可以让机器人处理更复杂的任务,甚至可以利用网络资源提供帮助。在一次新闻发布会上,谷歌DeepMind公司机器人技术主管卡罗琳娜-帕拉达(Carolina Parada)解释说,该公司最新的人工智能模型能够使机器人在物理环境中执行动作之前 "提前规划多个步骤"。
该系统由最新发布的双子座机器人1.5和具身推理模型Gemini Robotics-ER 1.5驱动,它们是谷歌DeepMind今年3月发布的人工智能模型的升级版本。机器人不再局限于执行单个任务,如折叠一张纸或拉开一个包的拉链。它们现在可以根据深色和浅色对衣物进行分类,根据伦敦当前的天气情况打包行李,以及根据从网络搜索中获取的特定地点指南协助进行垃圾、堆肥和回收分类等活动。
"帕拉达指出:"以前的型号在执行单个指令方面表现出色,通用性很高。"通过这次更新,我们正在从单一步骤指令转向真正理解和解决问题的物理任务。
为了实现这一目标,机器人采用了升级后的 Gemini Robotics-ER 1.5 模型来解读周围环境,并利用谷歌搜索等数字工具获取更多信息。然后,Gemini Robotics-ER 1.5 会将这些发现转化为 Gemini Robotics 1.5 的纯语言指令,让机器人利用模型的视觉和语言能力来执行每个步骤。

相关内容
- 谷歌 DeepMind 的优化人工智能模型可直接在机器人身上运行
此外,谷歌DeepMind还透露,Gemini Robotics 1.5可以让机器人相互 "学习",而不管它们的硬件配置如何。该公司发现,在 ALOHA2 机器人--一个拥有两个机械臂的系统--上演示的任务可以直接在双臂弗兰卡机器人和 Apptronik 的仿人机器人阿波罗上执行。"谷歌 DeepMind 软件工程师卡尼什卡-拉奥(Kanishka Rao)在发布会上表示:"这提供了两个关键优势:首先,我们可以使用单一模型控制高度多样化的机器人,包括仿人机器人。"其次,一个机器人获得的技能现在可以转移到另一个机器人身上"。
作为此次推广活动的一部分,谷歌DeepMind将通过谷歌人工智能工作室(Google AI Studio)中的Gemini API向开发者提供Gemini Robotics-ER 1.5,而Gemini Robotics 1.5仍然只对选定的合作伙伴开放。
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡





首页






