Hogar
La nueva IA de DeepMind permite a los robots realizar tareas mediante búsquedas en Internet
Google DeepMind ha anunciado que sus modelos de IA mejorados permiten ahora a los robots realizar tareas más complejas e incluso utilizar recursos web como ayuda. Durante una rueda de prensa, Carolina Parada, responsable de robótica de Google DeepMind, explicó que los últimos modelos de IA de la empresa colaboran para que los robots puedan "planificar múltiples pasos por adelantado" antes de ejecutar acciones en el entorno físico.
El sistema se basa en el nuevo Gemini Robotics 1.5 y el modelo de razonamiento incorporado Gemini Robotics-ER 1.5, versiones mejoradas de los modelos de IA que Google DeepMind presentó en marzo. Los robots ya no se limitan a realizar tareas individuales como doblar una hoja de papel o abrir una bolsa. Ahora pueden realizar actividades como clasificar la colada por colores claros y oscuros, hacer la maleta según el tiempo que haga en Londres y ayudar a separar los residuos, el compost y el reciclaje basándose en directrices específicas de cada lugar extraídas de búsquedas en Internet.
"Los modelos anteriores destacaban en la ejecución de instrucciones individuales con gran versatilidad", señaló Parada. "Con esta actualización, estamos pasando de las instrucciones de un solo paso a la auténtica comprensión y resolución de problemas para tareas físicas".
Para ello, los robots emplean el modelo actualizado Gemini Robotics-ER 1.5 para interpretar su entorno y aprovechar herramientas digitales como Google Search para obtener información adicional. A continuación, Gemini Robotics-ER 1.5 convierte estos hallazgos en instrucciones en lenguaje llano para Gemini Robotics 1.5, lo que permite al robot utilizar las capacidades visuales y lingüísticas del modelo para ejecutar cada paso.

Los modelos de IA de Google DeepMind colaboran para ayudar a los robots a planificar y realizar tareas. Imagen: GoogleRelacionado
- El modelo de IA optimizado de Google DeepMind opera directamente sobre robots
Además, Google DeepMind reveló que Gemini Robotics 1.5 permite a los robots "aprender" unos de otros, independientemente de sus configuraciones de hardware. La empresa descubrió que las tareas demostradas en el robot ALOHA2 -un sistema con dos brazos mecánicos- pueden realizarse directamente en el robot bi-brazo Franka y en el robot humanoide Apollo de Apptronik. "Esto proporciona dos ventajas clave: en primer lugar, podemos controlar robots muy diversos, incluidos los humanoides, utilizando un único modelo", declaró Kanishka Rao, ingeniero de software de Google DeepMind, durante la sesión informativa. "En segundo lugar, las habilidades adquiridas por un robot pueden transferirse ahora a otro".
Como parte de este despliegue, Google DeepMind está poniendo Gemini Robotics-ER 1.5 a disposición de los desarrolladores a través de la API Gemini en Google AI Studio, mientras que Gemini Robotics 1.5 sigue siendo accesible solo para socios seleccionados.
Artículo relacionado
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física
Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
Google lanza Gemini en Chrome en la India
El miércoles, Google anunció que ampliará la integración de Gemini en Chrome a nuevas regiones, entre las que se incluyen la India, Canadá y Nueva Zelanda. Esta actualización permite a los usuarios de
Recomendaciones de temas especiales relacionados
comentario (1)
0/500
Google DeepMind ha anunciado que sus modelos de IA mejorados permiten ahora a los robots realizar tareas más complejas e incluso utilizar recursos web como ayuda. Durante una rueda de prensa, Carolina Parada, responsable de robótica de Google DeepMind, explicó que los últimos modelos de IA de la empresa colaboran para que los robots puedan "planificar múltiples pasos por adelantado" antes de ejecutar acciones en el entorno físico.
El sistema se basa en el nuevo Gemini Robotics 1.5 y el modelo de razonamiento incorporado Gemini Robotics-ER 1.5, versiones mejoradas de los modelos de IA que Google DeepMind presentó en marzo. Los robots ya no se limitan a realizar tareas individuales como doblar una hoja de papel o abrir una bolsa. Ahora pueden realizar actividades como clasificar la colada por colores claros y oscuros, hacer la maleta según el tiempo que haga en Londres y ayudar a separar los residuos, el compost y el reciclaje basándose en directrices específicas de cada lugar extraídas de búsquedas en Internet.
"Los modelos anteriores destacaban en la ejecución de instrucciones individuales con gran versatilidad", señaló Parada. "Con esta actualización, estamos pasando de las instrucciones de un solo paso a la auténtica comprensión y resolución de problemas para tareas físicas".
Para ello, los robots emplean el modelo actualizado Gemini Robotics-ER 1.5 para interpretar su entorno y aprovechar herramientas digitales como Google Search para obtener información adicional. A continuación, Gemini Robotics-ER 1.5 convierte estos hallazgos en instrucciones en lenguaje llano para Gemini Robotics 1.5, lo que permite al robot utilizar las capacidades visuales y lingüísticas del modelo para ejecutar cada paso.

Relacionado
- El modelo de IA optimizado de Google DeepMind opera directamente sobre robots
Además, Google DeepMind reveló que Gemini Robotics 1.5 permite a los robots "aprender" unos de otros, independientemente de sus configuraciones de hardware. La empresa descubrió que las tareas demostradas en el robot ALOHA2 -un sistema con dos brazos mecánicos- pueden realizarse directamente en el robot bi-brazo Franka y en el robot humanoide Apollo de Apptronik. "Esto proporciona dos ventajas clave: en primer lugar, podemos controlar robots muy diversos, incluidos los humanoides, utilizando un único modelo", declaró Kanishka Rao, ingeniero de software de Google DeepMind, durante la sesión informativa. "En segundo lugar, las habilidades adquiridas por un robot pueden transferirse ahora a otro".
Como parte de este despliegue, Google DeepMind está poniendo Gemini Robotics-ER 1.5 a disposición de los desarrolladores a través de la API Gemini en Google AI Studio, mientras que Gemini Robotics 1.5 sigue siendo accesible solo para socios seleccionados.
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Google lanza Gemini en Chrome en la India
El miércoles, Google anunció que ampliará la integración de Gemini en Chrome a nuevas regiones, entre las que se incluyen la India, Canadá y Nueva Zelanda. Esta actualización permite a los usuarios de











