Nvidia impulsa la robótica humanoide con apoyo en la nube
Nvidia avanza a toda velocidad en el ámbito de la robótica humanoide y no se contiene. En la feria Computex 2025 en Taiwán, revelaron una serie de innovaciones que están destinadas a redefinir el panorama del desarrollo de la robótica. Entre estas, la estrella del espectáculo fue Nvidia Isaac GR00T N1.5, la última iteración del modelo de base abierto y completamente personalizable de Nvidia para el razonamiento y habilidades humanoides. Junto a él, Nvidia presentó Isaac GR00T-Dreams, un plan que está diseñado para generar datos de movimiento sintético, y los potentes sistemas Nvidia Blackwell, que están listos para acelerar el desarrollo de robots humanoides.
Numerosos desarrolladores líderes de robots humanoides y de robótica, incluyendo Agility Robotics, Boston Dynamics, Fourier, Foxlink, Galbot, Mentee Robotics, NEURA Robotics, General Robotics, Skild AI y XPENG Robotics, ya están a bordo, aprovechando las tecnologías de la plataforma Isaac de Nvidia para empujar los límites de lo posible con los robots humanoides.
Jensen Huang, CEO de Nvidia, no pudo contener su emoción, declarando: "La IA física y la robótica traerán la próxima revolución industrial. Desde cerebros de IA para robots hasta mundos simulados para practicar, o supercomputadoras de IA para entrenar modelos de base, Nvidia proporciona los bloques de construcción para cada etapa del viaje de desarrollo de la robótica."
Nuevo plan de generación de datos Isaac GR00T cierra la brecha de datos
¿Alguna vez te has preguntado sobre tener tu propio robot humanoide? Durante su discurso en Computex, Huang presentó Nvidia Isaac GR00T-Dreams, un plan revolucionario que genera grandes cantidades de datos de movimiento sintético, o trayectorias neurales. Estos datos son un tesoro para los desarrolladores de IA física, ayudándolos a enseñar a los robots una amplia gama de nuevos comportamientos y cómo adaptarse a entornos cambiantes.
El proceso comienza con los desarrolladores entrenando modelos de base del mundo Cosmos Predict (WFMs) para sus robots. Luego, con solo una imagen como entrada, GR00T-Dreams genera videos del robot enfrentando nuevas tareas en nuevos entornos. Luego extrae tokens de acción—pequeños fragmentos de datos fáciles de digerir—que los robots usan para aprender estas nuevas tareas.
GR00T-Dreams trabaja de la mano con el plan Isaac GR00T-Mimic, presentado anteriormente en la conferencia Nvidia GTC en marzo. Mientras que GR00T-Mimic aprovecha Nvidia Omniverse y Nvidia Cosmos para mejorar datos existentes, GR00T-Dreams usa Cosmos para crear datos completamente nuevos desde cero.
Jim Fan, director de IA y científico distinguido de Nvidia, compartió su entusiasmo en una conferencia de prensa, "Nvidia tiene una estrategia robótica muy fuerte, centrada en lo que Jensen llama el problema de las tres computadoras". Explicó que la computadora OVX maneja la simulación y los motores de física de simulación gráfica, generando datos que la computadora DGX luego usa para entrenar modelos de base. Estos datos luego se despliegan en la computadora HX, que dirige el espectáculo en el borde para plataformas como robots humanoides.
Fan se refirió con orgullo a Gr00t como el ciclo de vida de la IA física y los flujos de trabajo basados en robots, enfatizando, "Es una instanciación del problema de las tres computadoras". Destacó dos avances principales en el Proyecto Gr00t: Gr00t Dreams y Gr00t N1.5, añadiendo con humor que estaba bastante orgulloso de esos nombres.
Para Gr00t Dreams, Fan lo describió como un modelo que genera videos para entrenar robots. Mostró numerosos videos, todos generados por Nvidia Cosmos, explicando, "Encontramos una manera de aplicar modelos avanzados de generación de video como Cosmos para ayudar a la robótica humanoide. Así que, a un alto nivel, cómo funciona este método es que primero ajustamos finamente Cosmos en videos de robots de nuestro laboratorio para que este modelo de video ahora esté personalizado para los robots de nuestro laboratorio. Luego podemos usar este modelo ajustado finamente para generar, en principio, un número infinito de videos de sueños al solicitar al modelo de diferentes maneras. Y ahora eso se convierte en datos sintéticos para aumentar nuestros conjuntos de datos de robots reales. Como muchos de ustedes podrían saber, recolectar datos en el robot real es muy tiempo y costoso porque estás fundamentalmente limitado a 24 horas por robot por día, ¿verdad? Es un sistema físico, pero con Gr00t Dreams, este nuevo flujo de trabajo, este nuevo conjunto de algoritmos, ahora podemos romper este límite físico fundamental y luego multiplicar los datos a una escala sin precedentes a continuación."
¿El resultado? Robots que pueden recoger objetos correctamente, ya sea un pepino, verter jugo de naranja o abrir una laptop. Estas son acciones en las que el robot nunca ha sido entrenado, señaló Fan, pero gracias al entrenamiento con modelos de video, el robot puede "entender la física y el significado de estos verbos" y aprender a realizarlos.
Nuevos modelos Isaac GR00T avanzan en el desarrollo de robots humanoides
El plan de Nvidia GR00T-Dreams no es solo hablar; se ha puesto en marcha, generando datos de entrenamiento sintéticos para desarrollar GR00T N1.5 en solo 36 horas—una tarea que habría tomado casi tres meses sin el plan. GR00T N1.5 ahora puede adaptarse mejor a nuevos entornos y configuraciones de espacios de trabajo, así como reconocer objetos a través de instrucciones del usuario. Esta actualización aumenta significativamente la tasa de éxito del modelo para tareas comunes como clasificar o guardar objetos, y está listo para ser desplegado en Jetson Thor, que se lanzará más adelante este año.
El modelo de base GR00T N1.5 integra Gr00t Dreams en su pipeline de generación de datos sintéticos. Nvidia ha mejorado la columna vertebral del lenguaje visual, asegurando que GR00T N1.5 tendrá una adaptabilidad superior y una mejor conformidad con las instrucciones de lenguaje, según Fan.
GR00T N1.5 está listo para hacer su debut en Computex y se lanzará como código abierto el 9 de junio. En cuanto a Gr00t Dreams, Nvidia todavía está ajustando el calendario pero apunta a liberar tanto como sea posible en código abierto, añadió Fan.
Los primeros adoptantes de GR00T N incluyen AeiRobot, Foxlink, Lightwheel y NEURA Robotics. AeiRobot está usando el modelo para permitir que ALICE4 entienda instrucciones de lenguaje natural y ejecute flujos de trabajo de recolección y colocación complejos en entornos industriales. Foxlink Group lo está aprovechando para mejorar la flexibilidad y eficiencia de los manipuladores de robots industriales, mientras que Lightwheel está validando datos sintéticos para una implementación más rápida de robots humanoides en fábricas. NEURA Robotics está explorando el modelo para acelerar su desarrollo de automatización doméstica.
Nuevos marcos de simulación y generación de datos para robots aceleran las pipelines de entrenamiento
Crear robots humanoides altamente hábiles no se trata solo del hardware; se trata de alimentarlos con una cantidad masiva de datos diversos, lo cual puede ser costoso y llevar mucho tiempo recolectar y procesar. Además, probar robots en el mundo real conlleva sus propios desafíos y riesgos.
Para cerrar estas brechas, Nvidia introdujo varias tecnologías de simulación:
- Nvidia Cosmos Reason, un nuevo WFM que usa razonamiento en cadena de pensamientos para ayudar a curar datos sintéticos precisos y de alta calidad para el entrenamiento de modelos de IA física, ahora disponible en Hugging Face.
- Cosmos Predict 2, utilizado en GR00T Dreams, próximamente en Hugging Face con mejoras de rendimiento para la generación de mundos de alta calidad y reducción de alucinaciones.
- Nvidia Isaac GR00T-Mimic, un plan para generar cantidades exponencialmente grandes de trayectorias de movimiento sintético para la manipulación de robots, usando solo unas pocas demostraciones humanas.
- Conjunto de datos de IA física de código abierto, ahora incluyendo 24,000 trayectorias de movimiento de alta calidad de robots humanoides usadas para desarrollar modelos GR00T N.
- Nvidia Isaac Sim 5.0, un marco de simulación y generación de datos sintéticos, ahora disponible abiertamente en GitHub.
- Nvidia Isaac Lab 2.2, un marco de aprendizaje de robots de código abierto, que incluirá nuevos entornos de evaluación para ayudar a los desarrolladores a probar modelos GR00T N.
Foxconn y Foxlink ya están usando el plan GR00T-Mimic para acelerar sus pipelines de entrenamiento de robótica. Mientras tanto, Agility Robotics, Boston Dynamics, Fourier, Mentee Robotics, NEURA Robotics y XPENG Robotics están simulando y entrenando sus robots humanoides con Nvidia Isaac Sim e Isaac Lab. Skild AI está desarrollando inteligencia de robots generales con estos marcos de simulación, y General Robotics está integrándolos en su plataforma de inteligencia de robots.
Sistemas universales Blackwell para desarrolladores de robots
Los fabricantes de sistemas globales están dando un paso adelante, construyendo estaciones de trabajo y servidores Nvidia RTX PRO 6000. Estos sistemas ofrecen una arquitectura unificada que puede manejar todas las cargas de trabajo de desarrollo de robots, desde el entrenamiento y la generación de datos sintéticos hasta el aprendizaje y la simulación de robots.
Cisco, Dell Technologies, Hewlett Packard Enterprise, Lenovo y Supermicro han anunciado todos servidores potenciados por Nvidia RTX PRO 6000 Blackwell, mientras que Dell Technologies y Lenovo también han revelado estaciones de trabajo potenciadas por Nvidia RTX PRO 6000 Blackwell.
Para aquellos momentos en los que necesitas aún más poder computacional para ejecutar cargas de trabajo de entrenamiento o generación de datos a gran escala, los desarrolladores pueden recurrir a los sistemas Nvidia Blackwell como GB200 NVL72. Disponibles a través de Nvidia DGX Cloud en proveedores de nube líderes y socios de nube de Nvidia, estos sistemas prometen hasta 18 veces mayor rendimiento para el procesamiento de datos.
Artículo relacionado
華為超節點384打亂英偉達AI市場壟斷
華為在人工智慧處理架構上的突破:超節點384在人工智慧不斷發展的背景下,華為憑藉其超節點384架構在處理器設計上取得了巨大的進步。這一突破發生在中美科技緊張局勢升級的情況下,展現了華為在逆境中的韌性和創意。該發佈會於上周在深圳舉行的鯤鵬昇騰開發者大會上進行。在會議期間,公司領導展示了超節點384如何直接挑戰Nvidia在人工智慧處理器市場上的長期主導地位。在
Nvidia AI助手在Windows上新增Spotify、Twitch插件
Nvidia 將其 G-Assist AI 助理在 Windows 上提升到新的高度,不再僅限於調整遊戲和系統設置。上個月初次推出的 G-Assist 最初是一個旨在增強 PC 遊戲體驗的聊天機器人,現在則隨著插件支援的加入而進化。這次更新讓 AI 能夠擴展其功能範圍,讓你能夠控制 Spotify,檢查你喜愛的實況主是否在 Twitch 上直播,甚至監控股票
comentario (0)
0/200
Nvidia avanza a toda velocidad en el ámbito de la robótica humanoide y no se contiene. En la feria Computex 2025 en Taiwán, revelaron una serie de innovaciones que están destinadas a redefinir el panorama del desarrollo de la robótica. Entre estas, la estrella del espectáculo fue Nvidia Isaac GR00T N1.5, la última iteración del modelo de base abierto y completamente personalizable de Nvidia para el razonamiento y habilidades humanoides. Junto a él, Nvidia presentó Isaac GR00T-Dreams, un plan que está diseñado para generar datos de movimiento sintético, y los potentes sistemas Nvidia Blackwell, que están listos para acelerar el desarrollo de robots humanoides.
Numerosos desarrolladores líderes de robots humanoides y de robótica, incluyendo Agility Robotics, Boston Dynamics, Fourier, Foxlink, Galbot, Mentee Robotics, NEURA Robotics, General Robotics, Skild AI y XPENG Robotics, ya están a bordo, aprovechando las tecnologías de la plataforma Isaac de Nvidia para empujar los límites de lo posible con los robots humanoides.
Jensen Huang, CEO de Nvidia, no pudo contener su emoción, declarando: "La IA física y la robótica traerán la próxima revolución industrial. Desde cerebros de IA para robots hasta mundos simulados para practicar, o supercomputadoras de IA para entrenar modelos de base, Nvidia proporciona los bloques de construcción para cada etapa del viaje de desarrollo de la robótica."
Nuevo plan de generación de datos Isaac GR00T cierra la brecha de datos
¿Alguna vez te has preguntado sobre tener tu propio robot humanoide? Durante su discurso en Computex, Huang presentó Nvidia Isaac GR00T-Dreams, un plan revolucionario que genera grandes cantidades de datos de movimiento sintético, o trayectorias neurales. Estos datos son un tesoro para los desarrolladores de IA física, ayudándolos a enseñar a los robots una amplia gama de nuevos comportamientos y cómo adaptarse a entornos cambiantes.
El proceso comienza con los desarrolladores entrenando modelos de base del mundo Cosmos Predict (WFMs) para sus robots. Luego, con solo una imagen como entrada, GR00T-Dreams genera videos del robot enfrentando nuevas tareas en nuevos entornos. Luego extrae tokens de acción—pequeños fragmentos de datos fáciles de digerir—que los robots usan para aprender estas nuevas tareas.
GR00T-Dreams trabaja de la mano con el plan Isaac GR00T-Mimic, presentado anteriormente en la conferencia Nvidia GTC en marzo. Mientras que GR00T-Mimic aprovecha Nvidia Omniverse y Nvidia Cosmos para mejorar datos existentes, GR00T-Dreams usa Cosmos para crear datos completamente nuevos desde cero.
Jim Fan, director de IA y científico distinguido de Nvidia, compartió su entusiasmo en una conferencia de prensa, "Nvidia tiene una estrategia robótica muy fuerte, centrada en lo que Jensen llama el problema de las tres computadoras". Explicó que la computadora OVX maneja la simulación y los motores de física de simulación gráfica, generando datos que la computadora DGX luego usa para entrenar modelos de base. Estos datos luego se despliegan en la computadora HX, que dirige el espectáculo en el borde para plataformas como robots humanoides.
Fan se refirió con orgullo a Gr00t como el ciclo de vida de la IA física y los flujos de trabajo basados en robots, enfatizando, "Es una instanciación del problema de las tres computadoras". Destacó dos avances principales en el Proyecto Gr00t: Gr00t Dreams y Gr00t N1.5, añadiendo con humor que estaba bastante orgulloso de esos nombres.
Para Gr00t Dreams, Fan lo describió como un modelo que genera videos para entrenar robots. Mostró numerosos videos, todos generados por Nvidia Cosmos, explicando, "Encontramos una manera de aplicar modelos avanzados de generación de video como Cosmos para ayudar a la robótica humanoide. Así que, a un alto nivel, cómo funciona este método es que primero ajustamos finamente Cosmos en videos de robots de nuestro laboratorio para que este modelo de video ahora esté personalizado para los robots de nuestro laboratorio. Luego podemos usar este modelo ajustado finamente para generar, en principio, un número infinito de videos de sueños al solicitar al modelo de diferentes maneras. Y ahora eso se convierte en datos sintéticos para aumentar nuestros conjuntos de datos de robots reales. Como muchos de ustedes podrían saber, recolectar datos en el robot real es muy tiempo y costoso porque estás fundamentalmente limitado a 24 horas por robot por día, ¿verdad? Es un sistema físico, pero con Gr00t Dreams, este nuevo flujo de trabajo, este nuevo conjunto de algoritmos, ahora podemos romper este límite físico fundamental y luego multiplicar los datos a una escala sin precedentes a continuación."
¿El resultado? Robots que pueden recoger objetos correctamente, ya sea un pepino, verter jugo de naranja o abrir una laptop. Estas son acciones en las que el robot nunca ha sido entrenado, señaló Fan, pero gracias al entrenamiento con modelos de video, el robot puede "entender la física y el significado de estos verbos" y aprender a realizarlos.
Nuevos modelos Isaac GR00T avanzan en el desarrollo de robots humanoides
El plan de Nvidia GR00T-Dreams no es solo hablar; se ha puesto en marcha, generando datos de entrenamiento sintéticos para desarrollar GR00T N1.5 en solo 36 horas—una tarea que habría tomado casi tres meses sin el plan. GR00T N1.5 ahora puede adaptarse mejor a nuevos entornos y configuraciones de espacios de trabajo, así como reconocer objetos a través de instrucciones del usuario. Esta actualización aumenta significativamente la tasa de éxito del modelo para tareas comunes como clasificar o guardar objetos, y está listo para ser desplegado en Jetson Thor, que se lanzará más adelante este año.
El modelo de base GR00T N1.5 integra Gr00t Dreams en su pipeline de generación de datos sintéticos. Nvidia ha mejorado la columna vertebral del lenguaje visual, asegurando que GR00T N1.5 tendrá una adaptabilidad superior y una mejor conformidad con las instrucciones de lenguaje, según Fan.
GR00T N1.5 está listo para hacer su debut en Computex y se lanzará como código abierto el 9 de junio. En cuanto a Gr00t Dreams, Nvidia todavía está ajustando el calendario pero apunta a liberar tanto como sea posible en código abierto, añadió Fan.
Los primeros adoptantes de GR00T N incluyen AeiRobot, Foxlink, Lightwheel y NEURA Robotics. AeiRobot está usando el modelo para permitir que ALICE4 entienda instrucciones de lenguaje natural y ejecute flujos de trabajo de recolección y colocación complejos en entornos industriales. Foxlink Group lo está aprovechando para mejorar la flexibilidad y eficiencia de los manipuladores de robots industriales, mientras que Lightwheel está validando datos sintéticos para una implementación más rápida de robots humanoides en fábricas. NEURA Robotics está explorando el modelo para acelerar su desarrollo de automatización doméstica.
Nuevos marcos de simulación y generación de datos para robots aceleran las pipelines de entrenamiento
Crear robots humanoides altamente hábiles no se trata solo del hardware; se trata de alimentarlos con una cantidad masiva de datos diversos, lo cual puede ser costoso y llevar mucho tiempo recolectar y procesar. Además, probar robots en el mundo real conlleva sus propios desafíos y riesgos.
Para cerrar estas brechas, Nvidia introdujo varias tecnologías de simulación:
- Nvidia Cosmos Reason, un nuevo WFM que usa razonamiento en cadena de pensamientos para ayudar a curar datos sintéticos precisos y de alta calidad para el entrenamiento de modelos de IA física, ahora disponible en Hugging Face.
- Cosmos Predict 2, utilizado en GR00T Dreams, próximamente en Hugging Face con mejoras de rendimiento para la generación de mundos de alta calidad y reducción de alucinaciones.
- Nvidia Isaac GR00T-Mimic, un plan para generar cantidades exponencialmente grandes de trayectorias de movimiento sintético para la manipulación de robots, usando solo unas pocas demostraciones humanas.
- Conjunto de datos de IA física de código abierto, ahora incluyendo 24,000 trayectorias de movimiento de alta calidad de robots humanoides usadas para desarrollar modelos GR00T N.
- Nvidia Isaac Sim 5.0, un marco de simulación y generación de datos sintéticos, ahora disponible abiertamente en GitHub.
- Nvidia Isaac Lab 2.2, un marco de aprendizaje de robots de código abierto, que incluirá nuevos entornos de evaluación para ayudar a los desarrolladores a probar modelos GR00T N.
Foxconn y Foxlink ya están usando el plan GR00T-Mimic para acelerar sus pipelines de entrenamiento de robótica. Mientras tanto, Agility Robotics, Boston Dynamics, Fourier, Mentee Robotics, NEURA Robotics y XPENG Robotics están simulando y entrenando sus robots humanoides con Nvidia Isaac Sim e Isaac Lab. Skild AI está desarrollando inteligencia de robots generales con estos marcos de simulación, y General Robotics está integrándolos en su plataforma de inteligencia de robots.
Sistemas universales Blackwell para desarrolladores de robots
Los fabricantes de sistemas globales están dando un paso adelante, construyendo estaciones de trabajo y servidores Nvidia RTX PRO 6000. Estos sistemas ofrecen una arquitectura unificada que puede manejar todas las cargas de trabajo de desarrollo de robots, desde el entrenamiento y la generación de datos sintéticos hasta el aprendizaje y la simulación de robots.
Cisco, Dell Technologies, Hewlett Packard Enterprise, Lenovo y Supermicro han anunciado todos servidores potenciados por Nvidia RTX PRO 6000 Blackwell, mientras que Dell Technologies y Lenovo también han revelado estaciones de trabajo potenciadas por Nvidia RTX PRO 6000 Blackwell.
Para aquellos momentos en los que necesitas aún más poder computacional para ejecutar cargas de trabajo de entrenamiento o generación de datos a gran escala, los desarrolladores pueden recurrir a los sistemas Nvidia Blackwell como GB200 NVL72. Disponibles a través de Nvidia DGX Cloud en proveedores de nube líderes y socios de nube de Nvidia, estos sistemas prometen hasta 18 veces mayor rendimiento para el procesamiento de datos.










