opción
Hogar
Última hora
Contenido
RogerMartinez
RogerMartinez
28 de mayo de 2026

X Square Robot ha hecho disponible de forma abierta el Wall-OSS-0.5, un modelo de Visión-Lenguaje-Acción para la inteligencia encarnada. Este modelo logró su implementación directa en robots reales en 17 tareas desafiantes sin necesidad de ajustes finos, alcanzando una puntuación de hasta 82 en pruebas relacionadas con objetos flexibles no previamente vistos. En comparación con el estándar industrial π0.5, superó en promedio en 17.5 puntos y mostró una mejora significativa en la precisión de sus operaciones. Entre las principales innovaciones se incluyen el método de conexión de gradientes, un tokenizador para alineamiento visual, un sistema de supervisión del espacio de acciones y un método de optimización distribuida basado en DMuon. Los pesos del modelo, el código de entrenamiento y las interfaces de los datos están completamente disponibles de forma abierta.

X Square Robot ha hecho disponible de forma abierta el Wall-OSS-0.5, un modelo de Visión-Lenguaje-Acción para la inteligencia encarnada. Este modelo logró su implementación directa en robots reales en 17 tareas desafiantes sin necesidad de ajustes finos, alcanzando una puntuación de hasta 82 en pruebas relacionadas con objetos flexibles no previamente vistos. En comparación con el estándar industrial π0.5, superó en promedio en 17.5 puntos y mostró una mejora significativa en la precisión de sus operaciones. Entre las principales innovaciones se incluyen el método de conexión de gradientes, un tokenizador para alineamiento visual, un sistema de supervisión del espacio de acciones y un método de optimización distribuida basado en DMuon. Los pesos del modelo, el código de entrenamiento y las interfaces de los datos están completamente disponibles de forma abierta.
comentario (0)
0/300
OR