Generalist dévoile GEN-1, un modèle d'IA polyvalent destiné aux systèmes physiques

Pour développer GEN-1, Generalist a renforcé la stabilité de l'entraînement, créé des noyaux personnalisés, mis au point de nouvelles méthodes d'attention par pagination pour l'inférence en temps réel, perfectionné les techniques post-entraînement et amélioré les commandes afin d'assurer un fonctionnement plus fluide et plus précis. | Source : Generalist AI
Generalist AI Inc. a dévoilé hier son modèle d'IA polyvalent GEN-1 destiné à la robotique. L'entreprise affirme que le système porte le taux de réussite moyen des tâches à 99 %, contre 64 % avec les modèles précédents. Il accomplit également les tâches environ trois fois plus rapidement que les méthodes actuelles, en atteignant ces résultats avec seulement une heure de données robotiques par tâche, selon Generalist.
Fondée en 2024, la société développe des modèles de base incarnés pour des robots polyvalents. Basée à San Mateo, en Californie, Generalist affirme que GEN-1 « ouvre la voie à la viabilité commerciale dans un large éventail d'applications ». Cette annonce intervient cinq mois seulement après celle de son modèle GEN-0, qui, selon la société, avait confirmé l'existence de lois d'échelle en robotique.
Bien qu'optimiste quant aux progrès du modèle d'IA, Generalist a reconnu que GEN-1 ne peut pas résoudre toutes les tâches. La start-up a ajouté que certaines applications concrètes nécessiteraient des taux de réussite supérieurs à 99 % pour être réellement utiles.
Note de la rédaction : des sessions sur le développement de l’IA incarnée et physique seront proposées lors du 2026 Robotics Summit & Expo, les 27 et 28 mai à Boston. Les inscriptions sont désormais ouvertes.
GEN-1 s'entraîne sur des données du monde réel, en s'appuyant sur GEN-0
GEN-1 s'appuie sur les fondations de GEN-0 grâce à une extension supplémentaire et à des améliorations algorithmiques pour commencer à maîtriser des tâches de base, a expliqué Generalist AI. Le modèle a été entraîné à partir de zéro sur l'ensemble de données de l'entreprise, comprenant un demi-million d'heures de données du monde réel.
Avec GEN-0, Generalist a démontré que l'apprentissage des robots peut être étendu de manière généralisée, à l'instar des progrès prévisibles observés dans les modèles linguistiques. L'entreprise a noté que toutes les tâches « zero-shot » qu'elle a surveillées ont montré une amélioration simultanée. Elle a toutefois admis que les performances du modèle « n'étaient pas suffisantes pour un déploiement commercial ».
GEN-1 est le résultat d’une augmentation des données et d’une évolutivité informatique, accélérées par des avancées algorithmiques, a déclaré Generalist. L’entreprise indique que certaines tâches atteignent désormais le seuil de performance requis pour une utilisation dans le monde réel économiquement viable.
La société a souligné que les modèles de robotique générale précédents, qui atteignaient un taux de réussite supérieur à 90 %, s'appuyaient sur des ensembles de données de téléopération massifs, coûteux et difficiles à mettre à l'échelle. En revanche, le modèle de base pour GEN-0 et GEN-1 est entraîné sans aucune donnée spécifique aux robots.
Il utilise plutôt des données provenant d’appareils portables à faible coût portés par des humains effectuant des millions d’activités. Generalist affirme avoir prouvé que cette approche de pré-entraînement peut conduire à des niveaux de maîtrise élevés sans nécessiter de vastes ensembles de données de téléopération ou de simulation.
Generalist tire parti des avancées dans plusieurs technologies
Selon Generalist AI, GEN-1 intègre des innovations en matière de pré-entraînement qui améliorent l'efficacité computationnelle. Les progrès réalisés dans les techniques de post-entraînement, l'apprentissage par l'expérience (apprentissage par renforcement), le guidage humain multimodal et les nouvelles méthodes d'inférence ont également contribué à des performances supérieures pour toute tâche donnée.
Au-delà de ces améliorations, l'entreprise a déclaré que GEN-1 représente une augmentation significative de l'échelle de calcul par rapport à son prédécesseur. « Il a démontré sa capacité à apprendre rapidement de nouvelles tâches, à s'adapter à de nouveaux environnements et à faire preuve de bon sens physique », a noté Generalist.
La société affirme que GEN-1 est un apprenant économe en données. Lors de certains tests, le modèle a atteint des performances comparables à celles de GEN-0 en utilisant dix fois moins de données spécifiques à la tâche et en effectuant moins d'étapes de réglage fin.
Comme l'ensemble de données de pré-entraînement ne contient aucune donnée robotique, lorsque GEN-1 s'adapte à une nouvelle tâche, il apprend simultanément pour la première fois à la fois la configuration spécifique du robot et la tâche elle-même, a expliqué Generalist.
GEN-1 améliore la fiabilité et l'intelligence d'improvisation
« Les modèles de base incarnés doivent être fiables, rapides et capables de se remettre de situations inattendues », a déclaré Generalist. En ce qui concerne la fiabilité, l’entreprise a indiqué que GEN-1 peut effectuer plusieurs tâches avec un haut niveau de fiabilité sur de longues périodes sans intervention humaine.
L'entreprise a fait la démonstration de GEN-1 à travers six tâches : assembler des pièces automobiles pendant plus d'une heure, plier des t-shirts 86 fois de suite, entretenir des robots aspirateurs plus de 200 fois d'affilée, emballer des blocs plus de 1 800 fois consécutives, plier des boîtes plus de 200 fois successives et emballer des téléphones plus de 100 fois sans s'arrêter.
Les tâches apprises à partir de zéro, sans pré-entraînement, ont donné de mauvais résultats, avec un taux de réussite moyen de 19 %. Les modèles GEN-0 affinés pour ces tâches ont atteint un taux de réussite de 64 %. Generalist affirme que GEN-1 atteint des taux de réussite de niveau production, avec une moyenne de 99 %.
Generalist a déclaré que ces modèles peuvent réagir de manière créative à des scénarios imprévus. Dans l'exemple du kitting automobile, si une rondelle était déplacée de son alignement correct, le robot pouvait la poser pour la saisir à nouveau, l'insérer partiellement dans une fente pour faire preuve de dextérité extrinsèque, ou même utiliser son autre main pour une saisie bimanuelle.
Si de grands objets déformables, comme des t-shirts, se retrouvaient dans des configurations inattendues, le modèle pourrait trouver comment se rattraper, a déclaré Generalist. « Ces comportements s'écartent largement de la distribution d'entraînement et contribuent directement à la récupération après des événements rares et inattendus », a noté l'entreprise.
Le modèle Generalist accélère l'exécution des tâches
Generalist AI a déclaré que GEN-1 accomplit les tâches environ trois fois plus vite que l'état de l'art actuel (SOTA) lors des démonstrations. Le modèle peut réagir de manière dynamique à la physique de nouveaux objets.
Par exemple, GEN-1 peut assembler une boîte en 12,1 secondes. Generalist affirme que c'est 2,8 fois plus rapide que le SOTA précédent — GEN-0 et π0 mettaient tous deux environ 34 secondes pour des boîtes identiques. GEN-1 peut également ranger un téléphone dans un étui en 15,5 secondes, fonctionnant à une vitesse 2,8 fois supérieure à celle de GEN-0.
Selon Generalist, plusieurs éléments ont permis ces gains de vitesse. Les modèles apprennent de l'expérience et représentent une évolution dans l'inférence grâce au « Harmonic Reasoning ».
L'entreprise a également salué ses dispositifs de collecte de données, qui ont permis aux modèles d'accéder à un vaste éventail de données de pré-entraînement issues de l'exécution de diverses autres tâches à grande vitesse, transférant ainsi des connaissances acquises de manière générale vers des dynamiques pertinentes. Generalist a opposé cela aux systèmes de téléopération traditionnels, qui produisent naturellement des données plus lentes et moins fluides en raison d'un manque de retour de force, de la latence et de problèmes de visibilité.
« La création de GEN-1 a été un véritable défi : nous avons repensé notre infrastructure de formation distribuée pour prendre en charge nativement des pétaoctets de données d'interaction physique », a déclaré Generalist AI. L'entreprise a annoncé que ses partenaires bénéficiant d'un accès anticipé peuvent désormais accéder au modèle.
Article connexe
MoveIt Pro 9.0 : des mises à jour avec des fonctionnalités améliorées en matière de perception et de téléopération
Selon PickNik, MoveIt Pro 9.0 permet aux robots de travailler efficacement dans des environnements à géométrie variable et sur des surfaces variées. | Source : PickNik RoboticsPickNik Inc. a lancé Mov
SS Innovations met au point un robot chirurgical destiné à la livraison par drone
Le système de drone SSi Vimana Aero vise à fournir des soins médicaux d'urgence directement aux soldats blessés sur le champ de bataille. | Source : SS Innovations InternationalSS Innovations Internat
Le design final de la Pebble Time 2 dévoilé
Avec le retour de Pebble à ses racines, nous avons désormais un aperçu officiel de la prochaine Pebble Time 2, dont la livraison aux clients est prévue plus tard cette année. (Un premier aperçu avait
Recommandations de sujets spéciaux liés
commentaires (0)

Pour développer GEN-1, Generalist a renforcé la stabilité de l'entraînement, créé des noyaux personnalisés, mis au point de nouvelles méthodes d'attention par pagination pour l'inférence en temps réel, perfectionné les techniques post-entraînement et amélioré les commandes afin d'assurer un fonctionnement plus fluide et plus précis. | Source : Generalist AI
Generalist AI Inc. a dévoilé hier son modèle d'IA polyvalent GEN-1 destiné à la robotique. L'entreprise affirme que le système porte le taux de réussite moyen des tâches à 99 %, contre 64 % avec les modèles précédents. Il accomplit également les tâches environ trois fois plus rapidement que les méthodes actuelles, en atteignant ces résultats avec seulement une heure de données robotiques par tâche, selon Generalist.
Fondée en 2024, la société développe des modèles de base incarnés pour des robots polyvalents. Basée à San Mateo, en Californie, Generalist affirme que GEN-1 « ouvre la voie à la viabilité commerciale dans un large éventail d'applications ». Cette annonce intervient cinq mois seulement après celle de son modèle GEN-0, qui, selon la société, avait confirmé l'existence de lois d'échelle en robotique.
Bien qu'optimiste quant aux progrès du modèle d'IA, Generalist a reconnu que GEN-1 ne peut pas résoudre toutes les tâches. La start-up a ajouté que certaines applications concrètes nécessiteraient des taux de réussite supérieurs à 99 % pour être réellement utiles.
Note de la rédaction : des sessions sur le développement de l’IA incarnée et physique seront proposées lors du 2026 Robotics Summit & Expo, les 27 et 28 mai à Boston. Les inscriptions sont désormais ouvertes.
GEN-1 s'entraîne sur des données du monde réel, en s'appuyant sur GEN-0
GEN-1 s'appuie sur les fondations de GEN-0 grâce à une extension supplémentaire et à des améliorations algorithmiques pour commencer à maîtriser des tâches de base, a expliqué Generalist AI. Le modèle a été entraîné à partir de zéro sur l'ensemble de données de l'entreprise, comprenant un demi-million d'heures de données du monde réel.
Avec GEN-0, Generalist a démontré que l'apprentissage des robots peut être étendu de manière généralisée, à l'instar des progrès prévisibles observés dans les modèles linguistiques. L'entreprise a noté que toutes les tâches « zero-shot » qu'elle a surveillées ont montré une amélioration simultanée. Elle a toutefois admis que les performances du modèle « n'étaient pas suffisantes pour un déploiement commercial ».
GEN-1 est le résultat d’une augmentation des données et d’une évolutivité informatique, accélérées par des avancées algorithmiques, a déclaré Generalist. L’entreprise indique que certaines tâches atteignent désormais le seuil de performance requis pour une utilisation dans le monde réel économiquement viable.
La société a souligné que les modèles de robotique générale précédents, qui atteignaient un taux de réussite supérieur à 90 %, s'appuyaient sur des ensembles de données de téléopération massifs, coûteux et difficiles à mettre à l'échelle. En revanche, le modèle de base pour GEN-0 et GEN-1 est entraîné sans aucune donnée spécifique aux robots.
Il utilise plutôt des données provenant d’appareils portables à faible coût portés par des humains effectuant des millions d’activités. Generalist affirme avoir prouvé que cette approche de pré-entraînement peut conduire à des niveaux de maîtrise élevés sans nécessiter de vastes ensembles de données de téléopération ou de simulation.
Generalist tire parti des avancées dans plusieurs technologies
Selon Generalist AI, GEN-1 intègre des innovations en matière de pré-entraînement qui améliorent l'efficacité computationnelle. Les progrès réalisés dans les techniques de post-entraînement, l'apprentissage par l'expérience (apprentissage par renforcement), le guidage humain multimodal et les nouvelles méthodes d'inférence ont également contribué à des performances supérieures pour toute tâche donnée.
Au-delà de ces améliorations, l'entreprise a déclaré que GEN-1 représente une augmentation significative de l'échelle de calcul par rapport à son prédécesseur. « Il a démontré sa capacité à apprendre rapidement de nouvelles tâches, à s'adapter à de nouveaux environnements et à faire preuve de bon sens physique », a noté Generalist.
La société affirme que GEN-1 est un apprenant économe en données. Lors de certains tests, le modèle a atteint des performances comparables à celles de GEN-0 en utilisant dix fois moins de données spécifiques à la tâche et en effectuant moins d'étapes de réglage fin.
Comme l'ensemble de données de pré-entraînement ne contient aucune donnée robotique, lorsque GEN-1 s'adapte à une nouvelle tâche, il apprend simultanément pour la première fois à la fois la configuration spécifique du robot et la tâche elle-même, a expliqué Generalist.
GEN-1 améliore la fiabilité et l'intelligence d'improvisation
« Les modèles de base incarnés doivent être fiables, rapides et capables de se remettre de situations inattendues », a déclaré Generalist. En ce qui concerne la fiabilité, l’entreprise a indiqué que GEN-1 peut effectuer plusieurs tâches avec un haut niveau de fiabilité sur de longues périodes sans intervention humaine.
L'entreprise a fait la démonstration de GEN-1 à travers six tâches : assembler des pièces automobiles pendant plus d'une heure, plier des t-shirts 86 fois de suite, entretenir des robots aspirateurs plus de 200 fois d'affilée, emballer des blocs plus de 1 800 fois consécutives, plier des boîtes plus de 200 fois successives et emballer des téléphones plus de 100 fois sans s'arrêter.
Les tâches apprises à partir de zéro, sans pré-entraînement, ont donné de mauvais résultats, avec un taux de réussite moyen de 19 %. Les modèles GEN-0 affinés pour ces tâches ont atteint un taux de réussite de 64 %. Generalist affirme que GEN-1 atteint des taux de réussite de niveau production, avec une moyenne de 99 %.
Generalist a déclaré que ces modèles peuvent réagir de manière créative à des scénarios imprévus. Dans l'exemple du kitting automobile, si une rondelle était déplacée de son alignement correct, le robot pouvait la poser pour la saisir à nouveau, l'insérer partiellement dans une fente pour faire preuve de dextérité extrinsèque, ou même utiliser son autre main pour une saisie bimanuelle.
Si de grands objets déformables, comme des t-shirts, se retrouvaient dans des configurations inattendues, le modèle pourrait trouver comment se rattraper, a déclaré Generalist. « Ces comportements s'écartent largement de la distribution d'entraînement et contribuent directement à la récupération après des événements rares et inattendus », a noté l'entreprise.
Le modèle Generalist accélère l'exécution des tâches
Generalist AI a déclaré que GEN-1 accomplit les tâches environ trois fois plus vite que l'état de l'art actuel (SOTA) lors des démonstrations. Le modèle peut réagir de manière dynamique à la physique de nouveaux objets.
Par exemple, GEN-1 peut assembler une boîte en 12,1 secondes. Generalist affirme que c'est 2,8 fois plus rapide que le SOTA précédent — GEN-0 et π0 mettaient tous deux environ 34 secondes pour des boîtes identiques. GEN-1 peut également ranger un téléphone dans un étui en 15,5 secondes, fonctionnant à une vitesse 2,8 fois supérieure à celle de GEN-0.
Selon Generalist, plusieurs éléments ont permis ces gains de vitesse. Les modèles apprennent de l'expérience et représentent une évolution dans l'inférence grâce au « Harmonic Reasoning ».
L'entreprise a également salué ses dispositifs de collecte de données, qui ont permis aux modèles d'accéder à un vaste éventail de données de pré-entraînement issues de l'exécution de diverses autres tâches à grande vitesse, transférant ainsi des connaissances acquises de manière générale vers des dynamiques pertinentes. Generalist a opposé cela aux systèmes de téléopération traditionnels, qui produisent naturellement des données plus lentes et moins fluides en raison d'un manque de retour de force, de la latence et de problèmes de visibilité.
« La création de GEN-1 a été un véritable défi : nous avons repensé notre infrastructure de formation distribuée pour prendre en charge nativement des pétaoctets de données d'interaction physique », a déclaré Generalist AI. L'entreprise a annoncé que ses partenaires bénéficiant d'un accès anticipé peuvent désormais accéder au modèle.
SS Innovations met au point un robot chirurgical destiné à la livraison par drone
Le système de drone SSi Vimana Aero vise à fournir des soins médicaux d'urgence directement aux soldats blessés sur le champ de bataille. | Source : SS Innovations InternationalSS Innovations Internat
Le design final de la Pebble Time 2 dévoilé
Avec le retour de Pebble à ses racines, nous avons désormais un aperçu officiel de la prochaine Pebble Time 2, dont la livraison aux clients est prévue plus tard cette année. (Un premier aperçu avait





Maison






