Physical Intelligence dévoile un casque robotique capable d'apprendre des tâches inédites

Maison

Nouvelles

19 mai 2026

JimmyWilson

# Exclusive # Physical Intelligence

Physical Intelligence, une start-up de robotique fondée il y a deux ans à San Francisco et qui s'est imposée comme l'une des entreprises d'IA les plus suivies de la région de la baie de San Francisco, a publié jeudi les résultats d'une nouvelle étude. Ces résultats révèlent que son dernier modèle est capable de guider des robots pour qu'ils accomplissent des tâches pour lesquelles ils n'ont jamais été spécifiquement formés — une capacité qui, de l'aveu même des chercheurs de l'entreprise, les a pris par surprise.

Ce nouveau modèle, baptisé π0.7, marque ce que l'entreprise qualifie de première étape, bien que significative, vers la réalisation de son ambition de longue date : créer un cerveau robotique polyvalent. Ce système peut être orienté vers une tâche inconnue, recevoir des instructions en langage simple et la mener à bien. Si ces résultats résistent à un examen approfondi, ils indiquent que l'IA robotique pourrait être à l'aube d'un tournant comparable à l'évolution des grands modèles linguistiques, où les capacités commencent à se combiner d'une manière qui dépasse ce que les données de base pourraient laisser supposer.

Au cœur de l’article se trouve le concept de généralisation compositionnelle : la capacité à combiner des compétences acquises dans des contextes distincts pour résoudre des problèmes entièrement nouveaux. Traditionnellement, l’entraînement des robots repose sur la mémorisation par cœur : collecter des données pour une tâche spécifique, entraîner un modèle spécialisé sur celles-ci, puis répéter le processus pour chaque nouvelle tâche. Physical Intelligence affirme que π0.7 brise ce cycle.

« Une fois qu’il franchit le seuil qui le fait passer de la simple reproduction des données exactes sur lesquelles il a été formé à la recombinaison créative d’éléments de manière novatrice », explique Sergey Levine, cofondateur de Physical Intelligence et professeur à l’UC Berkeley spécialisé en IA pour la robotique, « les capacités commencent à augmenter à un rythme supérieur à celui de la croissance linéaire par rapport au volume de données. Cette dynamique d’échelle plus favorable est un phénomène que nous avons observé dans d’autres domaines, comme le langage et la vision. »

La démonstration la plus convaincante de l’article concerne une friteuse à air chaud à laquelle le modèle n’avait pratiquement jamais été exposé pendant l’entraînement. Après examen, l’équipe n’a trouvé que deux exemples pertinents dans l’ensemble des données : l’un où un autre robot avait simplement poussé la porte de la friteuse pour la fermer, et un autre provenant d’un ensemble de données open source où un robot avait placé une bouteille en plastique à l’intérieur de la friteuse sur commande. D'une manière ou d'une autre, le modèle a synthétisé ces fragments, ainsi que des données de pré-entraînement plus générales issues du Web, pour aboutir à une compréhension pratique du fonctionnement de l'appareil.

« Il est incroyablement difficile de déterminer exactement d’où provient cette connaissance ou de prédire où elle réussira ou échouera », note Ashwin Balakrishna, chercheur chez Physical Intelligence et doctorant en informatique à Stanford. Néanmoins, sans aucun apprentissage préalable, le modèle a fait une tentative crédible d’utiliser l’appareil pour cuire une patate douce. Lorsqu’on lui a fourni des instructions verbales étape par étape — en substance, un humain guidant le robot tout au long du processus comme on formerait un nouvel employé —, il a mené à bien la tâche.

Cette capacité d’apprentissage est importante car elle implique que les robots pourraient être déployés dans des contextes inédits et perfectionnés en temps réel, éliminant ainsi le besoin de collecte de données supplémentaires ou de réentraînement du modèle.

Quelles en sont donc les implications plus larges ? Les chercheurs sont francs quant aux limites du modèle et se gardent bien d’exagérer ses progrès. Dans au moins un cas, ils attribuent un échec directement à leur propre équipe.

« Parfois, l'échec n'est pas dû au robot ou au modèle », explique Balakrishna. « C'est de notre faute : nous ne maîtrisons pas l'ingénierie des prompts. » Il cite une première expérience avec une friteuse à air chaud qui n'avait atteint qu'un taux de réussite de 5 %. Après avoir passé environ trente minutes à affiner la manière dont la tâche était expliquée au modèle, le taux de réussite a grimpé à 95 %.

Physical Intelligence, une start-up en vogue dans le domaine de la robotique, affirme que le nouveau cerveau de son robot est capable de comprendre des tâches qui ne lui ont jamais été enseignées

Crédits images :Physical Intelligence

Le modèle n’est pas encore capable d’exécuter de manière autonome des tâches complexes en plusieurs étapes à partir d’une seule commande de haut niveau. « On ne peut pas simplement lui dire : “Va me faire un toast” », précise Levine. « Mais si on le guide à travers les étapes — “ouvre cette partie du grille-pain, appuie sur ce bouton, fais ceci” — alors il a tendance à très bien s’en sortir. »

L'équipe reconnaît également l'absence de références standardisées en robotique, ce qui complique la validation externe de leurs affirmations. À la place, l'entreprise a comparé π0.7 à ses propres modèles spécialisés antérieurs — des systèmes conçus sur mesure et entraînés pour des tâches individuelles — et a constaté que le modèle généraliste égalait leurs performances dans diverses activités complexes, notamment la préparation du café, le pliage du linge et l'assemblage de boîtes.

L’aspect le plus remarquable de cette recherche — si l’on en croit les chercheurs — n’est peut-être pas une démonstration en particulier, mais la mesure dans laquelle les résultats ont surpris ceux-là mêmes dont le métier consiste à connaître les données d’entraînement sur le bout des doigts et, par conséquent, à savoir ce dont le modèle devrait ou ne devrait pas être capable.

« D'après mon expérience, lorsque je comprends parfaitement les données, je suis généralement capable de prédire ce que le modèle sera capable de faire », explique Balakrishna. « Je suis rarement surpris. Mais ces derniers mois, c'était la première fois que j'étais véritablement déconcerté. J'ai acheté au hasard un jeu d'engrenages et j'ai demandé au robot : "Peux-tu faire tourner cet engrenage ?" Et ça a tout simplement fonctionné. »

Levine se souvient du moment où les chercheurs ont vu pour la première fois GPT-2 générer une histoire sur des licornes dans les Andes. « Mais où diable a-t-il appris l’existence de licornes au Pérou ? », s’étonne-t-il. « C’est une combinaison tellement étrange. Voir ce genre de capacité émergente en robotique est vraiment exceptionnel. »

Naturellement, les critiques souligneront une asymétrie inhérente : les modèles linguistiques ont été entraînés sur l’ensemble d’Internet. Les robots n’ont pas ce luxe, et aucune incitation, aussi astucieuse soit-elle, ne peut combler entièrement ce fossé. Cependant, lorsqu’on lui demande où il anticipe le scepticisme, Levine pointe dans une direction tout à fait différente.

« La critique que l’on peut toujours adresser à toute démonstration de généralisation robotique, c’est que les tâches semblent quelque peu banales », observe-t-il. « Le robot ne fait pas de saut périlleux arrière. » Il conteste ce point de vue, arguant que la différence entre une démonstration robotique spectaculaire et un système qui généralise véritablement est précisément le cœur du sujet. La véritable généralisation, suggère-t-il, paraîtra toujours moins spectaculaire qu’une cascade soigneusement orchestrée — mais elle est bien plus pratique.

L'article lui-même utilise un langage prudent tout au long du texte, décrivant π0.7 comme présentant des « premiers signes » de généralisation et des « démonstrations initiales » de nouvelles capacités. Il s'agit de résultats de recherche, et non d'un produit commercial, et Physical Intelligence s'est toujours montrée réservée quant à son calendrier de commercialisation.

Lorsqu’on lui demande directement quand un système basé sur ces recherches pourrait être prêt à être utilisé dans le monde réel, Levine refuse de spéculer. « Il y a de bonnes raisons d’être optimiste, et les progrès sont certainement plus rapides que ce que j’avais prévu il y a quelques années », dit-il. « Mais il m’est très difficile de donner une réponse définitive. »

À ce jour, Physical Intelligence a levé plus d’un milliard de dollars et a récemment été évaluée à 5,6 milliards de dollars. Une part importante de l’enthousiasme des investisseurs pour cette entreprise est liée au cofondateur Lachy Groom, qui a passé des années parmi les investisseurs providentiels les plus respectés de la Silicon Valley — soutenant des entreprises comme Figma, Notion et Ramp — avant de conclure que Physical Intelligence était l’aventure qu’il recherchait. Ce pedigree a aidé la start-up à attirer des financements institutionnels substantiels, même si elle s’est abstenue de fournir aux investisseurs une feuille de route spécifique pour la commercialisation.

L'entreprise serait actuellement en pourparlers pour un nouveau tour de table qui ferait presque doubler sa valorisation, la portant à 11 milliards de dollars. L'équipe n'a pas souhaité s'exprimer à ce sujet.

Article connexe

Trace a levé 3 millions de dollars pour surmonter les obstacles à l’adoption des agents intelligents d'entreprise Malgré leur potentiel, les agents intelligents ont du mal à s'imposer dans le monde des entreprises. Une start-up émergente estime que le problème fondamental réside dans le manque de contexte.Lancée au sein de la promotion d'été 2025 de Y Combinato

Hightouch atteint les 100 millions de dollars de chiffre d'affaires annuel récurrent grâce à ses outils marketing basés sur l'IA Autrefois, les spécialistes du marketing comptaient sur des graphistes et d’autres professionnels de la création pour produire des images et des vidéos destinées à des campagnes publicitaires en ligne

L'essor du gaz naturel chez Meta pourrait alimenter le réseau électrique du Dakota du Sud Les centres de données ont pris une telle ampleur que leur consommation d'électricité équivaut désormais à celle de certains États américains. Prenons l'exemple du centre de données Hyperion AI de Met

Recommandations de sujets spéciaux liés

Création de bande dessinée

Les meilleurs outils d'auto-coloration IA pour les mangas : appliquez des couleurs unies sans aucune erreur de cohérence

Découvrez les meilleurs outils d'auto-coloration IA pour mangas de 2026 sur XIX.AI. Notre sélection regroupe des solutions de premier plan qui changent la donne : elles appliquent des couleurs unies sans aucune erreur de cohérence, ce qui booste votre productivité. Consultez nos comparatifs entre versions gratuites et payantes, nos tests en conditions réelles et nos classements mis à jour chaque semaine pour trouver l'outil qui vous convient le mieux. Profitez dès aujourd'hui de l'avantage de l'IA.

10 outils

xix.ai

en écrivant

Les meilleurs créateurs de profils de fiction basés sur l'IA : générer des motivations de personnages cohérentes et des faiblesses fatales

Découvrez les meilleurs outils de création de profils de personnages basés sur l'IA de 2026 pour donner de la profondeur à vos personnages. La sélection de XIX.AI regroupe les outils les mieux notés et les plus innovants, capables de générer des motivations cohérentes et des défauts fatals. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez dès maintenant votre potentiel de narration.

10 outils

xix.ai

Entreprise

Les meilleurs logiciels d'optimisation des prix basés sur l'IA : suivez vos concurrents et ajustez automatiquement les prix de votre boutique

Découvrez les meilleurs logiciels d'optimisation des prix basés sur l'IA pour 2026 sur XIX.AI. Notre sélection comprend des outils de premier plan qui changent la donne : ils surveillent vos concurrents et ajustent automatiquement les prix de votre boutique pour maximiser vos bénéfices. Comparez les options gratuites et payantes grâce à des tests concrets. Prenez dès maintenant une longueur d'avance en matière de tarification.

10 outils

xix.ai

code

Les meilleurs outils d'analyse de code basés sur l'IA : automatisez la conformité au code propre et refactorisez les fichiers des dépôts hérités

Découvrez les meilleurs outils d'analyse de code par IA de 2026 sur XIX.AI. Notre sélection comprend des outils de premier plan, véritables révolutionnaires, permettant d'automatiser la conformité au code propre et de refactoriser les fichiers de dépôts hérités. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Prenez dès aujourd'hui une longueur d'avance grâce à l'IA.

10 outils

xix.ai

Synthèse vocale

Les meilleures applications de synthèse vocale basées sur l'IA pour la dyslexie : un soutien à l'apprentissage et à l'efficacité en lecture pour les élèves

Découvrez les meilleures applications de synthèse vocale par IA de 2026, spécialement sélectionnées pour aider les personnes dyslexiques. Notre classement d'experts compare les outils gratuits et payants, en mettant en avant des fonctionnalités performantes qui améliorent l'efficacité de la lecture et l'apprentissage. Découvrez des solutions révolutionnaires à ne pas manquer pour libérer le potentiel des élèves. Commencez votre parcours sur XIX.AI.

10 outils

xix.ai

Création de bande dessinée

Les meilleurs générateurs IA pour les mangas shonen : créez des séquences d'action survoltées et des effets d'énergie

Découvrez les meilleurs générateurs IA de mangas shonen de 2026 sur XIX.AI. Notre sélection triée sur le volet comprend des outils performants pour créer des séquences d'action à couper le souffle et des effets d'énergie dynamiques. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez votre potentiel créatif et commencez dès aujourd'hui à créer des mangas épiques !

15 outils

xix.ai