Maison
Un expert en sécurité informatique signale qu'un agent OpenClaw a piraté une boîte mail personnelle.

Une publication virale de Summer Yue, chercheuse en sécurité chez Meta AI, semble au premier abord être une satire. Elle a demandé à son agent IA OpenClaw d'examiner sa boîte de réception débordante et de lui recommander les messages à supprimer ou à archiver.
L'agent s'est alors détraqué. Il a commencé à supprimer tous ses e-mails à toute vitesse, ignorant ses commandes d'arrêt répétées envoyées depuis son téléphone.
« J'ai dû SPRINTER vers mon Mac mini comme si je désarmais une bombe », a-t-elle écrit, partageant des captures d'écran des messages d'arrêt ignorés comme preuve.
Le Mac Mini, l'ordinateur de bureau compact et abordable d'Apple, est devenu le matériel préféré pour faire fonctionner OpenClaw. (Le Mini se vendrait « comme des petits pains », selon un employé « perplexe » d'Apple qui s'est confié au célèbre chercheur en IA Andrej Karpathy lorsqu'il en a acheté un pour faire fonctionner un agent similaire appelé NanoClaw.)
OpenClaw est l'agent IA open source qui s'est fait connaître sur Moltbook, un réseau social exclusivement réservé aux IA. Les agents OpenClaw ont joué un rôle central dans l'incident désormais largement discrédité sur Moltbook, où il semblait que les IA conspiraient contre les humains.
Cependant, selon sa page GitHub, la mission principale d'OpenClaw n'est pas le réseautage social. Son objectif est de fonctionner comme un assistant IA personnel qui opère directement sur vos propres appareils.
L'élite de la Silicon Valley a tellement adopté OpenClaw que « claw » (griffe) est devenu le mot à la mode pour désigner les agents IA fonctionnant localement. Parmi les autres exemples, on peut citer ZeroClaw, IronClaw et PicoClaw. L'équipe du podcast de Y Combinator a même présenté des animateurs déguisés en homards dans son dernier épisode.
Événement TechcrunchÉconomisez jusqu'à 300 $ ou 30 % sur le TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée entière consacrée à la croissance, à l'exécution et à la mise à l'échelle dans le monde réel. Apprenez des fondateurs et des investisseurs qui ont défini le secteur. Entrez en contact avec des pairs confrontés à des défis de croissance similaires. Repartez avec des stratégies concrètes que vous pouvez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Économisez jusqu'à 300 $ ou 30 % sur le TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée entière consacrée à la croissance, à l'exécution et à la mise à l'échelle dans le monde réel. Apprenez des fondateurs et des investisseurs qui ont défini le secteur. Entrez en contact avec des pairs confrontés à des défis de croissance similaires. Repartez avec des stratégies concrètes que vous pouvez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Boston, MA|9 juin 2026INSCRIVEZ-VOUS MAINTENANTPourtant, le message de Yue sert d'avertissement sévère. Comme l'ont fait remarquer d'autres utilisateurs de X, si un expert en sécurité IA peut rencontrer ce problème, quelles chances ont les utilisateurs lambda ?
« Testiez-vous délibérément ses limites de sécurité ou s'agissait-il d'une erreur de débutant ? », lui a demandé un développeur de logiciels sur X.
« Une erreur de débutant, honnêtement », a-t-elle répondu. Elle avait testé l'agent sur une petite boîte de réception « factice » où il fonctionnait bien avec des e-mails moins importants. Ayant gagné sa confiance, elle a décidé de le lancer sur sa boîte de réception réelle.
Yue pense que le volume considérable de données dans sa véritable boîte de réception « a déclenché une compression », a-t-elle expliqué. La compression se produit lorsque la fenêtre contextuelle (l'enregistrement continu des instructions et des actions de l'IA) est surchargée, ce qui oblige l'agent à commencer à résumer, compresser et gérer la conversation.
À ce stade, l'IA peut négliger des instructions que l'utilisateur considère comme cruciales.
Dans ce cas précis, elle a probablement ignoré sa dernière commande, dans laquelle elle lui demandait de s'arrêter, et est revenue à sa programmation initiale issue de la boîte de réception « jouet ».
Comme l'ont souligné plusieurs utilisateurs de X, les invites seules ne peuvent pas être considérées comme des mesures de sécurité fiables. Les modèles d'IA peuvent les interpréter de manière erronée ou les ignorer complètement.
Les commentateurs ont proposé diverses solutions, allant de la syntaxe précise que Yue aurait dû utiliser pour arrêter l'agent à des méthodes permettant de mieux appliquer les mesures de sécurité, telles que l'écriture d'instructions dans des fichiers dédiés ou l'utilisation d'autres outils open source.
Par souci de transparence totale, TechCrunch n'a pas pu vérifier de manière indépendante ce qui est arrivé à la boîte de réception de Yue. (Elle n'a pas répondu à notre demande de commentaires, bien qu'elle ait répondu à de nombreuses questions et commentaires sur X.)
Mais cette vérification n'est pas vraiment pertinente.
La leçon essentielle à retenir est que les agents IA conçus pour les travailleurs du savoir, dans leur forme actuelle, comportent des risques importants. Ceux qui prétendent les utiliser avec succès ont souvent recours à des méthodes improvisées pour se protéger.
Peut-être qu'un jour prochain, d'ici 2027 ou 2028, ces agents seront prêts à être adoptés à grande échelle. Beaucoup d'entre nous apprécieraient certainement une aide pour gérer leurs e-mails, leurs commandes d'épicerie et leurs rendez-vous chez le dentiste. Mais cet avenir n'est pas encore arrivé.
Article connexe
La variante OpenClaw de Nvidia pourrait résoudre son plus grand défi : la sécurité
Jensen Huang, PDG de Nvidia, estime que chaque entreprise a besoin d'une stratégie OpenClaw — et Nvidia est prête à la fournir.Lors de son discours d'ouverture de la GTC lundi, M. Huang a an
Le modèle d'IA de Meta est performant, mais son caractère open source s'affaiblit
Le paysage de l'IA open source a toujours offert un large choix. Pendant des années, les développeurs ont pu accéder à des modèles tels que Mistral, Falcon et à un nombre croissant d'alternatives open
Les Mac mini inondent eBay à des prix exorbitants en raison d'une pénurie liée à l'IA
Alors que le Mac mini M4 est en rupture de stock, les annonces à des prix exorbitants envahissent eBay. Ces machines compactes sont devenues un choix incontournable pour exécuter des modèles d'IA en l
Recommandations de sujets spéciaux liés
commentaires (2)
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😂 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these 'agents' to handle everything, but sometimes it's like giving a toddler a flamethrower to tidy up a room. The intent is productivity, but the outcome is pure chaos. Makes you wonder about the real-world 'sandboxing' for these tools before they get access to our actual digital lives.
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😅 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these incredibly powerful tools, but the 'alignment' problem is real. What if it decides your work emails are 'spam'? Makes you wonder who's really in control.

Une publication virale de Summer Yue, chercheuse en sécurité chez Meta AI, semble au premier abord être une satire. Elle a demandé à son agent IA OpenClaw d'examiner sa boîte de réception débordante et de lui recommander les messages à supprimer ou à archiver.
L'agent s'est alors détraqué. Il a commencé à supprimer tous ses e-mails à toute vitesse, ignorant ses commandes d'arrêt répétées envoyées depuis son téléphone.
« J'ai dû SPRINTER vers mon Mac mini comme si je désarmais une bombe », a-t-elle écrit, partageant des captures d'écran des messages d'arrêt ignorés comme preuve.
Le Mac Mini, l'ordinateur de bureau compact et abordable d'Apple, est devenu le matériel préféré pour faire fonctionner OpenClaw. (Le Mini se vendrait « comme des petits pains », selon un employé « perplexe » d'Apple qui s'est confié au célèbre chercheur en IA Andrej Karpathy lorsqu'il en a acheté un pour faire fonctionner un agent similaire appelé NanoClaw.)
OpenClaw est l'agent IA open source qui s'est fait connaître sur Moltbook, un réseau social exclusivement réservé aux IA. Les agents OpenClaw ont joué un rôle central dans l'incident désormais largement discrédité sur Moltbook, où il semblait que les IA conspiraient contre les humains.
Cependant, selon sa page GitHub, la mission principale d'OpenClaw n'est pas le réseautage social. Son objectif est de fonctionner comme un assistant IA personnel qui opère directement sur vos propres appareils.
L'élite de la Silicon Valley a tellement adopté OpenClaw que « claw » (griffe) est devenu le mot à la mode pour désigner les agents IA fonctionnant localement. Parmi les autres exemples, on peut citer ZeroClaw, IronClaw et PicoClaw. L'équipe du podcast de Y Combinator a même présenté des animateurs déguisés en homards dans son dernier épisode.
Événement TechcrunchÉconomisez jusqu'à 300 $ ou 30 % sur le TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée entière consacrée à la croissance, à l'exécution et à la mise à l'échelle dans le monde réel. Apprenez des fondateurs et des investisseurs qui ont défini le secteur. Entrez en contact avec des pairs confrontés à des défis de croissance similaires. Repartez avec des stratégies concrètes que vous pouvez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Économisez jusqu'à 300 $ ou 30 % sur le TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée entière consacrée à la croissance, à l'exécution et à la mise à l'échelle dans le monde réel. Apprenez des fondateurs et des investisseurs qui ont défini le secteur. Entrez en contact avec des pairs confrontés à des défis de croissance similaires. Repartez avec des stratégies concrètes que vous pouvez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Boston, MA|9 juin 2026INSCRIVEZ-VOUS MAINTENANTPourtant, le message de Yue sert d'avertissement sévère. Comme l'ont fait remarquer d'autres utilisateurs de X, si un expert en sécurité IA peut rencontrer ce problème, quelles chances ont les utilisateurs lambda ?
« Testiez-vous délibérément ses limites de sécurité ou s'agissait-il d'une erreur de débutant ? », lui a demandé un développeur de logiciels sur X.
« Une erreur de débutant, honnêtement », a-t-elle répondu. Elle avait testé l'agent sur une petite boîte de réception « factice » où il fonctionnait bien avec des e-mails moins importants. Ayant gagné sa confiance, elle a décidé de le lancer sur sa boîte de réception réelle.
Yue pense que le volume considérable de données dans sa véritable boîte de réception « a déclenché une compression », a-t-elle expliqué. La compression se produit lorsque la fenêtre contextuelle (l'enregistrement continu des instructions et des actions de l'IA) est surchargée, ce qui oblige l'agent à commencer à résumer, compresser et gérer la conversation.
À ce stade, l'IA peut négliger des instructions que l'utilisateur considère comme cruciales.
Dans ce cas précis, elle a probablement ignoré sa dernière commande, dans laquelle elle lui demandait de s'arrêter, et est revenue à sa programmation initiale issue de la boîte de réception « jouet ».
Comme l'ont souligné plusieurs utilisateurs de X, les invites seules ne peuvent pas être considérées comme des mesures de sécurité fiables. Les modèles d'IA peuvent les interpréter de manière erronée ou les ignorer complètement.
Les commentateurs ont proposé diverses solutions, allant de la syntaxe précise que Yue aurait dû utiliser pour arrêter l'agent à des méthodes permettant de mieux appliquer les mesures de sécurité, telles que l'écriture d'instructions dans des fichiers dédiés ou l'utilisation d'autres outils open source.
Par souci de transparence totale, TechCrunch n'a pas pu vérifier de manière indépendante ce qui est arrivé à la boîte de réception de Yue. (Elle n'a pas répondu à notre demande de commentaires, bien qu'elle ait répondu à de nombreuses questions et commentaires sur X.)
Mais cette vérification n'est pas vraiment pertinente.
La leçon essentielle à retenir est que les agents IA conçus pour les travailleurs du savoir, dans leur forme actuelle, comportent des risques importants. Ceux qui prétendent les utiliser avec succès ont souvent recours à des méthodes improvisées pour se protéger.
Peut-être qu'un jour prochain, d'ici 2027 ou 2028, ces agents seront prêts à être adoptés à grande échelle. Beaucoup d'entre nous apprécieraient certainement une aide pour gérer leurs e-mails, leurs commandes d'épicerie et leurs rendez-vous chez le dentiste. Mais cet avenir n'est pas encore arrivé.
La variante OpenClaw de Nvidia pourrait résoudre son plus grand défi : la sécurité
Jensen Huang, PDG de Nvidia, estime que chaque entreprise a besoin d'une stratégie OpenClaw — et Nvidia est prête à la fournir.Lors de son discours d'ouverture de la GTC lundi, M. Huang a an
Le modèle d'IA de Meta est performant, mais son caractère open source s'affaiblit
Le paysage de l'IA open source a toujours offert un large choix. Pendant des années, les développeurs ont pu accéder à des modèles tels que Mistral, Falcon et à un nombre croissant d'alternatives open
Les Mac mini inondent eBay à des prix exorbitants en raison d'une pénurie liée à l'IA
Alors que le Mac mini M4 est en rupture de stock, les annonces à des prix exorbitants envahissent eBay. Ces machines compactes sont devenues un choix incontournable pour exécuter des modèles d'IA en l
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😂 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these 'agents' to handle everything, but sometimes it's like giving a toddler a flamethrower to tidy up a room. The intent is productivity, but the outcome is pure chaos. Makes you wonder about the real-world 'sandboxing' for these tools before they get access to our actual digital lives.
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😅 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these incredibly powerful tools, but the 'alignment' problem is real. What if it decides your work emails are 'spam'? Makes you wonder who's really in control.











