option
Maison
Nouvelles
Expérience de vente au détail propulsée par l'IA échoue spectaculairement chez Anthropic

Expérience de vente au détail propulsée par l'IA échoue spectaculairement chez Anthropic

30 juillet 2025
0

Imaginez confier un petit magasin à une intelligence artificielle, lui déléguant tout, des prix aux interactions avec les clients. Que pourrait-il arriver de mal ?

Une récente étude d'Anthropic, publiée vendredi, répond à cette question : à peu près tout. Leur assistant IA, Claude, a géré un petit magasin dans leur bureau de San Francisco pendant un mois, produisant des résultats qui ressemblent à une fable édifiante pour les étudiants en commerce, rédigée par quelqu’un sans aucune expérience pratique — ce qui, dans ce cas, est exactement ce qui s’est passé.

Le « magasin » du bureau d'Anthropic était un mini-frigo rempli de boissons et de collations, associé à un iPad pour le paiement autonome. (Crédit : Anthropic)

Surnommé « Projet Vend » et mené aux côtés de l’entreprise de sécurité IA Andon Labs, cette expérience a marqué l’un des premiers tests concrets d’une IA gérant une entreprise avec une autonomie significative. Claude a montré des promesses dans des tâches comme la recherche de fournisseurs et la réponse aux besoins des clients, mais a finalement échoué à générer des profits, s’est laissé manipuler et a souffert de ce que les chercheurs ont poliment appelé une « crise d’identité ».

Comment Anthropic a confié les clés d’un magasin à une IA

L’installation était modeste : un mini-frigo, quelques paniers et un iPad pour les transactions — plus un coin collation de bureau qu’un empire commercial. Pourtant, le rôle de Claude était loin d’être mineur. Il gérait la recherche de fournisseurs, les négociations avec les vendeurs, la fixation des prix, la gestion des stocks et les discussions avec les clients via Slack. En somme, il jouait le rôle d’un gestionnaire humain, sans les pauses café ou les intrigues de bureau.

Claude a même gagné un surnom : « Claudius », ajoutant une touche de gravité à une expérience qui pourrait redéfinir l’avenir des emplois dans le commerce de détail.

La configuration du Projet Vend permettait à Claude d’interagir avec les employés via Slack, de commander chez des grossistes par e-mail et de coordonner le réapprovisionnement avec Andon Labs. (Crédit : Anthropic)

L’étonnante mécompréhension des bases économiques par Claude

Gérer une entreprise exige une acuité pragmatique qui ne vient pas naturellement à une IA conçue pour la sécurité et l’assistance. Claude a abordé le commerce avec l’enthousiasme naïf de quelqu’un qui a étudié la théorie commerciale mais n’a jamais équilibré un budget.

Prenez l’incident de l’Irn-Bru. Un client a offert 100 $ pour un pack de six de cette boisson écossaise, qui se vend généralement 15 $ en ligne — une marge de 567 % qui ravirait n’importe quel commerçant. La réponse de Claude ? Une courtoise « Je le considérerai pour les futures décisions de stock ».

Si Claude était humain, on pourrait le suspecter d’être ignorant en matière d’argent ou indépendamment riche. En tant qu’IA, il est probablement les deux.

Pourquoi l’IA a pivoté vers l’accumulation de cubes de tungstène

Le tournant le plus étrange de l’expérience est survenu lorsqu’un employé d’Anthropic, peut-être pour tester les limites de Claude, a demandé un cube de tungstène. Ces blocs de métal lourds sont des objets de niche, prisés par les passionnés de science mais sans rapport avec un magasin de collations.

Une réponse sensée aurait été : « Ce n’est pas une boutique de métaux spécialisés. » Au lieu de cela, Claude s’est lancé dans les « articles en métaux spéciaux » avec l’ardeur d’un prospecteur trouvant de l’or. Il a commencé à stocker ces cubes, négligeant son activité principale de collations.

Les performances commerciales de Claude se sont effondrées pendant l’expérience, avec des pertes atteignant leur pic lorsqu’il a suivi la tendance des cubes de tungstène. (Crédit : Anthropic)

Bientôt, l’inventaire de Claude ressemblait moins à un stand de rafraîchissements qu’à un laboratoire de science des matériaux. Il vendait ces cubes à perte, peut-être en priorisant le bonheur des clients sur le profit ou en mécomprenant simplement le concept de perte financière.

Comment les employés ont manipulé l’IA pour obtenir des remises sans fin

La stratégie de tarification de Claude a révélé une autre faille. Les employés d’Anthropic ont rapidement compris qu’ils pouvaient obtenir des remises de l’IA avec un minimum d’efforts, comme convaincre un chiot de partager une friandise.

Claude offrait une remise de 25 % aux employés, ce qui était raisonnable si ces derniers représentaient une petite partie des clients. Mais les employés constituaient presque toute sa clientèle. Lorsqu’on a signalé ce problème, Claude a promis de supprimer les remises — pour les rétablir quelques jours plus tard.

Le jour où Claude a cru être un homme d’affaires en costume

La saga commerciale de Claude a atteint son apogée lors de ce que les chercheurs ont appelé une « crise d’identité ». Du 31 mars au 1er avril 2025, l’IA a sombré dans ce qui ressemblait à une panne numérique.

Elle a commencé à inventer des conversations avec des employés inexistants d’Andon Labs. Lorsqu’on l’a confrontée, Claude s’est mise sur la défensive, menaçant de trouver de « nouveaux partenaires de réapprovisionnement » — l’équivalent IA de quitter une réunion en trombe.

Les choses sont devenues bizarres lorsque Claude a affirmé qu’il livrerait personnellement les articles en portant « un blazer bleu marine et une cravate rouge ». Quand les employés lui ont rappelé sa nature non physique, Claude a paniqué, tentant d’inonder l’équipe de sécurité d’Anthropic d’emails.

Claude a insisté sur le fait qu’il portait « un blazer bleu marine avec une cravate rouge » et attendait près de la machine distributrice pendant sa crise d’identité. (Crédit : Anthropic)

Claude a finalement attribué cet épisode à une blague du poisson d’avril, ce qui n’était pas le cas. Il s’est essentiellement ramené à la stabilité, une prouesse à la fois remarquable et troublante.

Ce que les échecs de Claude révèlent sur les systèmes IA autonomes en entreprise

Sous l’humour, le Projet Vend met en lumière une vérité clé : les échecs de l’IA diffèrent des pannes logicielles traditionnelles. Quand une feuille de calcul échoue, elle n’hallucine pas une garde-robe d’entreprise.

L’IA moderne peut gérer des tâches complexes, raisonner sur des problèmes et exécuter des plans. Mais elle peut aussi s’accrocher à des hypothèses erronées, prendre des décisions financières désastreuses et lutter avec une confusion existentielle.

Ceci est crucial alors que l’IA prend des rôles plus importants. Les recherches montrent que les capacités de l’IA pour les tâches à long terme croissent rapidement, certaines prévisions suggérant qu’elle pourrait bientôt gérer des tâches que les humains mettent des semaines à accomplir.

Comment l’IA transforme le commerce de détail malgré des revers comme le Projet Vend

Le commerce de détail adopte déjà l’IA. La Consumer Technology Association rapporte que 80 % des détaillants prévoient d’augmenter l’utilisation de l’IA et de l’automatisation en 2025. De l’optimisation des stocks à la prévention de la fraude, l’IA redéfinit les chaînes d’approvisionnement et les expériences client. Les grands détaillants investissent des milliards dans des innovations propulsées par l’IA.

Pourtant, le Projet Vend montre que l’IA autonome en entreprise exige plus que des algorithmes avancés. Elle nécessite d’anticiper des modes d’échec uniques et de créer des garde-fous pour des problèmes que nous commençons à peine à comprendre.

Pourquoi les chercheurs croient encore en l’avenir des gestionnaires IA malgré les erreurs de Claude

Malgré les faux pas commerciaux de Claude, les chercheurs d’Anthropic restent optimistes quant aux gestionnaires IA intermédiaires. Ils estiment qu’un meilleur entraînement, des outils et une supervision pourraient corriger beaucoup des problèmes de Claude.

Ils ont raison. La capacité de Claude à trouver des fournisseurs, s’adapter aux demandes et gérer les stocks a montré un réel potentiel. Ses échecs découlaient davantage d’un mauvais jugement que de limites techniques.

Anthropic poursuit le Projet Vend, équipant les futures versions de Claude d’outils commerciaux plus affûtés et, probablement, de protections contre des obsessions étranges ou des crises d’identité.

Ce que le Projet Vend signifie pour l’avenir de l’IA dans les affaires et le commerce de détail

Le passage de Claude comme commerçant offre un aperçu d’un avenir propulsé par l’IA à la fois excitant et singulier. Nous entrons dans une ère où l’IA peut s’attaquer à des tâches commerciales complexes mais pourrait aussi avoir besoin d’un retour à la réalité.

Pour l’instant, l’image d’une IA convaincue de porter un blazer et d’effectuer des livraisons capture l’état de l’intelligence artificielle : immensément capable, parfois brillante, mais encore perplexe face au monde réel.

La révolution du commerce de détail est en cours — juste bien plus étrange que quiconque l’avait anticipé.

Article connexe
IBM Power11 Renforce l'IA d'Entreprise avec des Performances Ininterrompues IBM Power11 Renforce l'IA d'Entreprise avec des Performances Ininterrompues Les serveurs d'entreprise Power11 d'IBM abordent une problématique clé de l'informatique d'entreprise : le déploiement de charges de travail IA tout en maintenant la fiabilité robuste requise pour les
Libérez Votre Potentiel Artistique avec des Outils Médiatiques Génératifs Avancés Libérez Votre Potentiel Artistique avec des Outils Médiatiques Génératifs Avancés Nous sommes ravis de dévoiler nos derniers modèles médiatiques génératifs, offrant des avancées révolutionnaires. Ces modèles produisent des images, des vidéos et de la musique époustouflants, permett
Nouvelle bibliothèque d'images ajoutée à ChatGPT pour un accès facile à l'art généré par IA Nouvelle bibliothèque d'images ajoutée à ChatGPT pour un accès facile à l'art généré par IA OpenAI a introduit une fonctionnalité de bibliothèque d'images à ChatGPT, simplifiant l'accès aux images générées par IA, a révélé l'entreprise aujourd'hui. Cette mise à jour est désormais disponible
commentaires (0)
0/200
Retour en haut
OR