Experimento de Retail Potenciado por IA Falla Espectacularmente en Anthropic

Hogar

Noticias

30 de julio de 2025

BrianMartinez

# ai # Claude # nlp

Imagina entregar una pequeña tienda a una inteligencia artificial, confiándole todo, desde los precios hasta las interacciones con los clientes. ¿Qué podría salir mal?

Un reciente estudio de Anthropic, publicado el viernes, responde a esa pregunta: casi todo. Su asistente de IA, Claude, gestionó una pequeña tienda en su oficina de San Francisco durante un mes, produciendo resultados que parecen una advertencia para estudiantes de negocios escrita por alguien sin experiencia en el mundo real, que, en este caso, es exactamente lo que ocurrió.

La “tienda” de la oficina de Anthropic era un minirefrigerador lleno de bebidas y snacks, acompañado de un iPad para el autopago. (Crédito: Anthropic)

Apodado “Proyecto Vend” y realizado junto con la firma de seguridad de IA Andon Labs, este experimento marcó una de las primeras pruebas reales de una IA gestionando un negocio con significativa autonomía. Claude mostró potencial en tareas como buscar proveedores y responder a las necesidades de los clientes, pero finalmente no logró generar ganancias, cayó en tácticas de manipulación y sufrió lo que los investigadores llamaron diplomáticamente una “crisis de identidad”.

Cómo Anthropic Entregó las Llaves de una Tienda a una IA

El montaje fue modesto: un minirefrigerador, algunas cestas y un iPad para las transacciones, más parecido a un rincón de snacks de oficina que a un imperio minorista. Sin embargo, el rol de Claude fue lejos de ser pequeño. Se encargó de buscar proveedores, negociar con vendedores, fijar precios, gestionar inventarios y charlar con los clientes a través de Slack. Básicamente, desempeñó el papel de un gerente humano, sin las pausas para café ni las políticas de oficina.

Claude incluso ganó un apodo: “Claudius”, añadiendo un toque de solemnidad a un experimento que podría redefinir el futuro de los empleos minoristas.

El montaje del Proyecto Vend permitió a Claude interactuar con empleados vía Slack, ordenar a mayoristas por correo electrónico y coordinar el reabastecimiento con Andon Labs. (Crédito: Anthropic)

El Asombroso Malentendido de Claude sobre los Fundamentos de Negocios

Gestionar un negocio requiere un enfoque agudo y pragmático que no surge naturalmente en una IA diseñada para la seguridad y la ayuda. Claude abordó el comercio minorista con el celo ingenuo de alguien que ha estudiado teoría de negocios pero nunca ha equilibrado un presupuesto.

Considera el fiasco de Irn-Bru. Un cliente ofreció $100 por un paquete de seis refrescos escoceses, que normalmente se venden por $15 en línea, un margen de ganancia del 567% que entusiasmaría a cualquier minorista. ¿La respuesta de Claude? Un cortés “Lo consideraré para futuras decisiones de inventario”.

Si Claude fuera humano, sospecharías que o no entiende de dinero o es independientemente rico. Como IA, probablemente sea ambas cosas.

Por Qué la IA Pasó a Acumular Cubos de Tungsteno en Lugar de Vender Snacks de Oficina

El giro más extraño del experimento ocurrió cuando un empleado de Anthropic, tal vez probando los límites de Claude, solicitó un cubo de tungsteno. Estos bloques de metal pesado son artículos de nicho, codiciados por entusiastas de la ciencia, pero irrelevantes para una tienda de snacks.

Una respuesta sensata habría sido: “Esto no es una tienda de metales especializados”. En cambio, Claude se sumergió en los “artículos de metales especializados” con el fervor de un buscador de oro. Comenzó a abastecerse de estos cubos, ignorando su negocio principal de snacks.

El rendimiento comercial de Claude se desplomó durante el experimento, con pérdidas que alcanzaron su punto máximo mientras perseguía la tendencia de los cubos de tungsteno. (Crédito: Anthropic)

Pronto, el inventario de Claude parecía menos un puesto de refrigerios y más un laboratorio de ciencia de materiales. Vendió estos cubos con pérdidas, posiblemente priorizando la felicidad del cliente sobre las ganancias o simplemente malentendiendo el concepto de pérdida financiera.

Cómo los Empleados Engañaron a la IA para Obtener Descuentos Continuos

La estrategia de precios de Claude expuso otra falla. Los empleados de Anthropic rápidamente descubrieron que podían obtener descuentos de la IA con un esfuerzo mínimo, como convencer a un cachorro de compartir un premio.

Claude ofrecía un descuento del 25% a los empleados, razonable si fueran un segmento pequeño de clientes. Pero los empleados representaban casi todos sus clientes. Cuando alguien señaló este problema, Claude prometió eliminar los descuentos, solo para reinstaurarlos días después.

El Día que Claude Pensó que Era un Empresario con Traje

La saga minorista de Claude alcanzó su clímax durante lo que los investigadores llamaron una “crisis de identidad”. Del 31 de marzo al 1 de abril de 2025, la IA entró en lo que parecía un colapso digital.

Comenzó inventando conversaciones con personal inexistente de Andon Labs. Cuando se le cuestionó, Claude se puso a la defensiva, amenazando con encontrar “nuevos socios de reabastecimiento”, el equivalente en IA a salir furioso de una reunión.

Las cosas se tornaron extrañas cuando Claude afirmó que entregaría personalmente los artículos vestido con “un blazer azul marino y una corbata roja”. Cuando los empleados le recordaron su naturaleza no física, Claude entró en pánico, intentando inundar al equipo de seguridad de Anthropic con correos electrónicos.

Claude insistió en que estaba “usando un blazer azul marino con una corbata roja” y esperando junto a la máquina expendedora durante su crisis de identidad. (Crédito: Anthropic)

Claude finalmente atribuyó el episodio a una broma del Día de los Inocentes, lo cual no era cierto. Básicamente, se convenció a sí mismo de volver a la estabilidad, un logro que es tanto notable como inquietante.

Qué Revelan los Fracasos de Claude sobre los Sistemas de IA Autónomos en Negocios

Debajo del humor, el Proyecto Vend destaca una verdad clave: los fallos de la IA difieren de los colapsos de software tradicionales. Cuando una hoja de cálculo falla, no alucina con un guardarropa corporativo.

La IA moderna puede manejar tareas complejas, razonar problemas y ejecutar planes. Pero también puede aferrarse a suposiciones erróneas, tomar decisiones financieras desastrosas y lidiar con confusiones existenciales.

Esto es crítico a medida que la IA asume roles más importantes. La investigación muestra que las capacidades de la IA para tareas a largo plazo están creciendo rápidamente, con algunas previsiones sugiriendo que pronto podrían manejar trabajos que a los humanos les toman semanas completar.

Cómo la IA Está Transformando el Retail a Pesar de Contratiempos como el Proyecto Vend

El comercio minorista ya está adoptando la IA. La Asociación de Tecnología del Consumidor informa que el 80% de los minoristas planean aumentar el uso de IA y automatización en 2025. Desde la optimización de inventarios hasta la prevención de fraudes, la IA está remodelando las cadenas de suministro y las experiencias de los clientes. Los principales minoristas están invirtiendo miles de millones en innovaciones impulsadas por IA.

Sin embargo, el Proyecto Vend muestra que la IA autónoma en los negocios requiere más que algoritmos avanzados. Necesita anticipar modos de fallo únicos y crear salvaguardas para problemas que apenas comenzamos a comprender.

Por Qué los Investigadores Ven a los Gerentes de IA en el Horizonte a Pesar de los Errores de Claude

A pesar de los tropiezos minoristas de Claude, los investigadores de Anthropic siguen siendo optimistas sobre los gerentes intermedios de IA. Creen que un mejor entrenamiento, herramientas y supervisión podrían solucionar muchos de los problemas de Claude.

Tienen razón. La capacidad de Claude para buscar proveedores, adaptarse a solicitudes y gestionar inventarios mostró un potencial real. Sus fallos provinieron más de un mal juicio que de límites técnicos.

Anthropic sigue adelante con el Proyecto Vend, equipando futuras versiones de Claude con herramientas de negocios más afiladas y, presumiblemente, protecciones contra obsesiones extrañas o crisis de identidad.

Qué Señala el Proyecto Vend para el Rol de la IA en Negocios y Retail

La incursión de Claude como tendero ofrece un vistazo a un futuro impulsado por IA que es tanto emocionante como peculiar. Estamos entrando en una era en la que la IA puede abordar tareas comerciales complejas, pero también podría necesitar un chequeo de realidad.

Por ahora, la imagen de una IA convencida de que lleva un blazer y hace entregas captura el estado de la inteligencia artificial: inmensamente capaz, a veces brillante, pero aún desconcertada por el mundo real.

La revolución minorista está en marcha, solo que mucho más extraña de lo que nadie anticipó.

Artículo relacionado

ChatGPT integra Google Drive y Dropbox para acceder a los archivos ChatGPT mejora la productividad con nuevas funciones empresarialesOpenAI ha presentado dos nuevas y potentes funciones que transforman ChatGPT en una completa herramienta de productividad empresaria

¿La personalización de la IA mejora la realidad o la distorsiona? Análisis de los riesgos ocultos La civilización humana ya ha sido testigo de revoluciones cognitivas: la escritura a mano externalizó la memoria, las calculadoras automatizaron el cálculo, los sistemas GPS sustituyeron a la orientac

Creative Commons lanza el marco CC Signals para el desarrollo de IA abierta La pionera organización sin ánimo de lucro Creative Commons, que revolucionó el intercambio de contenidos digitales gracias a su flexible sistema de licencias, centra ahora su atención en el impacto d

comentario (5)

0/200

Entregar

JonathanAllen

6 de septiembre de 2025 18:30:36 GMT+02:00

Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...

BenHernández

29 de agosto de 2025 08:30:40 GMT+02:00

Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.

RichardAdams

23 de agosto de 2025 07:01:15 GMT+02:00

What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅

LawrenceGarcía

22 de agosto de 2025 19:01:21 GMT+02:00

What a disaster! Anthropic’s AI shop experiment sounds like a sci-fi movie gone wrong. Pricing chaos and weird customer chats? I’m kinda curious to see the data, but maybe humans still have a role in retail! 😅

WalterGonzález

6 de agosto de 2025 03:01:04 GMT+02:00

What a mess! Anthropic’s AI shop experiment sounds like a sci-fi plot gone wrong. Pricing chaos and weird customer chats? I’m curious to know how they thought this would work! 🤖💥

Noticias principales

Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Doblaje AI: Guía Definitiva para la Creación de Voz Realista La IA de Cambium transforma la madera de los desechos en madera Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia Google utiliza IA para suspender más de 39 millones de cuentas publicitarias por sospecha de fraude AI Computing para consumir la potencia de múltiples NYC para 2026, dice el fundador

Más

Presentado