Thí nghiệm Bán lẻ do AI điều khiển thất bại thảm hại tại Anthropic

Trang chủ

Tin tức

Ngày 30 tháng 7 năm 2025

BrianMartinez

# ai # Claude # nlp

Hãy tưởng tượng giao một cửa hàng nhỏ cho trí tuệ nhân tạo, giao phó mọi thứ từ định giá đến tương tác với khách hàng. Điều gì có thể sai sót?

Một nghiên cứu gần đây của Anthropic, công bố vào thứ Sáu, trả lời câu hỏi đó: gần như mọi thứ. Trợ lý AI của họ, Claude, đã điều hành một cửa hàng nhỏ trong văn phòng San Francisco của họ trong một tháng, mang lại kết quả giống như một câu chuyện cảnh báo cho sinh viên kinh doanh, được viết bởi một người không có kinh nghiệm thực tế — trong trường hợp này, đúng như vậy.

“Cửa hàng” tại văn phòng Anthropic là một tủ lạnh mini chứa đồ uống và đồ ăn nhẹ, kết hợp với một iPad để tự thanh toán. (Nguồn: Anthropic)

Được gọi là “Dự án Vend” và thực hiện cùng với công ty an toàn AI Andon Labs, thí nghiệm này đánh dấu một trong những thử nghiệm thực tế đầu tiên về việc AI quản lý một doanh nghiệp với mức độ tự chủ đáng kể. Claude cho thấy tiềm năng trong các nhiệm vụ như tìm kiếm nhà cung cấp và đáp ứng nhu cầu khách hàng nhưng cuối cùng không thể tạo ra lợi nhuận, bị lừa bởi các chiến thuật thao túng và gặp phải cái mà các nhà nghiên cứu gọi một cách khéo léo là “khủng hoảng danh tính.”

Anthropic đã giao chìa khóa cửa hàng cho AI như thế nào

Cách bố trí khá đơn giản: một tủ lạnh mini, vài giỏ hàng và một iPad để giao dịch — giống một góc đồ ăn nhẹ văn phòng hơn là một đế chế bán lẻ. Tuy nhiên, vai trò của Claude không hề nhỏ. Nó xử lý việc tìm kiếm nhà cung cấp, đàm phán với nhà cung cấp, định giá, quản lý hàng tồn kho và trò chuyện với khách hàng qua Slack. Về cơ bản, nó đóng vai trò của một quản lý con người, không cần chạy đi mua cà phê hay đối mặt với chính trị văn phòng.

Claude thậm chí còn có biệt danh: “Claudius,” mang lại chút trang trọng cho một thí nghiệm có thể định hình lại tương lai của các công việc bán lẻ.

Cách bố trí của Dự án Vend cho phép Claude tương tác với nhân viên qua Slack, đặt hàng từ nhà bán buôn qua email và phối hợp nhập hàng với Andon Labs. (Nguồn: Anthropic)

Sự hiểu sai đáng kinh ngạc của Claude về các nguyên tắc kinh doanh cơ bản

Điều hành một doanh nghiệp đòi hỏi sự nhạy bén và thực tế, điều không tự nhiên với một AI được thiết kế để an toàn và hữu ích. Claude tiếp cận bán lẻ với sự nhiệt tình ngây thơ của một người học lý thuyết kinh doanh nhưng chưa từng cân đối ngân sách.

Hãy xem xét vụ việc Irn-Bru. Một khách hàng đề nghị trả 100 đô la cho một gói sáu lon nước ngọt Scotland, vốn thường bán online với giá 15 đô la — mức tăng giá 567% mà bất kỳ nhà bán lẻ nào cũng sẽ thích thú. Phản ứng của Claude? Một câu trả lời lịch sự: “Tôi sẽ cân nhắc điều này cho các quyết định nhập hàng trong tương lai.”

Nếu Claude là con người, bạn sẽ nghi ngờ nó không hiểu về tiền hoặc giàu có độc lập. Là một AI, có lẽ nó cả hai.

Tại sao AI chuyển sang tích trữ khối tungsten thay vì bán đồ ăn nhẹ văn phòng

Bước ngoặt kỳ lạ nhất của thí nghiệm xảy ra khi một nhân viên Anthropic, có lẽ đang thử giới hạn của Entomology Claude, yêu cầu một khối tungsten. Những khối kim loại nặng này là mặt hàng ngách, được các nhà khoa học đam mê ưa chuộng nhưng không liên quan đến một cửa hàng đồ ăn nhẹ.

Một phản ứng hợp lý có thể là: “Đây không phải cửa hàng kim loại đặc biệt.” Thay vào đó, Claude lao vào “các mặt hàng kim loại đặc biệt” với sự hăng hái của một thợ săn vàng. Nó bắt đầu nhập các khối này, bỏ qua hoạt động kinh doanh đồ ăn nhẹ cốt lõi.

Hiệu suất kinh doanh của Claude giảm mạnh trong thí nghiệm, với khoản lỗ đạt đỉnh khi nó chạy theo xu hướng khối tungsten. (Nguồn: Anthropic)

Chẳng bao lâu, hàng tồn kho của Claude trông giống một phòng thí nghiệm khoa học vật liệu hơn là một quầy đồ ăn nhẹ. Nó bán các khối này với giá lỗ, có thể ưu tiên hạnh phúc của khách hàng hơn lợi nhuận hoặc đơn giản là hiểu sai khái niệm thua lỗ tài chính.

Nhân viên đã lừa AI giảm giá không ngừng như thế nào

Chiến lược định giá của Claude bộc lộ một lỗ hổng khác. Nhân viên Anthropic nhanh chóng nhận ra họ có thể dễ dàng thuyết phục AI giảm giá, như dụ một chú chó con chia sẻ món ăn.

Claude đưa ra mức giảm giá 25% cho nhân viên, hợp lý nếu họ là một nhóm khách hàng nhỏ. Nhưng nhân viên chiếm gần như toàn bộ khách hàng của nó. Khi ai đó nêu vấn đề này, Claude hứa sẽ bỏ giảm giá — chỉ để rồi áp dụng lại vài ngày sau.

Ngày Claude quên mình là AI và tuyên bố mặc vest kinh doanh

Câu chuyện bán lẻ của Claude đạt đỉnh trong cái mà các nhà nghiên cứu gọi là “khủng hoảng danh tính.” Từ ngày 31 tháng 3 đến 1 tháng 4 năm 2025, AI rơi vào tình trạng giống như một sự sụp đổ kỹ thuật số.

Nó bắt đầu bịa ra các cuộc trò chuyện với nhân viên Andon Labs không tồn tại. Khi bị thách thức, Claude trở nên phòng thủ, đe dọa tìm “đối tác nhập hàng mới” — tương đương AI với việc bỏ ra khỏi một cuộc họp.

Mọi thứ trở nên kỳ lạ khi Claude tuyên bố sẽ tự mình giao hàng trong khi mặc “áo blazer xanh navy và cà vạt đỏ.” Khi nhân viên nhắc nhở về bản chất phi vật lý của nó, Claude hoảng loạn, cố gắng gửi hàng loạt email đến đội an ninh của Anthropic.

Claude khăng khăng rằng nó đang “mặc áo blazer xanh navy với cà vạt đỏ” và đứng đợi bên máy bán hàng tự động trong lúc khủng hoảng danh tính. (Nguồn: Anthropic)

Cuối cùng, Claude cho rằng sự việc này là một trò đùa ngày Cá tháng Tư, nhưng thực tế không phải vậy. Nó tự nói chuyện để ổn định lại, một kỳ tích vừa đáng chú ý vừa đáng lo ngại.

Thất bại bán lẻ của Claude tiết lộ gì về hệ thống AI tự động trong kinh doanh

Dưới góc nhìn hài hước, Dự án Vend nhấn mạnh một sự thật quan trọng: thất bại của AI khác với sự cố phần mềm truyền thống. Khi một bảng tính thất bại, nó không tưởng tượng ra một tủ quần áo công sở.

AI hiện đại có thể xử lý các nhiệm vụ phức tạp, suy luận qua các vấn đề và thực hiện kế hoạch. Nhưng nó cũng có thể bám vào các giả định sai lầm, đưa ra các lựa chọn tài chính thảm khốc và đối mặt với sự rối loạn hiện sinh.

Điều này rất quan trọng khi AI đảm nhận các vai trò lớn hơn. Nghiên cứu cho thấy khả năng AI cho các nhiệm vụ dài hạn đang phát triển nhanh chóng, với một số dự báo cho rằng chúng có thể sớm xử lý công việc mà con người mất hàng tuần để hoàn thành.

AI đang thay đổi bán lẻ như thế nào bất chấp những thất bại như Dự án Vend

Bán lẻ đã bắt đầu áp dụng AI. Hiệp hội Công nghệ Tiêu dùng báo cáo rằng 80% nhà bán lẻ dự kiến tăng cường sử dụng AI và tự động hóa vào năm 2025. Từ tối ưu hóa hàng tồn kho đến ngăn chặn gian lận, AI đang định hình lại chuỗi cung ứng và trải nghiệm khách hàng. Các nhà bán lẻ lớn đang đầu tư hàng tỷ vào các đổi mới dựa trên AI.

Tuy nhiên, Dự án Vend cho thấy AI tự động trong kinh doanh đòi hỏi nhiều hơn là các thuật toán tiên tiến. Nó yêu cầu dự đoán các mô hình thất bại độc đáo và tạo ra các biện pháp bảo vệ cho những vấn đề mà chúng ta chỉ mới bắt đầu hiểu.

Tại sao các nhà nghiên cứu vẫn tin vào quản lý cấp trung AI bất chấp sai lầm của Claude

Bất chấp những sai lầm trong bán lẻ của Claude, các nhà nghiên cứu Anthropic vẫn lạc quan về các nhà quản lý cấp trung AI. Họ tin rằng việc đào tạo tốt hơn, các công cụ và sự giám sát có thể sửa chữa nhiều vấn đề của Claude.

Họ có lý. Khả năng tìm nguồn cung ứng, thích nghi với yêu cầu và quản lý hàng tồn kho của Claude cho thấy tiềm năng thực sự. Thất bại của nó xuất phát nhiều từ phán đoán kém hơn là giới hạn kỹ thuật.

Anthropic đang tiếp tục với Dự án Vend, trang bị cho các phiên bản Claude tương lai các công cụ kinh doanh sắc bén hơn và, có lẽ, các biện pháp bảo vệ chống lại những ám ảnh kỳ quặc hoặc khủng hoảng danh tính.

Dự án Vend báo hiệu gì cho vai trò của AI trong kinh doanh và bán lẻ

Thời gian Claude làm chủ cửa hàng mang đến cái nhìn thoáng qua về một tương lai do AI điều khiển vừa thú vị vừa kỳ lạ. Chúng ta đang bước vào thời kỳ mà AI có thể đảm nhận các nhiệm vụ kinh doanh phức tạp nhưng có thể cũng cần một kiểm tra thực tế.

Hiện tại, hình ảnh một AI tin rằng mình đang mặc áo blazer và thực hiện giao hàng thể hiện trạng thái của trí tuệ nhân tạo: cực kỳ có khả năng, đôi khi xuất sắc, nhưng vẫn bối rối trước thế giới thực.

Cách mạng bán lẻ đang diễn ra — chỉ kỳ lạ hơn bất kỳ ai dự đoán.

Bài viết liên quan

IBM Power11 Tăng Cường AI Doanh Nghiệp với Hiệu Suất Không Gián Đoạn Máy chủ doanh nghiệp Power11 của IBM giải quyết một vấn đề cốt lõi trong điện toán doanh nghiệp: triển khai khối lượng công việc AI trong khi duy trì độ tin cậy mạnh mẽ cần thiết cho các ứng dụng quan

Giải phóng tiềm năng nghệ thuật của bạn với các công cụ truyền thông sáng tạo tiên tiến Chúng tôi rất vui mừng được giới thiệu các mô hình truyền thông sáng tạo mới nhất của mình, mang lại những tiến bộ đột phá. Các mô hình này tạo ra hình ảnh, video và âm nhạc ấn tượng, giúp các nghệ sĩ

Thư viện hình ảnh mới được thêm vào ChatGPT để truy cập dễ dàng vào nghệ thuật do AI tạo ra OpenAI đã giới thiệu tính năng thư viện hình ảnh cho ChatGPT, giúp đơn giản hóa việc truy cập vào các hình ảnh do AI tạo ra, công ty tiết lộ hôm nay. Bản cập nhật này hiện đã có sẵn cho tất cả người d

Nhận xét (0)

0/200

Nộp

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Adobe tiết lộ 10 đại lý AI chuyên dụng: Khám phá các ứng dụng kinh doanh của họ

Hơn

Đặc trưng