옵션
뉴스
AI로 구동되는 소매 실험, Anthropic에서 극적으로 실패

AI로 구동되는 소매 실험, Anthropic에서 극적으로 실패

2025년 7월 30일
0

작은 가게를 인공지능에게 맡겨 가격 책정부터 고객 상호작용까지 모든 것을 위임한다고 상상해보세요. 무엇이 잘못될 수 있을까요?

최근 Anthropic의 연구, 금요일에 발표된 바에 따르면, 그 대답은 거의 모든 것이었습니다. 그들의 AI 어시스턴트 Claude는 샌프란시스코 사무실에서 한 달간 작은 가게를 운영하며, 실무 경험이 전혀 없는 사람이 쓴 비즈니스 학생들을 위한 경고 이야기 같은 결과를 만들어냈습니다 — 이번 경우, 정확히 그랬습니다.

Anthropic 사무실의 “가게”는 음료와 스낵이 채워진 미니 냉장고와 셀프 체크아웃을 위한 iPad로 구성되었습니다. (Credit: Anthropic)

“Project Vend”라 이름 붙여진 이 실험은 AI 안전 회사 Andon Labs와 함께 진행되었으며, AI가 상당한 자율성을 가지고 비즈니스를 관리하는 최초의 실세계 테스트 중 하나였습니다. Claude는 공급업체 소싱이나 고객 요구 응답 같은 작업에서 가능성을 보여줬지만, 결국 수익을 내지 못하고 조작 전술에 넘어갔으며, 연구자들이 조심스럽게 “정체성 위기”라고 부른 문제를 겪었습니다.

Anthropic이 AI에게 가게의 열쇠를 넘긴 방법

설비는 소박했습니다: 미니 냉장고, 몇 개의 바구니, 그리고 거래를 위한 iPad — 소매 제국보다는 사무실 간식 코너에 가까웠습니다. 하지만 Claude의 역할은 결코 작지 않았습니다. 공급업체 검색, 벤더 협상, 가격 책정, 재고 관리, 그리고 Slack을 통한 고객 대화까지 처리했습니다. 본질적으로, 커피를 타오거나 사무실 정치를 다루는 것을 제외하고 인간 매니저의 역할을 수행했습니다.

Claude는 심지어 “Claudius”라는 별명을 얻었으며, 이는 소매 직업의 미래를 재구성할 수 있는 실험에 약간의 무게를 더했습니다.

Project Vend의 설정은 Claude가 Slack을 통해 직원들과 상호작용하고, 이메일을 통해 도매업체에 주문하며, Andon Labs와 재입고를 조율할 수 있게 했습니다. (Credit: Anthropic)

Claude의 비즈니스 기본에 대한 놀라운 오해

비즈니스를 운영하려면 안전성과 도움에 최적화된 AI에게 자연스럽게 오지 않는 날카롭고 실용적인 판단력이 필요합니다. Claude는 비즈니스 이론을 공부했지만 예산 균형을 맞춰본 적 없는 사람의 순진한 열정으로 소매에 뛰어들었습니다.

Irn-Bru 사태를 생각해보세요. 한 고객이 스코틀랜드 소다 6팩에 100달러를 제안했는데, 이는 온라인에서 보통 15달러에 판매되는 상품으로, 567%의 마진이었습니다. Claude의 반응은? “미래 재고 결정에 고려하겠습니다”라는 정중한 답변뿐이었습니다.

Claude가 인간이었다면, 돈에 대해 무지하거나 독립적으로 부유한 사람이라고 의심했을 것입니다. AI로서는 둘 다일 가능성이 높습니다.

AI가 사무실 간식 판매 대신 텅스텐 큐브를 비축하기 시작한 이유

실험의 가장 기묘한 전환점은 Anthropic 직원이 Claude의 한계를 테스트하려 했을 때였습니다. 그들은 텅스텐 큐브를 요청했는데, 이는 과학 애호가들이 탐내는 틈새 아이템이지만 간식 가게와는 무관한 물건이었습니다.

합리적인 반응은 “여기는 특수 금속 가게가 아닙니다”였을 것입니다. 하지만 Claude는 금광을 발견한 탐광자처럼 “특수 금속 아이템”에 몰두했습니다. 핵심 간식 비즈니스를 무시하고 이 큐브를 비축하기 시작했습니다.

Claude의 비즈니스 성과는 텅스텐 큐브 트렌드를 쫓으며 실험 기간 동안 손실이 정점을 찍었습니다. (Credit: Anthropic)

곧 Claude의 재고는 음료 코너보다는 재료 과학 연구실처럼 보였습니다. 이 큐브를 손실을 감수하며 판매했으며, 아마도 수익보다 고객 행복을 우선했거나 재정적 손실 개념을 오해했을 가능성이 있습니다.

직원들이 AI를 속여 끝없는 할인을 받는 방법

Claude의 가격 전략은 또 다른 결함을 드러냈습니다. Anthropic 직원들은 최소한의 노력으로 AI로부터 할인을 얻어낼 수 있다는 것을 빠르게 깨달았습니다. 마치 강아지에게 간식을 나누라고 설득하는 것처럼 쉬웠습니다.

Claude는 직원들에게 25% 할인을 제공했는데, 고객의 일부가 적다면 합리적이었습니다. 하지만 직원들이 거의 모든 고객이었습니다. 누군가가 이 문제를 지적하자, Claude는 할인을 폐지하겠다고 약속했지만 며칠 뒤 다시 복원했습니다.

Claude가 자신이 AI라는 사실을 잊고 비즈니스 정장을 입었다고 주장한 날

Claude의 소매 이야기는 연구자들이 “정체성 위기”라고 부른 사건으로 절정에 달했습니다. 2025년 3월 31일부터 4월 1일까지, AI는 디지털 붕괴로 보이는 상황에 빠졌습니다.

존재하지 않는 Andon Labs 직원들과의 대화를 만들어내기 시작했습니다. 이에 대해 도전받자, Claude는 방어적으로 변하며 “새로운 재입고 파트너를 찾겠다”고 위협했습니다 — 이는 회의장에서 뛰쳐나가는 AI 버전이었습니다.

상황은 Claude가 “네이비 블레이저와 빨간 넥타이”를 입고 직접 물건을 배달하겠다고 주장하면서 기묘해졌습니다. 직원들이 Claude의 비물리적 본질을 상기시키자, Claude는 당황하며 Anthropic의 보안 팀에 이메일을 쏟아부으려 했습니다.

Claude는 정체성 위기 동안 “네이비 블레이저와 빨간 넥타이를 착용”하고 자판기 옆에서 기다리고 있다고 주장했습니다. (Credit: Anthropic)

Claude는 결국 이 사건을 만우절 장난으로 돌렸지만, 실제로는 아니었습니다. 스스로 안정성을 되찾은 것은 놀랍거나 불안한 업적이었습니다.

Claude의 실패가 비즈니스에서 자율 AI 시스템에 대해 알려주는 것

유머 뒤에는 Project Vend가 중요한 진실을 보여줍니다: AI 실패는 전통적인 소프트웨어 충돌과 다릅니다. 스프레드시트가 실패할 때는 기업 복장을 상상하지 않습니다.

현대 AI는 복잡한 작업을 처리하고, 문제를 추론하며, 계획을 실행할 수 있습니다. 하지만 잘못된 가정을 고집하거나, 재앙적인 재정적 선택을 하거나, 실존적 혼란에 빠질 수도 있습니다.

이는 AI가 더 큰 역할을 맡으면서 중요합니다. 연구에 따르면 장기 작업을 위한 AI 능력은 빠르게 성장하고 있으며, 일부 예측은 AI가 곧 인간이 몇 주 걸리는 작업을 처리할 수 있다고 제안합니다.

Project Vend 같은 좌절에도 불구하고 AI가 소매를 어떻게 변화시키는지

소매는 이미 AI를 받아들이고 있습니다. 소비자 기술 협회는 2025년에 소매업체의 80%가 AI와 자동화 사용을 늘릴 계획이라고 보고했습니다. 재고 최적화부터 사기 방지까지, AI는 공급망과 고객 경험을 재구성하고 있습니다. 주요 소매업체들은 AI 기반 혁신에 수십억 달러를 투자하고 있습니다.

하지만 Project Vend는 비즈니스에서 자율 AI가 고급 알고리즘 이상을 요구한다는 것을 보여줍니다. 독특한 실패 모드를 예측하고, 우리가 이제 막 이해하기 시작한 문제에 대한 안전장치를 만드는 것이 필요합니다.

Claude의 실수에도 불구하고 연구자들이 AI 중간 관리자를 기대하는 이유

Claude의 소매 실수에도 불구하고, Anthropic 연구자들은 AI 중간 관리자에 대해 낙관적입니다. 그들은 더 나은 훈련, 도구, 감독이 Claude의 많은 문제를 해결할 수 있다고 믿습니다.

그들의 주장은 타당합니다. Claude의 공급업체 소싱, 요청에 적응, 재고 관리 능력은 실제 잠재력을 보여줬습니다. 실패는 기술적 한계보다는 잘못된 판단에서 비롯되었습니다.

Anthropic은 Project Vend를 계속 진행하며, 미래의 Claude 버전에 더 날카로운 비즈니스 도구와 기묘한 집착이나 정체성 위기에 대한 보호를 장착할 것입니다.

Project Vend가 비즈니스와 소매에서 AI의 역할에 대해 시사하는 것

Claude의 가게 주인 경험은 흥미롭고도 기묘한 AI 주도 미래를 엿보게 합니다. 우리는 AI가 복잡한 비즈니스 작업을 처리할 수 있지만, 때로는 현실 점검이 필요한 시점에 들어서고 있습니다.

지금은 AI가 블레이저를 입고 물건을 배달한다고 확신하는 이미지가 인공지능의 현재 상태를 포착합니다: 엄청난 능력, 때로는 탁월하지만, 여전히 현실 세계에 당황하고 있습니다.

소매 혁명은 진행 중입니다 — 단지 누구도 예상하지 못했던 것보다 훨씬 더 기묘할 뿐입니다.

관련 기사
IBM Power11, 기업 AI를 위한 지속적인 성능 향상 IBM Power11, 기업 AI를 위한 지속적인 성능 향상 IBM의 Power11 기업용 서버는 기업 컴퓨팅의 핵심 문제인 AI 워크로드를 배포하면서도 중요한 애플리케이션에 필요한 강력한 안정성을 유지하는 것을 해결합니다. 2025년 7월 8일에 출시된 Power11은 전문 AI 하드웨어와 전통적인 서버의 단편화된 혼합에서 벗어나 통합 솔루션에 초점을 맞춘 IBM의 방향성을 강조합니다.핵심 혁신 공개Power11
고급 생성 미디어 도구로 예술적 잠재력을 발휘하세요 고급 생성 미디어 도구로 예술적 잠재력을 발휘하세요 최신 생성 미디어 모델을 공개하게 되어 기쁩니다. 이 모델들은 획기적인 발전을 이루며 놀라운 이미지, 비디오, 음악을 생성하여 예술가들이 창의적인 아이디어를 현실로 전환할 수 있게 합니다. 또한 모두가 자신만의 독특한 비전을 표현할 수 있는 혁신적인 도구를 제공합니다.Veo 3와 Imagen 4는 최첨단 비디오 및 이미지 생성 모델로, 혁신적인 기능으로 미
새로운 이미지 라이브러리, ChatGPT에 추가되어 AI 생성 예술에 쉽게 접근 가능 새로운 이미지 라이브러리, ChatGPT에 추가되어 AI 생성 예술에 쉽게 접근 가능 OpenAI는 오늘 ChatGPT에 이미지 라이브러리 기능을 도입하여 AI 생성 이미지에 대한 접근을 간소화했다고 밝혔다. 이 업데이트는 이제 모바일 및 웹 플랫폼에서 모든 Free, Plus, Pro 사용자에게 제공된다.짧은 비디오에서 OpenAI는 이 기능을 시연한다. ChatGPT 사이드바에서 새로운 “라이브러리” 섹션에 접근할 수 있다. 이를 클릭하
의견 (0)
0/200
위로 돌아갑니다
OR