옵션
뉴스
Anthropic의 새로운 AI 모델은 인간과 같은 컴퓨터를 운영하며 오류가 포함되어 있습니다.

Anthropic의 새로운 AI 모델은 인간과 같은 컴퓨터를 운영하며 오류가 포함되어 있습니다.

2025년 5월 9일
133

Anthropic의 새로운 AI 모델은 인간과 같은 컴퓨터를 운영하며 오류가 포함되어 있습니다.

컴퓨터와 인간처럼 원활하게 상호작용할 수 있는 AI를 꿈꾼 적이 있나요? 이제 그 꿈이 Anthropic의 최신 혁신 덕분에 현실이 되었습니다. 화요일, 그들은 Claude 3.5 Sonnet이라는 새로운 세대의 Claude AI 모델을 공개했는데, 이 모델은 놀라운 정교함으로 컴퓨터를 조작할 수 있습니다. 현재 베타 모드에 있는 이 AI는 개발자들이 API를 통해 실험해볼 수 있습니다.

Anthropic은 Claude 3.5 Sonnet을 "공개 베타에서 컴퓨터 사용을 제공하는 최초의 프론티어 AI 모델"이라고 자랑스럽게 소개합니다. 이는 개발자들이 화면 보기, 커서 이동, 버튼 클릭, 심지어 가상 키보드 타이핑 등 컴퓨터에서 다양한 작업을 수행하도록 프로그래밍할 수 있다는 뜻입니다. 목표는? 우리가 매일 컴퓨터와 상호작용하는 방식을 재현하는 것입니다.

이 새로운 AI는 아직 실험 단계에 있으며, 완벽하지는 않습니다. 때때로 다소 서툴고 오류가 발생하기도 합니다. 하지만 Anthropic이 베타로 출시한 이유는 바로 개발자들로부터 소중한 피드백을 수집하고 시간이 지나면서 모델을 개선하기 위함입니다.

왜 AI의 컴퓨터 사용이 중요한가요?

Anthropic은 이에 대해 명확한 답을 제시합니다: "현대 업무의 상당 부분이 컴퓨터를 통해 이루어집니다." AI가 인간과 동일한 방식으로 소프트웨어와 상호작용할 수 있게 함으로써, 현재 AI 어시스턴트로는 처리할 수 없는 수많은 새로운 응용 프로그램을 열 수 있습니다.

개발자와 사용자는 어떤 이점을 얻을 수 있나요?

Anthropic은 각 작업마다 특정 도구를 만드는 대신, Claude에게 일반적인 컴퓨터 사용 기술을 가르치고 있습니다. 이를 통해 AI는 인간을 위해 설계된 다양한 표준 소프트웨어 프로그램을 활용할 수 있습니다. 개발자는 이 기능을 사용해 반복적인 작업을 자동화하고, 소프트웨어를 구축 및 테스트하며, 심지어 연구를 수행할 수 있습니다.

Asana, Canva, Cognition, DoorDash, Replit, The Browser Company 등 여러 기업이 이미 Claude 3.5 Sonnet의 컴퓨터 사용 능력을 활용하고 있습니다. 예를 들어, Replit은 이 기능을 사용해 Replit Agent 제품을 개선하고 있습니다.

Claude가 컴퓨터를 사용하도록 어떻게 훈련시켰나요?

Anthropic에 따르면, Claude를 컴퓨터 탐색에 훈련시키는 과정에는 많은 시행착오가 있었습니다. 이 과정은 AI가 컴퓨터 화면의 이미지를 이해하고 해석한 후, 보고 있는 내용에 따라 어떤 행동을 취할지 결정해야 합니다. Claude 3.5 Sonnet은 스크린샷을 분석하고, 픽셀을 계산해 커서를 정밀하게 이동시키며, 마우스 명령을 내리는 방식으로 이를 수행합니다.

Claude의 성능은 어느 정도인가요?

AI 모델의 컴퓨터 사용 능력을 평가하는 OSWorld 벤치마킹 테스트에서 Claude 3.5 Sonnet은 14.9%의 점수를 기록했습니다. 이는 인간 수준의 70%-75% 성능에 비하면 훨씬 낮지만, 동일 카테고리에서 다음으로 높은 AI 모델이 기록한 7.7%의 거의 두 배에 달합니다.

이러한 유망한 결과에도 불구하고, Claude의 컴퓨터 사용은 아직 초기 단계입니다. 창 드래그나 화면 확대 같은 더 복잡한 작업은 아직 수행할 수 없습니다. 또한, 스크린샷에 의존하기 때문에 특정 작업이나 알림을 놓칠 가능성도 있습니다.

Anthropic은 낙관적인 태도를 유지하며, "우리는 컴퓨터 사용이 빠르게 개선되어 더 빠르고, 더 신뢰할 수 있으며, 사용자가 원하는 작업에 더 유용해질 것으로 기대합니다."라고 밝혔습니다. 또한 기술이 발전함에 따라 소프트웨어 개발 경험이 적은 사람들에게도 더 접근 가능해지며, 엄격한 안전 조치를 유지할 것이라고 강조했습니다.

Claude 3.5 Sonnet은 이제 모두에게 접근 가능합니다. 개발자는 Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI에서 컴퓨터 사용 베타를 활용해 애플리케이션을 구축할 수 있습니다.

관련 기사
엔비디아, 2분기 매출의 39%를 견인한 두 주요 고객사 보고 엔비디아, 2분기 매출의 39%를 견인한 두 주요 고객사 보고 엔비디아의 매출 집중도는 AI 붐에 대한 의존도를 강조합니다.이 칩 제조업체의 최근 SEC 제출 자료에 따르면, 익명의 고객사 두 곳이 Nvidia의 2분기 매출 467억 달러 중 39%를 차지했으며, 이는 급증하는 AI 인프라 수요에 힘입어 연간 56% 증가한 수치로 고객 집중도가 엄청나게 높은 것으로 나타났습니다.규제 문서에 따르면단일 고객("고객 A"
AI 사업 계획서 생성기: 빠른 성공 전략 수립 AI 사업 계획서 생성기: 빠른 성공 전략 수립 인공지능 솔루션이 몇 분 만에 전문가 수준의 전략 문서를 제공하는 오늘날의 기업가들은 사업 계획서를 작성하는 데 몇 주를 소비할 여유가 없습니다. 데이터를 분석하고 기회를 파악하며 기존 방식보다 빠르게 실행 가능한 계획을 생성하는 지능형 플랫폼으로 비즈니스 계획 환경이 극적으로 변화하고 있습니다. 이 가이드에서는 인공지능이 어떻게 전문적인 비즈니스 전략 개
마블, 차기 어벤져스 영화 2편 연기, 6단계 개봉 일정 조정 마블, 차기 어벤져스 영화 2편 연기, 6단계 개봉 일정 조정 마블 스튜디오는 다가오는 어벤져스 시리즈에 대한 중요한 일정 변경을 발표했습니다. 업계 전문지 할리우드 리포터에 따르면 어벤져스: 둠스데이가 당초 예정되었던 2026년 5월 1일 개봉 대신 2026년 12월 18일에 개봉할 예정이라고 밝혔습니다. 속편인 어벤져스: 시크릿 워즈는 2027년 5월 7일에서 2027년 12월 17일로 변경됩니다.스튜디오는 두 블
의견 (5)
0/200
WalterBaker
WalterBaker 2025년 8월 28일 오전 2시 1분 33초 GMT+09:00

Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!

JackWilson
JackWilson 2025년 8월 4일 오후 3시 1분 0초 GMT+09:00

This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.

JackMitchell
JackMitchell 2025년 7월 31일 오전 10시 42분 5초 GMT+09:00

Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!

JohnNelson
JohnNelson 2025년 7월 29일 오후 9시 25분 16초 GMT+09:00

Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!

JuanLewis
JuanLewis 2025년 7월 28일 오전 10시 19분 30초 GMT+09:00

This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!

위로 돌아갑니다
OR