Anthropic의 새로운 AI 모델은 인간과 같은 컴퓨터를 운영하며 오류가 포함되어 있습니다.

컴퓨터와 인간처럼 원활하게 상호작용할 수 있는 AI를 꿈꾼 적이 있나요? 이제 그 꿈이 Anthropic의 최신 혁신 덕분에 현실이 되었습니다. 화요일, 그들은 Claude 3.5 Sonnet이라는 새로운 세대의 Claude AI 모델을 공개했는데, 이 모델은 놀라운 정교함으로 컴퓨터를 조작할 수 있습니다. 현재 베타 모드에 있는 이 AI는 개발자들이 API를 통해 실험해볼 수 있습니다.
Anthropic은 Claude 3.5 Sonnet을 "공개 베타에서 컴퓨터 사용을 제공하는 최초의 프론티어 AI 모델"이라고 자랑스럽게 소개합니다. 이는 개발자들이 화면 보기, 커서 이동, 버튼 클릭, 심지어 가상 키보드 타이핑 등 컴퓨터에서 다양한 작업을 수행하도록 프로그래밍할 수 있다는 뜻입니다. 목표는? 우리가 매일 컴퓨터와 상호작용하는 방식을 재현하는 것입니다.
이 새로운 AI는 아직 실험 단계에 있으며, 완벽하지는 않습니다. 때때로 다소 서툴고 오류가 발생하기도 합니다. 하지만 Anthropic이 베타로 출시한 이유는 바로 개발자들로부터 소중한 피드백을 수집하고 시간이 지나면서 모델을 개선하기 위함입니다.
왜 AI의 컴퓨터 사용이 중요한가요?
Anthropic은 이에 대해 명확한 답을 제시합니다: "현대 업무의 상당 부분이 컴퓨터를 통해 이루어집니다." AI가 인간과 동일한 방식으로 소프트웨어와 상호작용할 수 있게 함으로써, 현재 AI 어시스턴트로는 처리할 수 없는 수많은 새로운 응용 프로그램을 열 수 있습니다.
개발자와 사용자는 어떤 이점을 얻을 수 있나요?
Anthropic은 각 작업마다 특정 도구를 만드는 대신, Claude에게 일반적인 컴퓨터 사용 기술을 가르치고 있습니다. 이를 통해 AI는 인간을 위해 설계된 다양한 표준 소프트웨어 프로그램을 활용할 수 있습니다. 개발자는 이 기능을 사용해 반복적인 작업을 자동화하고, 소프트웨어를 구축 및 테스트하며, 심지어 연구를 수행할 수 있습니다.
Asana, Canva, Cognition, DoorDash, Replit, The Browser Company 등 여러 기업이 이미 Claude 3.5 Sonnet의 컴퓨터 사용 능력을 활용하고 있습니다. 예를 들어, Replit은 이 기능을 사용해 Replit Agent 제품을 개선하고 있습니다.
Claude가 컴퓨터를 사용하도록 어떻게 훈련시켰나요?
Anthropic에 따르면, Claude를 컴퓨터 탐색에 훈련시키는 과정에는 많은 시행착오가 있었습니다. 이 과정은 AI가 컴퓨터 화면의 이미지를 이해하고 해석한 후, 보고 있는 내용에 따라 어떤 행동을 취할지 결정해야 합니다. Claude 3.5 Sonnet은 스크린샷을 분석하고, 픽셀을 계산해 커서를 정밀하게 이동시키며, 마우스 명령을 내리는 방식으로 이를 수행합니다.
Claude의 성능은 어느 정도인가요?
AI 모델의 컴퓨터 사용 능력을 평가하는 OSWorld 벤치마킹 테스트에서 Claude 3.5 Sonnet은 14.9%의 점수를 기록했습니다. 이는 인간 수준의 70%-75% 성능에 비하면 훨씬 낮지만, 동일 카테고리에서 다음으로 높은 AI 모델이 기록한 7.7%의 거의 두 배에 달합니다.
이러한 유망한 결과에도 불구하고, Claude의 컴퓨터 사용은 아직 초기 단계입니다. 창 드래그나 화면 확대 같은 더 복잡한 작업은 아직 수행할 수 없습니다. 또한, 스크린샷에 의존하기 때문에 특정 작업이나 알림을 놓칠 가능성도 있습니다.
Anthropic은 낙관적인 태도를 유지하며, "우리는 컴퓨터 사용이 빠르게 개선되어 더 빠르고, 더 신뢰할 수 있으며, 사용자가 원하는 작업에 더 유용해질 것으로 기대합니다."라고 밝혔습니다. 또한 기술이 발전함에 따라 소프트웨어 개발 경험이 적은 사람들에게도 더 접근 가능해지며, 엄격한 안전 조치를 유지할 것이라고 강조했습니다.
Claude 3.5 Sonnet은 이제 모두에게 접근 가능합니다. 개발자는 Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI에서 컴퓨터 사용 베타를 활용해 애플리케이션을 구축할 수 있습니다.
관련 기사
DeepSeek Code, 출시를 앞두고 있다
AI 기술이 가속화됨에 따라 DeepSeek은 흥미진진한 전환점을 맞이하고 있습니다. 이 AI 기업은 최근 700억 위안 이상의 자금을 조달했다고 밝혔습니다. 경영진은 단기적인 상업적 이익보다 획기적인 AI 연구에 전념하겠다는 의지를 강조했습니다. 이러한 전략적 전환은 DeepSeek이 새로운 제품, 특히 많은 기대를 모으고 있는 ‘DeepSeek Code
머스크의 ‘그록(Grok)’: 1조 5천억 개의 파라미터와 커서 코드 통합—게임 체인저인가, 허세인가?
일론 머스크가 드디어 움직이기 시작했다.AI 프로그래밍 경쟁에서 OpenAI와 Anthropic은 속도를 내고 있는 반면, xAI는 뒤처지는 듯하다. 머스크는 클로드(Claude)에 대항하겠다는 목표를 수차례 밝혔으나, Grok4.X 시리즈에 대한 여러 차례의 업데이트에도 불구하고 결과는 이론상으로는 좋아 보이지만 실제 적용에서는 기대에 미치지 못하며, 격
오픈AI, 알트먼 해임을 어렵게 만들기 위해 정관을 몰래 변경
2023년 쿠데타와 유사한 사건 이후, 오픈AI는 정관을 개정하여 샘 알트만 CEO에 대한 보호 장치를 한층 더 강화했다. 최근 공개된 법원 문서에 따르면, 알트만 CEO의 지위는 이제 바위처럼 견고해졌으며, 외부 간섭이나 이사회 내부의 해임 시도에 대한 방어 장벽이 훨씬 더 높아졌다.일론 머스크가 오픈AI를 상대로 제기한 소송의 전문가 증인은 이러한 변경
관련 특별 주제 추천
의견 (8)
0/500
Когда ИИ начинает делать те же ошибки, что и я в работе с компьютером, это по-своему успокаивает 😂 Меня беспокоит, насколько мы готовы доверить программному обеспечению такое прямое взаимодействие с интерфейсом. Это ведь прямая дорога как к невероятной производительности, так и к полному хаосу, если что-то пойдет не так. Кажется, пора задуматься о новых 'правилах дорожного движения' для роботов-помощников.
Этот AI, который делает ошибки, как человек, звучит одновременно и забавно, и немного тревожно 😅 Получается, мы создали идеального цифрового стажёра, который тоже путает Ctrl+C и Ctrl+V? Интересно, как это повлияет на безопасность — вдруг он случайно удалит что-то важное, пытаясь 'помочь'?
Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.

컴퓨터와 인간처럼 원활하게 상호작용할 수 있는 AI를 꿈꾼 적이 있나요? 이제 그 꿈이 Anthropic의 최신 혁신 덕분에 현실이 되었습니다. 화요일, 그들은 Claude 3.5 Sonnet이라는 새로운 세대의 Claude AI 모델을 공개했는데, 이 모델은 놀라운 정교함으로 컴퓨터를 조작할 수 있습니다. 현재 베타 모드에 있는 이 AI는 개발자들이 API를 통해 실험해볼 수 있습니다.
Anthropic은 Claude 3.5 Sonnet을 "공개 베타에서 컴퓨터 사용을 제공하는 최초의 프론티어 AI 모델"이라고 자랑스럽게 소개합니다. 이는 개발자들이 화면 보기, 커서 이동, 버튼 클릭, 심지어 가상 키보드 타이핑 등 컴퓨터에서 다양한 작업을 수행하도록 프로그래밍할 수 있다는 뜻입니다. 목표는? 우리가 매일 컴퓨터와 상호작용하는 방식을 재현하는 것입니다.
이 새로운 AI는 아직 실험 단계에 있으며, 완벽하지는 않습니다. 때때로 다소 서툴고 오류가 발생하기도 합니다. 하지만 Anthropic이 베타로 출시한 이유는 바로 개발자들로부터 소중한 피드백을 수집하고 시간이 지나면서 모델을 개선하기 위함입니다.
왜 AI의 컴퓨터 사용이 중요한가요?
Anthropic은 이에 대해 명확한 답을 제시합니다: "현대 업무의 상당 부분이 컴퓨터를 통해 이루어집니다." AI가 인간과 동일한 방식으로 소프트웨어와 상호작용할 수 있게 함으로써, 현재 AI 어시스턴트로는 처리할 수 없는 수많은 새로운 응용 프로그램을 열 수 있습니다.
개발자와 사용자는 어떤 이점을 얻을 수 있나요?
Anthropic은 각 작업마다 특정 도구를 만드는 대신, Claude에게 일반적인 컴퓨터 사용 기술을 가르치고 있습니다. 이를 통해 AI는 인간을 위해 설계된 다양한 표준 소프트웨어 프로그램을 활용할 수 있습니다. 개발자는 이 기능을 사용해 반복적인 작업을 자동화하고, 소프트웨어를 구축 및 테스트하며, 심지어 연구를 수행할 수 있습니다.
Asana, Canva, Cognition, DoorDash, Replit, The Browser Company 등 여러 기업이 이미 Claude 3.5 Sonnet의 컴퓨터 사용 능력을 활용하고 있습니다. 예를 들어, Replit은 이 기능을 사용해 Replit Agent 제품을 개선하고 있습니다.
Claude가 컴퓨터를 사용하도록 어떻게 훈련시켰나요?
Anthropic에 따르면, Claude를 컴퓨터 탐색에 훈련시키는 과정에는 많은 시행착오가 있었습니다. 이 과정은 AI가 컴퓨터 화면의 이미지를 이해하고 해석한 후, 보고 있는 내용에 따라 어떤 행동을 취할지 결정해야 합니다. Claude 3.5 Sonnet은 스크린샷을 분석하고, 픽셀을 계산해 커서를 정밀하게 이동시키며, 마우스 명령을 내리는 방식으로 이를 수행합니다.
Claude의 성능은 어느 정도인가요?
AI 모델의 컴퓨터 사용 능력을 평가하는 OSWorld 벤치마킹 테스트에서 Claude 3.5 Sonnet은 14.9%의 점수를 기록했습니다. 이는 인간 수준의 70%-75% 성능에 비하면 훨씬 낮지만, 동일 카테고리에서 다음으로 높은 AI 모델이 기록한 7.7%의 거의 두 배에 달합니다.
이러한 유망한 결과에도 불구하고, Claude의 컴퓨터 사용은 아직 초기 단계입니다. 창 드래그나 화면 확대 같은 더 복잡한 작업은 아직 수행할 수 없습니다. 또한, 스크린샷에 의존하기 때문에 특정 작업이나 알림을 놓칠 가능성도 있습니다.
Anthropic은 낙관적인 태도를 유지하며, "우리는 컴퓨터 사용이 빠르게 개선되어 더 빠르고, 더 신뢰할 수 있으며, 사용자가 원하는 작업에 더 유용해질 것으로 기대합니다."라고 밝혔습니다. 또한 기술이 발전함에 따라 소프트웨어 개발 경험이 적은 사람들에게도 더 접근 가능해지며, 엄격한 안전 조치를 유지할 것이라고 강조했습니다.
Claude 3.5 Sonnet은 이제 모두에게 접근 가능합니다. 개발자는 Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI에서 컴퓨터 사용 베타를 활용해 애플리케이션을 구축할 수 있습니다.
DeepSeek Code, 출시를 앞두고 있다
AI 기술이 가속화됨에 따라 DeepSeek은 흥미진진한 전환점을 맞이하고 있습니다. 이 AI 기업은 최근 700억 위안 이상의 자금을 조달했다고 밝혔습니다. 경영진은 단기적인 상업적 이익보다 획기적인 AI 연구에 전념하겠다는 의지를 강조했습니다. 이러한 전략적 전환은 DeepSeek이 새로운 제품, 특히 많은 기대를 모으고 있는 ‘DeepSeek Code
머스크의 ‘그록(Grok)’: 1조 5천억 개의 파라미터와 커서 코드 통합—게임 체인저인가, 허세인가?
일론 머스크가 드디어 움직이기 시작했다.AI 프로그래밍 경쟁에서 OpenAI와 Anthropic은 속도를 내고 있는 반면, xAI는 뒤처지는 듯하다. 머스크는 클로드(Claude)에 대항하겠다는 목표를 수차례 밝혔으나, Grok4.X 시리즈에 대한 여러 차례의 업데이트에도 불구하고 결과는 이론상으로는 좋아 보이지만 실제 적용에서는 기대에 미치지 못하며, 격
오픈AI, 알트먼 해임을 어렵게 만들기 위해 정관을 몰래 변경
2023년 쿠데타와 유사한 사건 이후, 오픈AI는 정관을 개정하여 샘 알트만 CEO에 대한 보호 장치를 한층 더 강화했다. 최근 공개된 법원 문서에 따르면, 알트만 CEO의 지위는 이제 바위처럼 견고해졌으며, 외부 간섭이나 이사회 내부의 해임 시도에 대한 방어 장벽이 훨씬 더 높아졌다.일론 머스크가 오픈AI를 상대로 제기한 소송의 전문가 증인은 이러한 변경
Когда ИИ начинает делать те же ошибки, что и я в работе с компьютером, это по-своему успокаивает 😂 Меня беспокоит, насколько мы готовы доверить программному обеспечению такое прямое взаимодействие с интерфейсом. Это ведь прямая дорога как к невероятной производительности, так и к полному хаосу, если что-то пойдет не так. Кажется, пора задуматься о новых 'правилах дорожного движения' для роботов-помощников.
Этот AI, который делает ошибки, как человек, звучит одновременно и забавно, и немного тревожно 😅 Получается, мы создали идеального цифрового стажёра, который тоже путает Ctrl+C и Ctrl+V? Интересно, как это повлияет на безопасность — вдруг он случайно удалит что-то важное, пытаясь 'помочь'?
Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.





집






