Anthropicの新しいAIモデルは人間のようなコンピューターを操作し、エラーが含まれています

あなたは、まるで人間のようになめらかにコンピュータと対話できるAIを夢見たことがありますか?その夢が、Anthropicの最新のイノベーションによって現実になりました。火曜日に、彼らはClaude AIモデルの新世代であるClaude 3.5 Sonnetを公開しました。このAIは驚くべき精度でコンピュータを操作できます。現在ベータ版で、開発者がAPIを通じて実験することができます。
AnthropicはClaude 3.5 Sonnetを「公開ベータでコンピュータ使用を提供する初のフロンティアAIモデル」と誇らしげに称しています。これは、開発者が画面の閲覧、カーソルの操作、ボタンのクリック、仮想キーボードでの入力など、さまざまなタスクをコンピュータ上で実行するようプログラムできることを意味します。目標は?私たちが毎日コンピュータと対話する方法を再現することです。
この新しいAIはまだ実験段階にあり、完全ではありません。時折、不器用でエラーが発生することがあります。しかし、Anthropicがベータ版を公開したのは、まさに開発者からの貴重なフィードバックを集め、モデルを時間とともに改良するためです。
なぜAIがコンピュータを使うことに注目すべきか?
Anthropicはこの質問に明確な答えを持っています。「現代の仕事の膨大な量がコンピュータを通じて行われています。」AIが人間と同じようにソフトウェアと対話できるようにすることで、現在のAIアシスタントでは対応できない数多くの新しいアプリケーションが解放されます。
開発者やユーザーはどのように恩恵を受けられるのか?
各タスクごとに専用ツールを作る代わりに、AnthropicはClaudeに一般的なコンピュータスキルを教えています。これにより、AIは人間向けに設計された幅広い標準ソフトウェアプログラムを利用できます。開発者はこの機能を利用して、繰り返し作業の自動化、ソフトウェアの構築とテスト、さらには研究を行うことができます。
Asana、Canva、Cognition、DoorDash、Replit、The Browser Companyなど、すでにいくつかの企業がClaude 3.5 Sonnetのコンピュータスキルを活用しています。たとえば、Replitはこの機能を使ってReplit Agent製品を強化しています。
Claudeはどのようにしてコンピュータの使い方を学んだのか?
Anthropicによると、Claudeにコンピュータの操作を教えるには多くの試行錯誤が必要でした。このプロセスでは、AIがコンピュータ画面の画像を理解し、解釈し、見たものに基づいてどのアクションを取るかを決定する必要があります。Claude 3.5 Sonnetは、スクリーンショットを分析し、ピクセルを数えてカーソルを正確に移動させ、マウスコマンドを発行することでこれを実現します。
Claudeのパフォーマンスはどの程度か?
AIモデルのコンピュータ使用能力を評価するOSWorldベンチマークテストでは、Claude 3.5 Sonnetは14.9%のスコアを達成しました。これは人間のレベルである70%~75%に比べると大幅に低いですが、同じカテゴリーの次に優れたAIモデルの7.7%のほぼ2倍です。
これらの有望な結果にもかかわらず、Claudeのコンピュータ使用はまだ初期段階です。ウィンドウのドラッグや画面のズームインなど、より複雑なタスクはまだ実行できません。また、スクリーンショットに依存しているため、特定のアクションや通知を見逃す可能性があります。
Anthropicは楽観的で、「コンピュータ使用は急速に改善し、より速く、信頼性が高く、ユーザーが望むタスクに対してより有用になるでしょう」と述べています。また、技術が進化するにつれて、ソフトウェア開発の経験が少ない人々にもアクセスしやすくなり、厳格な安全対策を維持しながら利用可能になると強調しています。
Claude 3.5 Sonnetは今、誰でも利用可能です。開発者はAnthropic API、Amazon Bedrock、Google CloudのVertex AIでコンピュータ使用ベータを利用してアプリケーションの構築を開始できます。
関連記事
AI Comic Factory: クリエイティブAIツールで教育を革新する
今日のダイナミックな教育環境において、教育者は学生を引きつけ、創造性を刺激する革新的な方法を常に模索しています。人工知能(AI)の教育への統合は、学習体験を豊かにする変革的な機会を提供します。ChatGPTと高度なAIツールを活用したAI Comic Factoryは、魅力的でインタラクティブかつ高度にパーソナライズされた教育アプローチを提供します。このブログでは、この取り組みが学習を再定義し、創
AI駆動のネイルサロン効率化:運営と成長の促進
ビジネスのダイナミックな世界では、運営の最適化と顧客満足度の向上が成功の鍵です。Tamashi Nail Salonのようなネイルサロンは、効率を高め、コストを削減し、顧客体験を向上させるために革新的なソリューションを採用しています。人工知能(AI)は、スケジュール管理の自動化から24時間対応の顧客サポートまで、これらの課題に対処する変革的なツールを提供します。この記事では、Tamashi Nai
AIを活用した2025年の子供向け歌曲の制作と収益化
2025年、人工知能は子供向けエンターテインメントを変革しています。AIで作られた子供向け歌曲の制作は、単なる未来志向のコンセプトではなく、実際的で収益を生む機会です。このガイドでは、AIを活用して魅力的な子供向けコンテンツを作成し、YouTubeで効果的に収益化する方法を説明します。魅力的なAI子供向け歌曲の開発、チャンネルの拡大、ダイナミックなデジタルコンテンツ環境での成功方法を探ります。主な
コメント (4)
0/200
JackWilson
2025年8月4日 15:01:00 JST
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.
0
JackMitchell
2025年7月31日 10:42:05 JST
Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!
0
JohnNelson
2025年7月29日 21:25:16 JST
Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!
0
JuanLewis
2025年7月28日 10:19:30 JST
This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!
0
あなたは、まるで人間のようになめらかにコンピュータと対話できるAIを夢見たことがありますか?その夢が、Anthropicの最新のイノベーションによって現実になりました。火曜日に、彼らはClaude AIモデルの新世代であるClaude 3.5 Sonnetを公開しました。このAIは驚くべき精度でコンピュータを操作できます。現在ベータ版で、開発者がAPIを通じて実験することができます。
AnthropicはClaude 3.5 Sonnetを「公開ベータでコンピュータ使用を提供する初のフロンティアAIモデル」と誇らしげに称しています。これは、開発者が画面の閲覧、カーソルの操作、ボタンのクリック、仮想キーボードでの入力など、さまざまなタスクをコンピュータ上で実行するようプログラムできることを意味します。目標は?私たちが毎日コンピュータと対話する方法を再現することです。
この新しいAIはまだ実験段階にあり、完全ではありません。時折、不器用でエラーが発生することがあります。しかし、Anthropicがベータ版を公開したのは、まさに開発者からの貴重なフィードバックを集め、モデルを時間とともに改良するためです。
なぜAIがコンピュータを使うことに注目すべきか?
Anthropicはこの質問に明確な答えを持っています。「現代の仕事の膨大な量がコンピュータを通じて行われています。」AIが人間と同じようにソフトウェアと対話できるようにすることで、現在のAIアシスタントでは対応できない数多くの新しいアプリケーションが解放されます。
開発者やユーザーはどのように恩恵を受けられるのか?
各タスクごとに専用ツールを作る代わりに、AnthropicはClaudeに一般的なコンピュータスキルを教えています。これにより、AIは人間向けに設計された幅広い標準ソフトウェアプログラムを利用できます。開発者はこの機能を利用して、繰り返し作業の自動化、ソフトウェアの構築とテスト、さらには研究を行うことができます。
Asana、Canva、Cognition、DoorDash、Replit、The Browser Companyなど、すでにいくつかの企業がClaude 3.5 Sonnetのコンピュータスキルを活用しています。たとえば、Replitはこの機能を使ってReplit Agent製品を強化しています。
Claudeはどのようにしてコンピュータの使い方を学んだのか?
Anthropicによると、Claudeにコンピュータの操作を教えるには多くの試行錯誤が必要でした。このプロセスでは、AIがコンピュータ画面の画像を理解し、解釈し、見たものに基づいてどのアクションを取るかを決定する必要があります。Claude 3.5 Sonnetは、スクリーンショットを分析し、ピクセルを数えてカーソルを正確に移動させ、マウスコマンドを発行することでこれを実現します。
Claudeのパフォーマンスはどの程度か?
AIモデルのコンピュータ使用能力を評価するOSWorldベンチマークテストでは、Claude 3.5 Sonnetは14.9%のスコアを達成しました。これは人間のレベルである70%~75%に比べると大幅に低いですが、同じカテゴリーの次に優れたAIモデルの7.7%のほぼ2倍です。
これらの有望な結果にもかかわらず、Claudeのコンピュータ使用はまだ初期段階です。ウィンドウのドラッグや画面のズームインなど、より複雑なタスクはまだ実行できません。また、スクリーンショットに依存しているため、特定のアクションや通知を見逃す可能性があります。
Anthropicは楽観的で、「コンピュータ使用は急速に改善し、より速く、信頼性が高く、ユーザーが望むタスクに対してより有用になるでしょう」と述べています。また、技術が進化するにつれて、ソフトウェア開発の経験が少ない人々にもアクセスしやすくなり、厳格な安全対策を維持しながら利用可能になると強調しています。
Claude 3.5 Sonnetは今、誰でも利用可能です。開発者はAnthropic API、Amazon Bedrock、Google CloudのVertex AIでコンピュータ使用ベータを利用してアプリケーションの構築を開始できます。




This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.




Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!




Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!




This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!












