Anthropicの新しいAIモデルは人間のようなコンピューターを操作し、エラーが含まれています

人間のように、コンピューターとシームレスに対話できるAIを夢見たことはありますか?まあ、その夢は今や現実になっています。人類の最新の革新のおかげで。火曜日に、彼らはClaude 3.5 Sonnetという名前の新しい世代のClaude AIモデルを発表しました。現在、ベータモードでは、このAIは開発者がAPIを介して実験できるようにしています。
人類は、「パブリックベータ版でのコンピューター使用を提供する最初のフロンティアAIモデル」として、Claude 3.5 Sonnetを誇らしげにラベル付けしています。つまり、開発者は、画面の表示、カーソルの操作、ボタンのクリック、仮想キーボードでの入力など、コンピューターでさまざまなタスクを実行するようにプログラムできます。目標?毎日コンピューターと対話する方法を再現します。
今、この新しいAIはまだ実験段階にありますが、そのしゃったものがないわけではありません。それは少し不器用でエラーが発生しやすい場合があります。しかし、それがまさに人類がベータ版でそれをリリースした理由です。開発者からの貴重なフィードバックを収集し、時間の経過とともにモデルを改良します。
コンピューターを使用してAIを気にする必要があるのはなぜですか?
人類はその質問に対する明確な答えを持っています:「コンピューターを介して膨大な量の現代の仕事が起こります」。 AIが人間と同じようにソフトウェアと対話できるようにすることにより、現在のAIアシスタントが処理できない多くの新しいアプリケーションのロックを解除します。
開発者とユーザーはどのように利益を得ることができますか?
タスクごとに特定のツールを作成する代わりに、AnthropicはClaudeの一般的なコンピュータースキルを教えています。これにより、AIは人間向けに設計された幅広い標準ソフトウェアプログラムを利用できます。開発者は、この機能を活用して、繰り返しタスクを自動化し、ソフトウェアを構築およびテストし、さらには研究を実施できます。
いくつかの企業は、Asana、Canva、Cognition、Doordash、Replit、The Browser Companyなど、Claude 3.5 Sonnetのコンピュータースキルをすでに活用しています。たとえば、Replitはこれらの機能を使用して、レプリットエージェント製品を強化しています。
彼らはどのようにしてクロードをコンピューターを使用するように訓練しましたか?
人類によると、コンピューターをナビゲートするためのクロードのトレーニングには、多くの試行錯誤が含まれていました。このプロセスでは、AIがコンピューター画面の画像を理解して解釈し、見ているものに基づいてどのアクションを実行するかを決定する必要があります。 Claude 3.5 Sonnetは、スクリーンショットを分析し、ピクセルをカウントしてカーソルを正確に移動し、マウスコマンドを発行することでこれを達成します。
クロードはどれくらいうまく機能していますか?
AIモデルのコンピューターを使用する能力を評価するOSWorldベンチマークテストでは、Claude 3.5 Sonnetは14.9%のスコアを達成しました。これは、70%〜75%の人間レベルのパフォーマンスよりも大幅に低くなりますが、同じカテゴリの次のベストAIモデルによって7.7%のスコアがほぼ2倍です。
これらの有望な結果にもかかわらず、クロードのコンピューターの使用はまだ初期段階にあります。 Windowsのドラッグや画面にズームするなど、これ以上複雑なタスクを実行することはできません。さらに、スクリーンショットに依存しているため、特定のアクションと通知を見逃す可能性があります。
人類は、「ユーザーが完了したいタスクにより、コンピューターの使用が急速に改善されるようになると予想しています。」と述べています。彼らはまた、テクノロジーが進化するにつれて、厳格な安全対策を維持しながら、ソフトウェア開発の経験が少ない人にとってはよりアクセスしやすくなることを強調しています。
Claude 3.5 Sonnetは、誰でもアクセスできるようになりました。開発者は、人類のAPI、Amazon Bedrock、およびGoogle CloudのVertex AIのコンピューター使用ベータ版でアプリケーションの構築を開始できます。
関連記事
AIコミック:創作の最前線を探る
コミック業界は、人工知能の統合により大きな変革を遂げています。AIが遠い夢だった時代は過ぎ去り、今ではコミッククリエイターが作品を強化するための実際のツールとなっています。この記事では、AIとコミックの刺激的かつ議論を呼ぶ融合を掘り下げ、この活気あるメディアの未来を形作るツール、技術、倫理的ジレンマを考察します。コミック創作におけるAIの台頭AIがコミックアートをどのように革命化しているか長年、コ
Viggle AI: AIモーションミキシングでビデオVFXを革新
Viggle AIでビデオエフェクトを革新Viggle AIは、ビデオエフェクトの世界を再構築し、最先端のビジュアル制作をこれまで以上に身近なものにしています。複雑な設定や高価なソフトウェアの時代は終わりました。Viggle AIがあれば、アイデアさえあれば、あとは簡単に実現できます。この革新的なツールは、派手なエフェクトを追加するだけでなく、キャラクターや動きをインテリジェントに融合させ、プロフ
オンデマンド印刷とAIアート:Etsyのためのステップごとのガイド
在庫管理や製品作りに悩まず、Eコマースを始めたいと考えていますか?オンデマンド印刷(POD)とAIアート生成を組み合わせれば、手間のかからないオンラインビジネスが実現可能です。このガイドでは、AIを使って目を引くデザインを作成し、Etsyストアを立ち上げ、PODビジネスを始める手順を紹介します。AIアートをオンデマンド印刷製品に活用する主なポイントAIアートジェネレーターを活用して、アーティストで
コメント (0)
0/200
人間のように、コンピューターとシームレスに対話できるAIを夢見たことはありますか?まあ、その夢は今や現実になっています。人類の最新の革新のおかげで。火曜日に、彼らはClaude 3.5 Sonnetという名前の新しい世代のClaude AIモデルを発表しました。現在、ベータモードでは、このAIは開発者がAPIを介して実験できるようにしています。
人類は、「パブリックベータ版でのコンピューター使用を提供する最初のフロンティアAIモデル」として、Claude 3.5 Sonnetを誇らしげにラベル付けしています。つまり、開発者は、画面の表示、カーソルの操作、ボタンのクリック、仮想キーボードでの入力など、コンピューターでさまざまなタスクを実行するようにプログラムできます。目標?毎日コンピューターと対話する方法を再現します。
今、この新しいAIはまだ実験段階にありますが、そのしゃったものがないわけではありません。それは少し不器用でエラーが発生しやすい場合があります。しかし、それがまさに人類がベータ版でそれをリリースした理由です。開発者からの貴重なフィードバックを収集し、時間の経過とともにモデルを改良します。
コンピューターを使用してAIを気にする必要があるのはなぜですか?
人類はその質問に対する明確な答えを持っています:「コンピューターを介して膨大な量の現代の仕事が起こります」。 AIが人間と同じようにソフトウェアと対話できるようにすることにより、現在のAIアシスタントが処理できない多くの新しいアプリケーションのロックを解除します。
開発者とユーザーはどのように利益を得ることができますか?
タスクごとに特定のツールを作成する代わりに、AnthropicはClaudeの一般的なコンピュータースキルを教えています。これにより、AIは人間向けに設計された幅広い標準ソフトウェアプログラムを利用できます。開発者は、この機能を活用して、繰り返しタスクを自動化し、ソフトウェアを構築およびテストし、さらには研究を実施できます。
いくつかの企業は、Asana、Canva、Cognition、Doordash、Replit、The Browser Companyなど、Claude 3.5 Sonnetのコンピュータースキルをすでに活用しています。たとえば、Replitはこれらの機能を使用して、レプリットエージェント製品を強化しています。
彼らはどのようにしてクロードをコンピューターを使用するように訓練しましたか?
人類によると、コンピューターをナビゲートするためのクロードのトレーニングには、多くの試行錯誤が含まれていました。このプロセスでは、AIがコンピューター画面の画像を理解して解釈し、見ているものに基づいてどのアクションを実行するかを決定する必要があります。 Claude 3.5 Sonnetは、スクリーンショットを分析し、ピクセルをカウントしてカーソルを正確に移動し、マウスコマンドを発行することでこれを達成します。
クロードはどれくらいうまく機能していますか?
AIモデルのコンピューターを使用する能力を評価するOSWorldベンチマークテストでは、Claude 3.5 Sonnetは14.9%のスコアを達成しました。これは、70%〜75%の人間レベルのパフォーマンスよりも大幅に低くなりますが、同じカテゴリの次のベストAIモデルによって7.7%のスコアがほぼ2倍です。
これらの有望な結果にもかかわらず、クロードのコンピューターの使用はまだ初期段階にあります。 Windowsのドラッグや画面にズームするなど、これ以上複雑なタスクを実行することはできません。さらに、スクリーンショットに依存しているため、特定のアクションと通知を見逃す可能性があります。
人類は、「ユーザーが完了したいタスクにより、コンピューターの使用が急速に改善されるようになると予想しています。」と述べています。彼らはまた、テクノロジーが進化するにつれて、厳格な安全対策を維持しながら、ソフトウェア開発の経験が少ない人にとってはよりアクセスしやすくなることを強調しています。
Claude 3.5 Sonnetは、誰でもアクセスできるようになりました。開発者は、人類のAPI、Amazon Bedrock、およびGoogle CloudのVertex AIのコンピューター使用ベータ版でアプリケーションの構築を開始できます。












