オプション
ニュース
クロード4 AIはコーディングと論理的推論のタスクで先行者を凌駕する

クロード4 AIはコーディングと論理的推論のタスクで先行者を凌駕する

2025年9月14日
1

Anthropicは、次世代Claude AIモデル「Claude Opus 4」と「Claude Sonnet 4」を発表しました。これは、特にプログラミングアプリケーションや複雑な問題解決シナリオに対応するハイブリッド推論機能の大幅な進化を意味します。

Anthropic 社のこれまでで最も洗練されたAIと位置づけられるClaude Opus 4は、要求の厳しいタスクを長時間継続的に実行することで、前例のない耐久性を示しています。社内の評価では、このモデルは7時間連続で自律動作を維持することに成功し、AIエージェントの能力を大幅に向上させるマイルストーンとなりました。Anthropicは、Opus 4がGoogleのGemini 2.5 Pro、OpenAIのo3推論システム、GPT-4.1を含む競合モデルをプログラミングタスクとウェブ検索のようなツール利用の両方で上回っていることを示すベンチマーク結果で、コーディング能力のリーダーシップを主張しています。

コスト効率を優先するユーザーにとって、クロード・ソネット4は、2月の3.7反復に代わる最適化されたソリューションを提供する。この改良型は、応答精度の向上とともに、プログラミングと論理的推論の性能を強化しています。どちらの新モデルも、タスクの実行方法が大幅に改善され、不適切なショートカットをする傾向が65%減少し、ファイルシステムへのアクセス許可時に高度なメモリ保持を行うことで、長時間のオペレーションに対応できるようになりました。

競合AIモデルに対するクロード4の性能比較
*パフォーマンス指標は、Anthropicの内部ベンチマークを表しています
:Anthropic社

クロード4シリーズは、複雑な推論プロセスを消化しやすい洞察に集約する革新的な「思考サマリー」を導入しています。実験的な「拡張思考」トグルにより、分析的推論モードとツール支援モードをダイナミックに切り替え、アウトプットの品質と精度を高めることができます。

企業および開発者は、AnthropicのAPI、Amazon Bedrock、Google Cloud Vertex AIプラットフォームを通じて両モデルにアクセスできる。有料クロードプランの加入者は、拡張思考ベータを含む全ての機能にアクセスできますが、無料ユーザーは現在ソネット4の機能に制限されています。

これらのリリースを補完するために、AnthropicはClaude Codeエージェントコマンドラインツールをベータテストの成功に続き、一般提供を開始した。同社は、主要AI開発者間の競争が激化する中、更新のペースを加速させる計画を示している。

関連記事
ChatGPT、ファイルアクセスにGoogle DriveとDropboxの統合を追加 ChatGPT、ファイルアクセスにGoogle DriveとDropboxの統合を追加 ChatGPTが企業向け新機能で生産性を向上OpenAIは、ChatGPTを包括的なビジネス生産性ツールに変える2つの強力な新機能を発表しました:自動会議文書化とシームレスなクラウドストレージ統合です。革命的な録音機能新しく導入された "記録モード "は、自動テープ起こしや分析を可能にします:重要なビジネス会議創造的なブレーンストーミングセッション 個人の思考プロセスこの
グーグル、AIを活用したバーチャル試着機能を導入 グーグル、AIを活用したバーチャル試着機能を導入 グーグルは、標準的なモデル画像を超える高度なバーチャル試着体験でオンラインショッピングに革命を起こそうとしている。この革新的な機能は、現在米国ユーザー向けにSearch Labsで提供されており、買い物客は個人的な写真をアップロードし、自分の体に洋服のアイテムを驚くほど正確にビジュアル化することができます。仕組みGIFグーグル実験に参加した後、ユーザーは以下のことができる:アパレルの検索結果の横に
アップル、サードパーティ製アプリとの統合に向けローカルAIモデルの公開を計画 アップル、サードパーティ製アプリとの統合に向けローカルAIモデルの公開を計画 アップル、開発者向けにAIモデルへのアクセスを開放へBloombergの情報筋によると、技術大手のアップルは、同社のApple Intelligence機能を支えるコアAI技術へのアクセスを開発者に提供する準備を進めているという。同社はまず、小規模でデバイス上の大規模な言語モデルへのアクセスを提供するSDKをリリースする計画で、これは本日のGoogle I/Oカンファレンスで発表されたとされる
コメント (0)
0/200
トップに戻ります
OR