オプション
ニュース
人類は、その最も賢い「ハイブリッド推論」AIモデルをまだ明らかにしています

人類は、その最も賢い「ハイブリッド推論」AIモデルをまだ明らかにしています

2025年6月2日
41

Anthropicは、初の「ハイブリッド推論モデル」であるClaude 3.7 Sonnetを発表しました。この画期的なモデルは、より複雑な課題に対応するために設計されており、数学やコーディングなどのタスクにおいて従来のモデルを上回る性能を発揮します。

この進歩を補完するために、Anthropicはエージェント型コーディングツールであるClaude Codeの「限定リサーチプレビュー」も開始します。AnthropicはすでにCursorのようなAIコーディングソリューションを提供していますが、Claude Codeはコードの検索や読み取り、ファイルの変更、テストの作成と実行、GitHubへのコードのプッシュ、コマンドラインツールの使用が可能な対話型のパートナーとして売り出されています。

Claude 3.7 Sonnetは、月曜日からClaudeアプリ内およびAnthropicのAPI、Amazon Bedrock、Google CloudのVertex AIを通じて利用可能になります。価格は前モデルである3.5 Sonnetと変わらず、入力トークン100万トークンあたり3ドル、出力トークン100万トークンあたり15ドルです。

OpenAIのような競合他社が個別の推論モデルを提供しているのに対し、Anthropicは推論機能をモデル自体に直接統合することに重点を置いています。AnthropicのプロダクトリサーチリードであるDianne Pennは、The Vergeに対し、「私たちは根本的に、推論はAIの機能であり、完全に別個のものではないと信じています」と説明しました。たとえば、Claudeは「今は何時?」のような簡単なクエリにはあまり苦労せず、天候を考慮しながらイタリアへの2週間の旅行を計画するような複雑なプロンプトを優れて処理します。

Claudeの最新モデルカード。Anthropic
Claudeのソフトウェアエンジニアリング性能。Anthropic
Pennは、Claude 3.7 Sonnetがエージェント型コーディング、ファイナンス、法的問題において顕著な改善を示していると述べました。Claudeはまだリアルタイムのウェブ検索をサポートしていませんが—他のモデルには存在する機能—2024年10月までの知識カットオフ日を持ち、より最新の情報を提供します。開発者はスクラッチパッド機能を介してモデルの動作を制御し、正確な応答時間を指定できます。「時には」とAnthropicのプロダクト副社長であるMichael Gerstenhaberは述べ、「開発者は単に、この質問に答えるのに200ミリ秒以上かからないようにと指定する必要があります」と、戦略的なプロダクトの決定を強調しました。

社内では、Anthropicのスタッフが新しいモデルを使用してフロントエンドのウェブサイトインターフェースを設計し、インタラクティブなゲームを作成し、テストセットの構築やテストケースの反復的な改良など、最大45分のコーディング活動に従事しています、とPennは述べました。

Claudeコードのスクリーンショット。
Claude Code. Anthropic

Pennは、Anthropicがモデルの能力を評価するために、昔ながらのポケモンビデオゲームをナビゲートさせ、モデルのAPIをコントローラーインターフェースにマッピングしていると述べました。Claude 3.5 Sonnetは最初にパレットタウンを出るのに苦労しましたが、Claude 3.7は複数のジムリーダーを倒すことに成功しました。

先週、Elon MuskがGrok-3を発表したことで、AIモデル競争の急速なペースが強調されました。現時点では、Claude 3.7 Sonnetの優れたパフォーマンスにより、Anthropicがリードしています。そのリリースは、異なる機能のために特殊なツールを必要とせず、単一のモデルがすべてのタスクを処理する未来を示唆しています。

関連記事
トランプ大統領、中国との競争において規制よりもAIの成長を優先 トランプ大統領、中国との競争において規制よりもAIの成長を優先 トランプ政権は水曜日に画期的なAI行動計画を発表し、バイデン政権のリスク回避的なAI政策からの決定的な脱却を示した。この野心的な青写真は、積極的なインフラ整備、規制の大幅撤廃、国家安全保障対策の強化、人工知能における中国との戦略的競争を優先している。この政策転換は、特にエネルギー使用や環境規制に関して、経済や社会に広範な影響を及ぼす可能性がある。同政権は、連邦所有地を含むデータセンター建設を拡大す
YouTube、AI動画ツールVeo 3をShortsプラットフォームに直接統合 YouTube、AI動画ツールVeo 3をShortsプラットフォームに直接統合 YouTube ShortsにVeo 3 AI動画モデルが今夏登場YouTubeのニール・モーハンCEOは、カンヌライオンズの基調講演で、同プラットフォームの最先端のAI動画生成技術Veo 3が今夏後半にYouTube Shortsでデビューすることを明らかにした。これは、Veo 3がAIによるコンテンツ制作に革命をもたらすとするアリソン・ジョンソンのコメントに続くものである。現在、Shortsの
マイクロソフト、低予算のXboxクラウド・ゲーミング・サブスクリプションを発表 マイクロソフト、低予算のXboxクラウド・ゲーミング・サブスクリプションを発表 マイクロソフト、Xboxクラウドゲーミングの手頃なオプションを検討Microsoftは、Xbox Cloud Gamingをより低予算で楽しめるようにする計画を進めているようだ。広告付きの無料版の可能性についての以前の報告に続き、同社幹部は現在、ストリーミングサービスのためのより広範なアクセシビリティオプションをほのめかしている。マイクロソフトの次世代担当副社長ジェイソン・ロナルドは最近、Xbox
コメント (1)
0/200
JoeCarter
JoeCarter 2025年8月14日 14:00:59 JST

This new Claude 3.7 sounds wild! 🤯 Hybrid reasoning? That's like giving AI a supercharged brain for math and coding. Can't wait to see how it stacks up against others in real-world tasks.

トップに戻ります
OR