オプション
ニュース
人類は、その最も賢い「ハイブリッド推論」AIモデルをまだ明らかにしています

人類は、その最も賢い「ハイブリッド推論」AIモデルをまだ明らかにしています

2025年6月2日
11

AnthropicはClaude 3.7 Sonnetを発表したばかりで、最初の「ハイブリッド推論モデル」のデビューをマークしました。この画期的なモデルは、数学やコーディングなどのタスクに関して、より複雑な課題に取り組み、以前の反復を上回るように設計されています。

この進歩を補完するために、AnthropicはエージェントコーディングツールであるClaude Codeの「限定的な研究プレビュー」も開始しています。人類はすでにCursorのようなAIコーディングソリューションを促進していますが、Claudeコードは、コードの検索と読み取り、ファイルの変更、テストの書き込み、GitHubへのプッシュ、およびコマンドラインツールの利用可能なインタラクティブなパートナーとして販売されています。

Claude 3.7 Sonnetは、Claudeアプリ内で月曜日から、AnthropicのAPI、Amazon Bedrock、およびGoogle CloudのVertex AI経由でアクセスできます。価格設定は、前任者の3.5ソネットと一致しており、100万ドルあたりの入力トークン3ドル、100万ドルあたり15ドルです。

明確な推論モデルを提供するOpenaiなどの競合他社とは異なり、人類は、推論機能をモデル自体に直接統合することを強調しています。 Anthropicの製品研究リードであるDianne Pennが、「推論は完全に別々のものではなく、AIの特徴であると基本的に信じています」と説明しました。たとえば、クロードは「何時ですか?」などの簡単なクエリとあまり苦労すべきではありません。しかし、気象条件を考慮しながら、イタリアへの2週間の旅行を計画するなど、複雑なプロンプトの取り扱いに優れています。

クロードの最新モデルカード。人類
クロードのソフトウェアエンジニアリングパフォーマンス。人類
ペンは、Claude 3.7 Sonnetがエージェントコーディング、財務、および法的問題の著しい改善を示していることを指摘しました。 ClaudeはまだリアルタイムのWeb検索(他のモデルに存在する機能)をサポートしていませんが、2024年10月の知識カットオフ日を誇っており、より最新のものにしています。開発者は、ScratchPad機能を介してモデルの動作に影響を与え、正確な応答時間を指定できます。 「時々」とAnthropicの製品副社長Michael Gerstenhaber氏は、「開発者は、この質問に答えるのに200ミリ秒以上かかるべきではないことを示す必要がある」と述べています。

Pennによると、内部的には、人類のスタッフが新しいモデルを利用して、フロントエンドのWebサイトインターフェイスを設計し、インタラクティブなゲームを作成し、テストセットの構築やテストケースの改良など、最大45分間のコーディングアクティビティに従事しています。

クロードコードのスクリーンショット。
クロードコード。人類

ペンは、人類がモデルの機能を昔ながらのポケモンビデオゲームにナビゲートさせ、モデルのAPIをコントローラーインターフェイスにマッピングすることにより、モデルの機能を評価すると述べました。 Claude 3.5 Sonnetは最初はPallet Townを離れるのに苦労していましたが、Claude 3.7はいくつかのジムのリーダーを首尾よく倒しました。

Elon Muskの最近のGrok-3の発表先週、AIモデル競争の急速なペースを強調しました。今のところ、人類は、Claude 3.7 Sonnetの印象的なパフォーマンスのおかげで先に立っています。そのリリースは、異なる機能に特殊なツールを必要とするのではなく、単一のモデルがすべてのタスクを処理する未来を示唆しています。

関連記事
Billionaires Discuss Automating Jobs Away in This Week's AI Update Billionaires Discuss Automating Jobs Away in This Week's AI Update Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
YouTube’s TV changes include a redesign and more multiview YouTube’s TV changes include a redesign and more multiview YouTube Expands Multiview Beyond Sports—Here’s What’s ComingLove the idea of watching multiple streams at once but wish it wasn’t just for March Madness or NFL Sunday Ticket? Good
Google Rejects Offering Publishers More Options to Opt Out of AI Search Google Rejects Offering Publishers More Options to Opt Out of AI Search Google's Internal Documents Reveal Publisher Control ControversyAccording to a recently disclosed internal document obtained by Bloomberg, Google considered allowing publishers more granular control over how their content is utilized in AI-driven search features. The document, authored by Google Sea
コメント (0)
0/200
トップに戻ります
OR