人類は、その最も賢い「ハイブリッド推論」AIモデルをまだ明らかにしています
Anthropicは、初の「ハイブリッド推論モデル」であるClaude 3.7 Sonnetを発表しました。この画期的なモデルは、より複雑な課題に対応するために設計されており、数学やコーディングなどのタスクにおいて従来のモデルを上回る性能を発揮します。
この進歩を補完するために、Anthropicはエージェント型コーディングツールであるClaude Codeの「限定リサーチプレビュー」も開始します。AnthropicはすでにCursorのようなAIコーディングソリューションを提供していますが、Claude Codeはコードの検索や読み取り、ファイルの変更、テストの作成と実行、GitHubへのコードのプッシュ、コマンドラインツールの使用が可能な対話型のパートナーとして売り出されています。
Claude 3.7 Sonnetは、月曜日からClaudeアプリ内およびAnthropicのAPI、Amazon Bedrock、Google CloudのVertex AIを通じて利用可能になります。価格は前モデルである3.5 Sonnetと変わらず、入力トークン100万トークンあたり3ドル、出力トークン100万トークンあたり15ドルです。
OpenAIのような競合他社が個別の推論モデルを提供しているのに対し、Anthropicは推論機能をモデル自体に直接統合することに重点を置いています。AnthropicのプロダクトリサーチリードであるDianne Pennは、The Vergeに対し、「私たちは根本的に、推論はAIの機能であり、完全に別個のものではないと信じています」と説明しました。たとえば、Claudeは「今は何時?」のような簡単なクエリにはあまり苦労せず、天候を考慮しながらイタリアへの2週間の旅行を計画するような複雑なプロンプトを優れて処理します。
Anthropic
Anthropic
Pennは、Claude 3.7 Sonnetがエージェント型コーディング、ファイナンス、法的問題において顕著な改善を示していると述べました。Claudeはまだリアルタイムのウェブ検索をサポートしていませんが—他のモデルには存在する機能—2024年10月までの知識カットオフ日を持ち、より最新の情報を提供します。開発者はスクラッチパッド機能を介してモデルの動作を制御し、正確な応答時間を指定できます。「時には」とAnthropicのプロダクト副社長であるMichael Gerstenhaberは述べ、「開発者は単に、この質問に答えるのに200ミリ秒以上かからないようにと指定する必要があります」と、戦略的なプロダクトの決定を強調しました。
社内では、Anthropicのスタッフが新しいモデルを使用してフロントエンドのウェブサイトインターフェースを設計し、インタラクティブなゲームを作成し、テストセットの構築やテストケースの反復的な改良など、最大45分のコーディング活動に従事しています、とPennは述べました。

Claude Code. Anthropic
Pennは、Anthropicがモデルの能力を評価するために、昔ながらのポケモンビデオゲームをナビゲートさせ、モデルのAPIをコントローラーインターフェースにマッピングしていると述べました。Claude 3.5 Sonnetは最初にパレットタウンを出るのに苦労しましたが、Claude 3.7は複数のジムリーダーを倒すことに成功しました。
先週、Elon MuskがGrok-3を発表したことで、AIモデル競争の急速なペースが強調されました。現時点では、Claude 3.7 Sonnetの優れたパフォーマンスにより、Anthropicがリードしています。そのリリースは、異なる機能のために特殊なツールを必要とせず、単一のモデルがすべてのタスクを処理する未来を示唆しています。
関連記事
Notionは、ワークスペースをAIエージェントのハブへと変革します
生産性向上ソフトウェア企業であるNotionが、「エージェント時代」に突入する。水曜日にライブ配信された製品発表会で、共同ノート作成アプリで知られるNotionは、カスタムAIエージェントの機能を拡張し、外部エージェントと連携し、あらゆるデータベースからデータを取得できる自動化された多段階ワークフローをチームが構築できるようにする新しい開発者向けプラットフォームを発表した。複数のツールやデータソー
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表
音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
関連特集おすすめ
コメント (4)
0/500
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。
Anthropicは、初の「ハイブリッド推論モデル」であるClaude 3.7 Sonnetを発表しました。この画期的なモデルは、より複雑な課題に対応するために設計されており、数学やコーディングなどのタスクにおいて従来のモデルを上回る性能を発揮します。
この進歩を補完するために、Anthropicはエージェント型コーディングツールであるClaude Codeの「限定リサーチプレビュー」も開始します。AnthropicはすでにCursorのようなAIコーディングソリューションを提供していますが、Claude Codeはコードの検索や読み取り、ファイルの変更、テストの作成と実行、GitHubへのコードのプッシュ、コマンドラインツールの使用が可能な対話型のパートナーとして売り出されています。
Claude 3.7 Sonnetは、月曜日からClaudeアプリ内およびAnthropicのAPI、Amazon Bedrock、Google CloudのVertex AIを通じて利用可能になります。価格は前モデルである3.5 Sonnetと変わらず、入力トークン100万トークンあたり3ドル、出力トークン100万トークンあたり15ドルです。
OpenAIのような競合他社が個別の推論モデルを提供しているのに対し、Anthropicは推論機能をモデル自体に直接統合することに重点を置いています。AnthropicのプロダクトリサーチリードであるDianne Pennは、The Vergeに対し、「私たちは根本的に、推論はAIの機能であり、完全に別個のものではないと信じています」と説明しました。たとえば、Claudeは「今は何時?」のような簡単なクエリにはあまり苦労せず、天候を考慮しながらイタリアへの2週間の旅行を計画するような複雑なプロンプトを優れて処理します。
Anthropic
Anthropic
Pennは、Claude 3.7 Sonnetがエージェント型コーディング、ファイナンス、法的問題において顕著な改善を示していると述べました。Claudeはまだリアルタイムのウェブ検索をサポートしていませんが—他のモデルには存在する機能—2024年10月までの知識カットオフ日を持ち、より最新の情報を提供します。開発者はスクラッチパッド機能を介してモデルの動作を制御し、正確な応答時間を指定できます。「時には」とAnthropicのプロダクト副社長であるMichael Gerstenhaberは述べ、「開発者は単に、この質問に答えるのに200ミリ秒以上かからないようにと指定する必要があります」と、戦略的なプロダクトの決定を強調しました。
社内では、Anthropicのスタッフが新しいモデルを使用してフロントエンドのウェブサイトインターフェースを設計し、インタラクティブなゲームを作成し、テストセットの構築やテストケースの反復的な改良など、最大45分のコーディング活動に従事しています、とPennは述べました。

Claude Code. Anthropic
Pennは、Anthropicがモデルの能力を評価するために、昔ながらのポケモンビデオゲームをナビゲートさせ、モデルのAPIをコントローラーインターフェースにマッピングしていると述べました。Claude 3.5 Sonnetは最初にパレットタウンを出るのに苦労しましたが、Claude 3.7は複数のジムリーダーを倒すことに成功しました。
先週、Elon MuskがGrok-3を発表したことで、AIモデル競争の急速なペースが強調されました。現時点では、Claude 3.7 Sonnetの優れたパフォーマンスにより、Anthropicがリードしています。そのリリースは、異なる機能のために特殊なツールを必要とせず、単一のモデルがすべてのタスクを処理する未来を示唆しています。
Notionは、ワークスペースをAIエージェントのハブへと変革します
生産性向上ソフトウェア企業であるNotionが、「エージェント時代」に突入する。水曜日にライブ配信された製品発表会で、共同ノート作成アプリで知られるNotionは、カスタムAIエージェントの機能を拡張し、外部エージェントと連携し、あらゆるデータベースからデータを取得できる自動化された多段階ワークフローをチームが構築できるようにする新しい開発者向けプラットフォームを発表した。複数のツールやデータソー
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表
音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。





家






