オプション
ニュース
「Claude Opus 4.7」がリリース、AIの知能よりも信頼性を重視

「Claude Opus 4.7」がリリース、AIの知能よりも信頼性を重視

2026年6月5日
1

Anthropicは今年、ほぼ1日おきに新機能をリリースするなど、積極的なペースを維持しています。待望のClaude Opus 4.7がついに正式にリリースされましたが、興味深いことに、Anthropicは発表の中で「これは当社で最も強力なモデルではありません」と率直に述べています。 噂されている、より強力な「Claude Mythos Preview」は依然として待機状態にある。それでも、Opus 4.7は「より賢い」ことではなく「より信頼性が高い」という点に焦点を当てているため、大きな注目を集めている。

image.png

ベンチマークの結果は特に印象的です。厳格なコーディングベンチマークであるSWE-bench Proにおいて、 4.7は前バージョンの53.4%から64.3%へと約11ポイント上昇し、GPT-5.4(57.7%)やGemini 3.1 Pro(54.2%)を上回りました。 視覚推論ベンチマークのCharXivでは、新たに追加された2576ピクセルの長辺認識機能により、前バージョンの3倍以上の鮮明さを実現し、スコアは69.1%から82.1%へと上昇しました。 ツール呼び出し評価のMCP-Atlasでは77.3%を記録し、法務AIプラットフォームHarveyのBigLawベンチマークでは90.9%に達した。 しかし、能動的検索評価であるBrowseCompでは、4.7は83.7%から79.3%へとわずかに低下し、GPT-5.4やGeminiに追い抜かれた。これは、情報が不完全な場合に推測するよりもエラーを報告することを好む、「虚偽を述べない」という性格に起因している。

数字以上に注目すべきは、その気質の変容です。Replitのリーダーはテスト後に次のように述べた。「技術的な議論において私に挑戦を投げかけ、より良い意思決定を助け、まさに優れた同僚のように振る舞ってくれる。」データサイエンスプラットフォームのHexもまた、データが欠落している場合、4.7は以前のように「一見合理的だが完全に間違っている」代替値を提供するのではなく、エラーを直接報告することを確認した。 同時に、タスクの回復力も大幅に向上しました。Notion チームのテストによると、ツールのエラー率は以前の 3 分の 1 に低減し、ツールチェーンが失敗した場合でも、障害を乗り越えて自律的にタスクを完了できるようになりました。 Vercelはさらに、新たな挙動を発見しました。システムレベルのコードを記述する前に、4.7はまず独自に数学的証明を行うのです。

image.png

もちろん、機能の向上には代償が伴います。4.7では新しいトークナイザーが導入され、同じテキストに対して1.0~1.35倍のトークンが生成されます。さらに、複雑なタスクでは「少し長く考える」傾向があるため、実際の消費量はほぼ確実に増加します。 これに対処するため、Anthropicは「xhigh」という超高度な思考強度レベルを追加しました。Claude Codeではすべてのパッケージをデフォルトでこのレベルに設定しており、さらに開発者がトークン使用量を管理できるよう、「Deep Review」コマンド/ultrareview、Maxユーザー向けのAuto Mode拡張機能、および「タスク予算」機能のパブリックベータ版もリリースしました。

より高性能なMythos Previewは、サイバーセキュリティ研究向けに「Project Glasswing」という名称で企業向けに提供が開始されましたが、その圧倒的な能力とセキュリティ評価が未完了であるため、まだ一般公開されていません。

本日のバージョン4.7は、Anthropicの頻繁なリリースサイクルにおける最新のマイルストーンです。Mythosはいずれ登場することになるでしょう。そして、その日が来れば、すでに強力なバージョン4.7は、あくまで始まりに過ぎないことが証明されるかもしれません。

関連記事
Sunoの筆頭投資家:投稿の削除では著作権訴訟の抜け穴を塞げない Sunoの筆頭投資家:投稿の削除では著作権訴訟の抜け穴を塞げない 待望のAI音楽生成プラットフォーム「Suno」は、厳しい著作権をめぐる争いに直面しているが、同社の主要投資家による率直な発言が、相手側にとってまさに待ち望んでいた証拠を手にさせてしまった可能性がある。 Sunoの主要投資家であるMenlo Venturesのパートナー、C.C. Gong氏は先日、同社の現在の法的防御戦略と真っ向から矛盾するツイートを削除した。これまでの著作権訴訟において、Suno
ハイアール、重量わずか1.75kgの世界最軽量AIスポーツ用外骨格ロボットを発表 ハイアール、重量わずか1.75kgの世界最軽量AIスポーツ用外骨格ロボットを発表 ハイアールグループは、スポーツ用として世界最軽量のAI搭載外骨格ロボット「ハイアール・エクソスケルトン・ロボット W3」を発表しました。この製品の発売により、軽量化において業界新記録を樹立し、軽量設計と人間の動作をインテリジェントに強化する技術において大きな飛躍を遂げました。高級素材が実現する超軽量設計W3は、フルカーボンファイバーとチタン合金を組み合わせた革新的な一体成型プロセスを採用しています
Yaoke Media初のAIGCドラマ『秦嶺の青銅の謎』が本日配信開始、AIが演じる主演キャストが登場 Yaoke Media初のAIGCドラマ『秦嶺の青銅の謎』が本日配信開始、AIが演じる主演キャストが登場 本日、Yaoke MediaのAIGCファンタジー・ミステリー短編ドラマ『秦嶺青銅の秘話』が正式に公開されました。同社が初めて契約した2人のAI俳優、秦凌月と林西燕燕が主演を務め、物語は謎に包まれた秦嶺の鉱山地帯を舞台に展開されます。 物語は、引退した諜報員・秦月がチームを率いてその奥深くへと入り込み、長年埋もれていた鉱山事故と、2世代にわたる血の生贄の真実を暴いていく様子を描きます。その真実は、
関連特集おすすめ
仕事 おすすめのAI経費管理ツール:レシートをスキャンして、業務経費を自動分類
おすすめのAI経費管理ツール:レシートをスキャンして、業務経費を自動分類

2026年最新・最高のAI経費管理ツール:レシートをスキャンし、法人経費を自動分類する高評価ツールをご紹介。手間いらずの経費管理、正確な財務追跡、コンプライアンス対応の効率化を実現する、画期的なソリューションをご覧ください。無料版と有料版の比較表は厳選され、毎週更新されるため、最適なツール選びにお役立ていただけます。XIX.AIの専門家が厳選したツールで、AIの力を最大限に活用しましょう。

10 ツール
xix.ai
仕事 おすすめのAI採用ツール:履歴書の選考と候補者の面接スケジュール管理を自動化
おすすめのAI採用ツール:履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう!

10 ツール
xix.ai
生産性 AIパーソナルウェルネス&集中力コーチ:バーンアウトの予防とメンタルエネルギーの向上
AIパーソナルウェルネス&集中力コーチ:バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス&集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール
xix.ai
チャットボット 高評価のAI恋愛チャットボット:一貫した個性で長期的な関係を築く
高評価のAI恋愛チャットボット:一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール
xix.ai
教育と学習 最高のAIデータサイエンスメンター:SQL、Pandas、および機械学習ワークフローをマスターしましょう
最高のAIデータサイエンスメンター:SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール
xix.ai
チャットボット 最高のAIを使ったナンパ&会話トレーニング:社交的な魅力と自信をリアルタイムで高める
最高のAIを使ったナンパ&会話トレーニング:社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール
xix.ai
コメント (0)
0/500
OR