15億ドルの新ルーターモデルが93％の精度を達成、高額な再トレーニングコストを排除

家

ニュース

2025年11月24日

KennethCarter

# research # Google # openai # LLMs # qwen-2-5

Katanemo Labs の研究者が、ユーザからのクエリを最も適切な大規模言語モデル（LLM）にインテリジェントに誘導するために設計された高度なルーティングモデルとフレームワーク Arch-Router を発表しました。

複数の LLM を活用する製品を開発している企業にとって、Arch-Rolver は中心的なジレンマである、柔軟性に欠けるロジックや更新が必要なたびに高価な再トレーニングに依存することなく、各リクエストをタスクに最適なモデルに自動的にルーティングする方法に取り組んでいます。

LLMルーティングの課題

利用可能なLLMの種類が増えるにつれて、開発者は単一モデル構成から、コードの生成、テキストの要約、画像の編集など、特殊な機能に対して異なるモデルの能力を利用するマルチモデルアーキテクチャに移行しつつあります。

LLMルーティングは、このようなシステムの構築と実行に不可欠な技術となっており、各ユーザークエリを、その処理に最も適したモデルに導くインテリジェントなトラフィックディレクタの役割を果たしている。

現在のルーティング・アプローチは、一般的に2つの主要なグループに分類される。タスク・ベースのルーティングは、あらかじめ定義されたタスク・カテゴリーに従ってクエリを割り当てるものであり、パフォーマンス・ベースのルーティングは、費用と出力品質の間の最良のトレードオフを追求するものである。

しかし、タスクベースのシステムは、ユーザーの意図があいまいであったり、会話の過程で変化したりする場合、特に複数回にわたる対話の場合、しばしば失敗する。一方、パフォーマンス・ベースのルーティングは、静的なベンチマーク結果を優先する傾向があり、実際のユーザーの好みを見落としたり、コストのかかる再トレーニングを行わずに新しいモデルへの適応が遅れることが多い。

Katanemo Labsの研究者が論文で述べているように、より深い問題は、「既存のルーティング手法には、実世界のアプリケーションにおいて実用的な限界がある」ということだ。大半はベンチマークの性能に最適化されているが、主観的な評価基準によって導かれる人間の嗜好は無視されている」。

研究チームは、"主観的な人間の判断を反映し、より高い透明性を提供し、モデルとアプリケーションの両方が進化しても容易に調整可能な "ルーティングシステムの重要性を強調している。

プリファレンスに沿ったルーティングのための新しいフレームワーク

これらの問題を克服するため、研究者たちは、ユーザーの好みに基づいて、入力されたクエリをルーティングルールに適合させる「プリファレンス・アラインド・ルーティング」フレームワークを開発した。

このシステムでは、ユーザーは2階層構造の "Domain-Action Taxonomy "を通じて、自然言語を使ってルーティングポリシーを定義する。この構造は、人々が自然にタスクを記述する方法を反映している。"法律 "や "金融 "といった大まかなカテゴリー（Domain）から始まり、"要約 "や "コーディング "といった特定のタスク（Action）へと掘り下げていく。

そして、各ポリシーが優先モデルにマッピングされ、開発者はベンチマーク指標だけでなく、実用的な要件に基づいてルーティングを選択できるようになる。論文によれば、"この分類法は、ユーザーが明確に定義され、構造化されたルーティングポリシーを作成するためのメンタルモデルとして機能する"。

ルーティングの手順は2段階に分かれている。第一に、嗜好に沿ったルーターモデルが、ユーザーのクエリーを利用可能な全てのポリシーと並べて評価し、最適なものを選択する。次に、選択されたポリシーと割り当てられたLLMをマッピング関数で接続する。

モデルを選択するロジックはポリシーの定義から分離されているため、開発者はルーティング・ルールを編集するだけでモデルを追加、削除、更新することができます。この分離により、モデルやアプリケーションが常に変化する本番環境に必要な柔軟性が実現される。

プリファレンスに沿ったルーティングフレームワーク Source: arXiv

ポリシーの選択はArch-Routerによって行われます。Arch-Routerは、プリファレンスアウェアルーティングに最適化されたコンパクトな15億パラメータの言語モデルです。Arch-Routerはユーザのクエリとポリシーの説明の完全なリストを入力として受け取り、最適なポリシーの識別子を出力する。

ポリシーが入力に含まれているため、システムは推論中に新しいルートや更新されたルートに適応することができます。この生成的な戦略により、Arch-Routerは事前に訓練された理解を活用してクエリとポリシーの両方の意味を解釈し、完全な会話履歴を一度に分析することができます。

プロンプトに長大なポリシー・リストを含める際によく懸念されるのは、待ち時間が長くなるリスクだ。しかし、チームはArch-Routerを高効率に構築した。「広範なルーティング・ポリシーを使用しても、Arch-Routerのコンテキスト・ウィンドウを拡張しても、レイテンシにはほとんど影響しません」と、論文の共著者でKatanemo Labsの創設者／CEOであるSalman Paracha氏は言う。Arch-Routerは、"image_editing "や "document_creation "のような短いポリシー名しか出力しません。

Arch-Routerの動作

Arch-Routerを作成するために、チームは43,000のサンプルからなる入念に組み立てられたデータセットを使って、Qwen 2.5モデルの1.5Bパラメータバリアントを微調整した。そして、会話AIシステムをテストするために設計された4つの公開データセットで、OpenAI、Anthropic、Googleの主要な独自モデルとベンチマークを行った。

その結果、Arch-Routerは93.17%というトップの総合ルーティングスコアを達成し、他のすべてのモデル（トップクラスのプロプライエタリモデルを含む）を平均7.71%上回った。Arch-Routerの優位性は長時間の会話でより明らかになり、複数のやりとりにわたってコンテキストを維持する優れた能力が示されました。

Arch-Routerと他のモデルの比較出典：ArXiv

実世界での使用において、この方法論はすでに複数の場面で応用されているとパラチャ氏は指摘する。例えば、オープンソースのコーディングプラットフォームでは、開発者はArch-Routerを利用して、「コード設計」、「コード理解」、「コード生成」といったワークフローのさまざまな部分を、それぞれのステップに最も効果的なLLMに導いている。同様に、組織はドキュメント作成タスクをClaude 3.7 Sonnetのようなモデルにルーティングする一方で、画像編集リクエストをGemini 2.5 Proに送ることができる。

このシステムはまた、"ユーザーがテキストの要約から事実に関する質問への回答まで、様々な活動を行う様々な分野のパーソナルアシスタントにも適しています "とParacha氏は説明し、"このような状況において、Arch-Routerは製品チームがユーザーの全体的な体験を統合し、向上させるのに役立ちます "と付け加えた。

このフレームワークは、Katanemo LabsのAIネイティブなエージェント用プロキシサーバーであるArchに組み込まれており、きめ細かいトラフィック管理ルールの実装をサポートしている。例えば、新しいLLMを追加する場合、チームは特定のポリシーの下でトラフィックのごく一部を新しいモデルにルーティングし、内部分析を使ってそのパフォーマンスを検証した後、自信を持ってすべてのトラフィックを移行させることができる。同社はまた、企業の開発者がこのワークフローをさらにスムーズに行えるよう、評価プラットフォームとのツールの統合にも取り組んでいる。

Arch-Routerの中核にあるのは、企業がバラバラのAI実装から脱却するのを支援することだ。「Arch-Router、そしてArchプラットフォーム全体は、開発者や企業が断片的なLLMの使用から、統一されたポリシーで管理されたシステムへと進化することを可能にします」とParacha氏は述べる。"ユーザーが幅広いタスクを実行するとき、私たちのプラットフォームは、タスクとモデルの多様性をまとまりのあるエクスペリエンスに変換し、最終的な製品をシームレスで直感的なものにします。"

サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、

OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、

Google、インドでChrome向け「Gemini」の提供を開始水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが

関連特集おすすめ

テキスト読み上げ

ディスレクシアに最適なAI音声合成アプリ：生徒の学習と読解力の向上をサポート

ディスレクシア支援のために厳選された、2026年最新の最高評価AI TTSアプリをご紹介します。専門家によるランキングでは、無料ツールと有料ツールを比較し、読解効率と学習効果を高める強力な機能を詳しく解説しています。生徒の可能性を引き出す、ぜひ試すべき画期的なソリューションをご覧ください。XIX.AIでその第一歩を踏み出しましょう。

10 ツール

xix.ai

漫画制作

少年漫画向けトップAIジェネレーター：迫力満点のアクションシーンやエネルギーエフェクトを作成

XIX.AIで、2026年のおすすめ少年漫画向けAIジェネレーターをご紹介します。厳選されたトップクラスのリストには、迫力満点のアクションシーンや躍動感あふれるエフェクトを作成できる強力なツールが揃っています。実際のテスト結果をもとに、無料版と有料版の比較も可能です。あなたの創造力を解き放ち、今日から壮大な漫画の制作を始めましょう！

15 ツール

xix.ai

仕事

おすすめのAI経費管理ツール：レシートをスキャンして、業務経費を自動分類

2026年最新・最高のAI経費管理ツール：レシートをスキャンし、法人経費を自動分類する高評価ツールをご紹介。手間いらずの経費管理、正確な財務追跡、コンプライアンス対応の効率化を実現する、画期的なソリューションをご覧ください。無料版と有料版の比較表は厳選され、毎週更新されるため、最適なツール選びにお役立ていただけます。XIX.AIの専門家が厳選したツールで、AIの力を最大限に活用しましょう。

10 ツール

xix.ai

仕事

おすすめのAI採用ツール：履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう！

10 ツール

xix.ai

生産性

AIパーソナルウェルネス＆集中力コーチ：バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス＆集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール

xix.ai

チャットボット

高評価のAI恋愛チャットボット：一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール

xix.ai

コメント (1)

0/500

最初にログインしてください

WillGarcía

2026年4月6日 11:00:35 JST

Arch-Routerの構想は面白いね。社内でどのLLMを使うか毎回悩んでたから、これがあれば効率化に繋がりそう。ただ、精度93%って、結局残りの7%で重大なミスルーティングが起きたりしない？医療や法務のようなクリティカルな分野への適用は少し不安かな。😅 開発元のKatanemo Labs、これでインフラ市場に本格参戦するつもり？

トップニュース

AI BuilderとPower Automateがドキュメントの要約を革新 AIホストのNotebooklm Podcastのホストは、インタビューに利用できるようになりました中国、国家ヒューマノイドロボット及び具現化された知能の基準を発表企業のAI導入は頭打ち、ランプのデータで明らかに Bing Image Creator チュートリアル: AIアート生成ガイドあなたの声を使用してAIミュージックを作成することを学ぶ：ステップバイステップSunoチュートリアル iMyFone MagicMic：リアルタイムAIボイスチェンジャーのレビューとチュートリアル 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 DeepSeek V4、マルチモーダルAIのゲームチェンジャーとして登場エンボディッド・インテリジェンス、無秩序な拡大を抑制するための初の業界標準を発表

もっと

特集