新しいAIモデル、LLMを100倍の速度向上と最小限の学習データで上回る
シンガポールを拠点とするAIスタートアップSapient Intelligence社は、より小さなモデルサイズとはるかに少ないデータ消費量にもかかわらず、複雑な推論課題において大規模言語モデル(LLM)に匹敵し、特定のシナリオではそれを劇的に上回ることができる新しいAIアーキテクチャを開発した。
階層的推論モデル(HRM)と名付けられたこのシステムは、人間の脳が、ゆっくりとした理路整然とした計画立案と、高速で直感的な処理に別々のメカニズムを用いていることにヒントを得ている。このモデルは、最新のLLMが必要とするデータとメモリーのほんの一部を使用するだけで、驚くべき結果をもたらす。このような効率性は、データが制限され、計算能力が制約となることが多い企業AIの展開において、大きな可能性を秘めている。
思考連鎖推論の限界
複雑なタスクに直面したとき、現代のLLMは、ほとんどの場合、思考連鎖(CoT)プロンプトに依存します。このプロンプトでは、問題が中間的なテキストベースのステップに分解され、事実上、モデルが答えに向かって進む思考プロセスを言語化するよう強制されます。
CoTはLLMの推論能力を高める一方で、固有の弱点も抱えている。研究論文の中で、Sapient Intelligenceチームは「CoTは推論の一時しのぎに過ぎず、真の解決策ではない」と主張している。CoTは、人間が決定する硬直したブレークダウンに依存しており、1つの間違ったステップや順序の間違いが、プロセス全体を完全に脱線させる可能性がある"。
明示的なテキスト生成への依存は、モデルの推論をトークン・レベルに縛り付け、しばしば膨大なトレーニング・データセットを要求し、その結果、回答は長く、遅々として進まない。この方法はまた、直接言葉で表現されることなく内部で起こる「潜在的な推論」を見逃してしまう。
研究者たちは、「このような集中的なデータの必要性を減らすには、より合理的な方法が不可欠である」と述べている。
脳に着想を得た階層的フレームワーク
CoTを超えるために、研究チームは「潜在的推論」を研究した。潜在的推論とは、具体的な「思考トークン」を生成するのではなく、モデルが内部の抽象的な表現を使って問題を思考することである。これは、人間の認知により近い。論文では、「脳は、思考を継続的に言語に変換する必要なく、潜在的な空間において顕著な効率で拡張された論理的推論の連鎖を維持する」と言及されている。
しかし、AIにこのような深遠な内部推論を実装するのは難しい。ディープラーニング・モデルにレイヤーを追加するだけでは、学習シグナルがレイヤーをまたいでフェードアウトし、効果的な学習が妨げられる「勾配の消失」問題が頻繁に発生する。逆に、計算を繰り返し行うリカレント設計では、「早期収束」が発生する可能性があり、この場合、モデルは問題を十分に検証することなく、早期に解を確定してしまう。

階層的推論モデル(HRM)は脳の構造に着想を得ている 出典:arXiv 優れた方法を求めて、サピエント・チームは神経科学にヒントを求めた。「人間の脳は、現在の人工システムに欠けている計算の深さを達成するための説得力のあるモデルを提示している。「人間の脳は、さまざまな時間スケールで働く皮質領域にわたって階層的に計算を構造化し、深い多段階分析を可能にしています」。
その影響を受けて、研究チームはHRMを2つの相互接続されたリカレントモジュール、すなわち、ゆっくりと抽象的な戦略を練るハイレベル(H)モジュールと、素早く詳細な処理を行うローレベル(L)モジュールで作り上げた。この配置は、研究チームが "階層的収束 "と呼ぶメカニズムを促進する。基本的に、高速のLモジュールは問題の一部分に取り組み、安定した局所的な答えを見つけるまで何サイクルも実行する。その後、低速のHモジュールがこの結果を取り込み、包括的な計画を洗練させ、Lモジュールに新しい、より明確に定義された下位問題を割り当てる。これによってLモジュールは効果的に再起動し、停滞(早期収束)を止め、消失勾配を回避する合理化されたアーキテクチャを使用して、完全なシステムが一連の推論ステージを拡張して実行できるようになる。

HRM(左)は計算サイクルをまたいで解にスムーズに収束し、早期収束(中央、RNN)と消失勾配(右、古典的なディープニューラルネットワーク)を回避する 出典:arXiv 論文によると、「このメカニズムにより、HRMは、Hモジュールが大局的な問題解決アプローチを導き、Lモジュールが各フェーズで集中的な探索や精密化を行う、個別の定常的な入れ子計算を次々と実行することができる」。このネストされたループアーキテクチャにより、CoTプロンプトの延長や膨大なデータセットを必要とすることなく、モデルは潜在空間において深い分析を行うことができる。
論理的な懸念は、この "潜在的推論 "が解釈可能性を犠牲にするかどうかである。Sapient Intelligenceの創設者兼CEOであるGuan Wang氏は、この考え方に異議を唱え、CoTがモデルの認知に関する洞察を提供するのと同様に、モデルの内部オペレーションを解釈し、図示することができることを明らかにしている。彼はさらに、CoT自体が信頼できない可能性があることを指摘する。「CoTは、モデルの真の内部推論を正確に表しているわけではありません。「根本的に不透明なのです」。

HRMが異なる計算サイクルで迷路問題を推論する例 出典:arXiv HRMの動作
HRMのモデルを評価するため、研究チームは、抽象化と推論コーパス(ARC-AGI)、難易度の高い数独パズル、複雑な迷路ナビゲーションタスクなど、集中的な検索とバックトラックを要求するベンチマークとHRMを比較した。
その結果、HRMは洗練されたLLMでも解けないような問題を解くことを学習することが明らかになった。例えば、"Sudoku-Extreme "と "Maze-Hard "のテストでは、トップクラスのCoTモデルは完全に失敗し、0%の精度を記録した。一方、HRMは1タスクあたりわずか1,000例の学習で、ほぼ完璧な精度を達成した。
抽象的推論と汎化の指標であるARC-AGIベンチマークでは、27MパラメータのHRMは40.3%を達成した。これは、はるかに大規模なo3-mini-high(34.5%)やClaude 3.7 Sonnet(21.2%)といった著名なCoTベースのモデルを凌ぐものである。膨大な事前学習データセットを持たず、最小限のデータで実現したこの成果は、HRMの設計の強さと効率の良さを裏付けている。

HRMは複雑な推論タスクにおいて大規模モデルを凌駕する 出典: arXiv パズルの解法がこのモデルの能力を示す一方で、その実用的なインパクトは、別のカテゴリーの課題において見られる。Wang氏によると、開発者は言語中心の課題や創造的な課題にはLLMを使い続けるべきだが、「複雑な課題や決定論的な課題」に対しては、HRMスタイルのフレームワークが幻覚を減らし、優れた結果をもたらすという。特に、具現化AIやロボット工学のようなレイテンシが重要な分野や、科学研究のようなデータが疎な領域では、「複雑な意思決定や長期的なプランニングを必要とする逐次的な問題」を強調する。
このような状況では、HRMは解決策を見つけるだけでなく、問題解決を改善するために学習する。「マスターレベルの数独テストでは...HRMは、トレーニングを続けるにつれて、徐々に必要なステップを減らしていきます。
企業にとっては、このアーキテクチャの効率性が収益性に影響を与える。CoTのようなトークンごとの逐次的な生産ではなく、HRMの並列計算によって、ワン氏は「タスク完了速度が100倍加速する」と概算している。その結果、推論の待ち時間が短縮され、エッジ・デバイス上で高度な推論を行うことができるようになる。
経済的なメリットも大きい。「HRMのような特化した推論エンジンは、大規模で高価、かつレイテンシーの高いAPI駆動型モデルと比較して、特定の複雑な推論業務に対してより実行可能な選択肢を提示する」と王氏は述べた。効率性を説明するために、彼は、プロフェッショナルな数独のモデルをトレーニングするのに必要なGPU時間は約2時間、要求の厳しいARC-AGIベンチマークでは50~200GPU時間であることを述べました。これは、データと資金の両方が制限されている状況で、物流計画から複雑なシステムのトラブルシューティングまで、専門的なビジネス課題に対処する機会を創出します。
今後、サピエント・インテリジェンスは、HRMをニッチな問題解決ツールから、より広範で汎用的な推論コンポーネントへと変貌させるべく、すでに前進している。「私たちは、HRMをベースにした脳に触発されたモデルを積極的に構築しています」とワンは言い、ヘルスケア、気候予測、ロボット工学における初期の有望な成果を指摘した。特に自己修正機能の統合によって、これらの将来的なモデルは、現在のテキストベースのシステムとは大きく異なるものになるだろうと彼は示唆した。
この研究は、今日のAIリーダーたちを困惑させている一連の問題に対して、より大きなモデルではなく、人間の脳という最も高度な推論システムをモデルにした、より知的で組織化されたフレームワークが進むべき道である可能性を示唆している。
関連記事
ベイン・アンド・カンパニーは、エージェント型AIオートメーションのSaaS市場規模が1,000億米ドルに達すると予測している
ベイン・アンド・カンパニーは、エージェント型AIを活用するSaaS企業向けの米国市場規模を1,000億ドルと推計している。同社によると、この市場は企業システム内の調整業務の自動化によって生まれるという。この推計は、AI時代のソフトウェア業界に関するベインの5回シリーズ第2弾に基づくものである。同レポートでは、エージェント型AIがどのような新たなソフトウェア市場を切り拓く可能性があり、SaaSプロバ
カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示
カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合
ヒューマノイドロボットの試験運用が進む中、物理AIが工場現場に一歩近づいている
ロイター通信によると、英国のテクノロジー企業ヒューマノイドは、ドイツの産業用部品サプライヤーであるシェフラーが運営する工場にヒューマノイドロボットを導入する予定だ。ヒューマノイドの広報担当者によると、この契約により、2032年までにシェフラーの全世界の製造拠点に1,000台から2,000台のロボットが導入される見込みだ。契約金額は明らかにされていない。最初の導入は、2026年12月から2027年
関連特集おすすめ
コメント (0)
0/500
シンガポールを拠点とするAIスタートアップSapient Intelligence社は、より小さなモデルサイズとはるかに少ないデータ消費量にもかかわらず、複雑な推論課題において大規模言語モデル(LLM)に匹敵し、特定のシナリオではそれを劇的に上回ることができる新しいAIアーキテクチャを開発した。
階層的推論モデル(HRM)と名付けられたこのシステムは、人間の脳が、ゆっくりとした理路整然とした計画立案と、高速で直感的な処理に別々のメカニズムを用いていることにヒントを得ている。このモデルは、最新のLLMが必要とするデータとメモリーのほんの一部を使用するだけで、驚くべき結果をもたらす。このような効率性は、データが制限され、計算能力が制約となることが多い企業AIの展開において、大きな可能性を秘めている。
思考連鎖推論の限界
複雑なタスクに直面したとき、現代のLLMは、ほとんどの場合、思考連鎖(CoT)プロンプトに依存します。このプロンプトでは、問題が中間的なテキストベースのステップに分解され、事実上、モデルが答えに向かって進む思考プロセスを言語化するよう強制されます。
CoTはLLMの推論能力を高める一方で、固有の弱点も抱えている。研究論文の中で、Sapient Intelligenceチームは「CoTは推論の一時しのぎに過ぎず、真の解決策ではない」と主張している。CoTは、人間が決定する硬直したブレークダウンに依存しており、1つの間違ったステップや順序の間違いが、プロセス全体を完全に脱線させる可能性がある"。
明示的なテキスト生成への依存は、モデルの推論をトークン・レベルに縛り付け、しばしば膨大なトレーニング・データセットを要求し、その結果、回答は長く、遅々として進まない。この方法はまた、直接言葉で表現されることなく内部で起こる「潜在的な推論」を見逃してしまう。
研究者たちは、「このような集中的なデータの必要性を減らすには、より合理的な方法が不可欠である」と述べている。
脳に着想を得た階層的フレームワーク
CoTを超えるために、研究チームは「潜在的推論」を研究した。潜在的推論とは、具体的な「思考トークン」を生成するのではなく、モデルが内部の抽象的な表現を使って問題を思考することである。これは、人間の認知により近い。論文では、「脳は、思考を継続的に言語に変換する必要なく、潜在的な空間において顕著な効率で拡張された論理的推論の連鎖を維持する」と言及されている。
しかし、AIにこのような深遠な内部推論を実装するのは難しい。ディープラーニング・モデルにレイヤーを追加するだけでは、学習シグナルがレイヤーをまたいでフェードアウトし、効果的な学習が妨げられる「勾配の消失」問題が頻繁に発生する。逆に、計算を繰り返し行うリカレント設計では、「早期収束」が発生する可能性があり、この場合、モデルは問題を十分に検証することなく、早期に解を確定してしまう。

優れた方法を求めて、サピエント・チームは神経科学にヒントを求めた。「人間の脳は、現在の人工システムに欠けている計算の深さを達成するための説得力のあるモデルを提示している。「人間の脳は、さまざまな時間スケールで働く皮質領域にわたって階層的に計算を構造化し、深い多段階分析を可能にしています」。
その影響を受けて、研究チームはHRMを2つの相互接続されたリカレントモジュール、すなわち、ゆっくりと抽象的な戦略を練るハイレベル(H)モジュールと、素早く詳細な処理を行うローレベル(L)モジュールで作り上げた。この配置は、研究チームが "階層的収束 "と呼ぶメカニズムを促進する。基本的に、高速のLモジュールは問題の一部分に取り組み、安定した局所的な答えを見つけるまで何サイクルも実行する。その後、低速のHモジュールがこの結果を取り込み、包括的な計画を洗練させ、Lモジュールに新しい、より明確に定義された下位問題を割り当てる。これによってLモジュールは効果的に再起動し、停滞(早期収束)を止め、消失勾配を回避する合理化されたアーキテクチャを使用して、完全なシステムが一連の推論ステージを拡張して実行できるようになる。

論文によると、「このメカニズムにより、HRMは、Hモジュールが大局的な問題解決アプローチを導き、Lモジュールが各フェーズで集中的な探索や精密化を行う、個別の定常的な入れ子計算を次々と実行することができる」。このネストされたループアーキテクチャにより、CoTプロンプトの延長や膨大なデータセットを必要とすることなく、モデルは潜在空間において深い分析を行うことができる。
論理的な懸念は、この "潜在的推論 "が解釈可能性を犠牲にするかどうかである。Sapient Intelligenceの創設者兼CEOであるGuan Wang氏は、この考え方に異議を唱え、CoTがモデルの認知に関する洞察を提供するのと同様に、モデルの内部オペレーションを解釈し、図示することができることを明らかにしている。彼はさらに、CoT自体が信頼できない可能性があることを指摘する。「CoTは、モデルの真の内部推論を正確に表しているわけではありません。「根本的に不透明なのです」。

HRMの動作
HRMのモデルを評価するため、研究チームは、抽象化と推論コーパス(ARC-AGI)、難易度の高い数独パズル、複雑な迷路ナビゲーションタスクなど、集中的な検索とバックトラックを要求するベンチマークとHRMを比較した。
その結果、HRMは洗練されたLLMでも解けないような問題を解くことを学習することが明らかになった。例えば、"Sudoku-Extreme "と "Maze-Hard "のテストでは、トップクラスのCoTモデルは完全に失敗し、0%の精度を記録した。一方、HRMは1タスクあたりわずか1,000例の学習で、ほぼ完璧な精度を達成した。
抽象的推論と汎化の指標であるARC-AGIベンチマークでは、27MパラメータのHRMは40.3%を達成した。これは、はるかに大規模なo3-mini-high(34.5%)やClaude 3.7 Sonnet(21.2%)といった著名なCoTベースのモデルを凌ぐものである。膨大な事前学習データセットを持たず、最小限のデータで実現したこの成果は、HRMの設計の強さと効率の良さを裏付けている。

パズルの解法がこのモデルの能力を示す一方で、その実用的なインパクトは、別のカテゴリーの課題において見られる。Wang氏によると、開発者は言語中心の課題や創造的な課題にはLLMを使い続けるべきだが、「複雑な課題や決定論的な課題」に対しては、HRMスタイルのフレームワークが幻覚を減らし、優れた結果をもたらすという。特に、具現化AIやロボット工学のようなレイテンシが重要な分野や、科学研究のようなデータが疎な領域では、「複雑な意思決定や長期的なプランニングを必要とする逐次的な問題」を強調する。
このような状況では、HRMは解決策を見つけるだけでなく、問題解決を改善するために学習する。「マスターレベルの数独テストでは...HRMは、トレーニングを続けるにつれて、徐々に必要なステップを減らしていきます。
企業にとっては、このアーキテクチャの効率性が収益性に影響を与える。CoTのようなトークンごとの逐次的な生産ではなく、HRMの並列計算によって、ワン氏は「タスク完了速度が100倍加速する」と概算している。その結果、推論の待ち時間が短縮され、エッジ・デバイス上で高度な推論を行うことができるようになる。
経済的なメリットも大きい。「HRMのような特化した推論エンジンは、大規模で高価、かつレイテンシーの高いAPI駆動型モデルと比較して、特定の複雑な推論業務に対してより実行可能な選択肢を提示する」と王氏は述べた。効率性を説明するために、彼は、プロフェッショナルな数独のモデルをトレーニングするのに必要なGPU時間は約2時間、要求の厳しいARC-AGIベンチマークでは50~200GPU時間であることを述べました。これは、データと資金の両方が制限されている状況で、物流計画から複雑なシステムのトラブルシューティングまで、専門的なビジネス課題に対処する機会を創出します。
今後、サピエント・インテリジェンスは、HRMをニッチな問題解決ツールから、より広範で汎用的な推論コンポーネントへと変貌させるべく、すでに前進している。「私たちは、HRMをベースにした脳に触発されたモデルを積極的に構築しています」とワンは言い、ヘルスケア、気候予測、ロボット工学における初期の有望な成果を指摘した。特に自己修正機能の統合によって、これらの将来的なモデルは、現在のテキストベースのシステムとは大きく異なるものになるだろうと彼は示唆した。
この研究は、今日のAIリーダーたちを困惑させている一連の問題に対して、より大きなモデルではなく、人間の脳という最も高度な推論システムをモデルにした、より知的で組織化されたフレームワークが進むべき道である可能性を示唆している。





家






