オプション
ニュース
サムスンの小型AIモデル、推論能力で大型ライバルを上回る

サムスンの小型AIモデル、推論能力で大型ライバルを上回る

2025年12月3日
73

サムスンのAI研究者による新しい論文は、複雑な推論タスクに取り組む際に、コンパクトなネットワークが巨大な大規模言語モデル(LLM)をいかに凌駕できるかを概説している。

AIの覇権争いにおいて、業界では "大きいことは良いことだ "というマントラが一般的だ。ハイテク大手が大規模モデルの開発に数十億ドルを投資する一方で、サムスンSAILモントリオールのアレクシア・ジョリクール=マルティノー氏は、タイニー・リカーシブ・モデル(TRM)を用いた、より効率的なアプローチを提案している。

TRMのパラメータはわずか700万個で、これはトップクラスのLLMの0.01%以下のサイズです。TRMは、ARC-AGI知能テストのような悪名高い困難なベンチマークで、最先端の結果を達成しました。サムスンの研究成果は、AIを進化させる唯一の道はスケールであるという通説を覆すものであり、より持続可能でパラメータ効率の高い選択肢を提示するものです。

規模の限界の克服

LLMは人間のようなテキストを生成することに優れているが、複雑な多段階推論を処理する能力は脆弱であることが多い。LLMはトークン単位で回答を生成するため、初期段階での1つのエラーが解決策全体を損ない、最終的な回答が不正確になる可能性がある。

チェーン・オブ・ソート(Chain-of-Thought)のような技法は、問題をステップごとに分解するモデルで、これを軽減することを目的としている。しかし、これらのアプローチは計算コストが高く、多くの場合、相当な高品質の推論データを必要とし、依然として欠陥のあるロジックを生成する可能性がある。LLMは、このような改良を施しても、完璧な論理実行を要求するパズルを解くことは難しい。

サムスンの研究は、最近の階層推論モデル(HRM)をベースにしている。HRMは、異なる頻度で再帰的に答えを改良する2つの小さなニューラルネットワークを使用していた。有望ではあったが、このモデルは複雑で、不確実な生物学的論拠と、常に適用できるわけではない固定小数点定理に依存していた。

TRMは、HRMの二重ネットワーク構造の代わりに、単一のコンパクトなネットワークを採用し、内部推論と提案された回答の両方を再帰的に強化する。

このモデルは、質問、最初の答えの推測、潜在的な推論機能を受け取る。そして、3つの入力すべてに基づいて推論を改良するために、複数のステップを循環させる。この改善された推論を使用して、最終的な回答予測を更新します。このプロセス全体は最大16回まで繰り返すことができ、モデルは高度にパラメータ効率の良い方法で徐々に自己修正することができる。

この研究では、直感に反して、2層のネットワークは4層のものよりもはるかに優れた汎化が可能であることがわかった。この小さな設計は、限られた特殊なデータセットで訓練する場合によくある問題であるオーバーフィッティングを防ぐようだ。

TRMはまた、以前のモデルにあった複雑な数学的仮定を排除している。オリジナルのHRMモデルは、その学習を正当化するために、関数の固定点への収束を仮定しなければならなかった。TRMは、完全な再帰プロセスをバックプロパゲートすることでこれを回避し、パフォーマンスを大幅に向上させ、数独エクストリームベンチマークの精度をアブレーションテストで56.5%から87.4%に引き上げた。

サムスンのモデルは少ないリソースでAIベンチマークを圧倒

結果は驚くべきものだ。わずか1,000の学習例しか使用しないSudoku-Extremeデータセットにおいて、TRMは87.4%のテスト精度を達成し、HRMの55%から大きく飛躍した。30×30の迷路の長い経路をナビゲートするMaze-Hardでは、HRMの74.5%に対し、TRMは85.3%を記録した。

最も注目すべきは、AIにおける真の流動的知能を評価するために設計されたベンチマークであるARC-AGI(Abstraction and Reasoning Corpus)において、TRMが大きな進歩を遂げたことである。わずか7Mのパラメータで、TRMはARC-AGI-1で44.6%、ARC-AGI-2で7.8%の精度を達成した。これは、27Mのパラメータを使用したHRMを上回り、世界最大のLLMの多くさえも凌駕している。ちなみに、Gemini 2.5 ProはARC-AGI-2で4.9%のスコアしか出していない。

TRMのトレーニングプロセスも最適化されている。ACTと呼ばれる適応メカニズムは、モデルが解答を十分に改善して次に進むタイミングを決定するものであるが、このメカニズムが簡素化され、各トレーニングステップでコストのかかる2回目のフォワードパスが不要になった。この調整によって、全体的な汎化が損なわれることはなかった。

サムスンの研究は、AIモデルがますます巨大化する傾向に対して、強力な対抗策を提供する。反復推論と自己修正が可能なアーキテクチャーを設計することで、極めて困難な問題でも計算資源のごく一部で解決できることを示している。

こちらもご覧ください:グーグルの新しいAIエージェントが脆弱性修正を自動化するためにコードを書き換える

AIとビッグデータについて、業界のリーダーからもっと学びたいですか?アムステルダム、カリフォルニア、ロンドンで開催されるAI & Big Data Expoにご参加ください。この包括的なイベントはTechExの一部であり、Cyber Security Expoのような他の主要な技術イベントと並行して開催されます。詳細はここをクリック。

AIニュースはTechForge Mediaが提供しています。その他の企業向けテクノロジーイベントやウェビナーについてはこちらをご覧ください。

関連記事
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。 WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。 人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示 カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示 カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない 億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
関連特集おすすめ
仕事 おすすめのAI採用ツール:履歴書の選考と候補者の面接スケジュール管理を自動化
おすすめのAI採用ツール:履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう!

10 ツール
xix.ai
生産性 AIパーソナルウェルネス&集中力コーチ:バーンアウトの予防とメンタルエネルギーの向上
AIパーソナルウェルネス&集中力コーチ:バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス&集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール
xix.ai
チャットボット 高評価のAI恋愛チャットボット:一貫した個性で長期的な関係を築く
高評価のAI恋愛チャットボット:一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール
xix.ai
教育と学習 最高のAIデータサイエンスメンター:SQL、Pandas、および機械学習ワークフローをマスターしましょう
最高のAIデータサイエンスメンター:SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール
xix.ai
チャットボット 最高のAIを使ったナンパ&会話トレーニング:社交的な魅力と自信をリアルタイムで高める
最高のAIを使ったナンパ&会話トレーニング:社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール
xix.ai
コード 自動化ユニットテストに最適なAIツール:ワンクリックでJest、PyTest、JUnitのテストケースを生成する
自動化ユニットテストに最適なAIツール:ワンクリックでJest、PyTest、JUnitのテストケースを生成する

2026年に登場した、自動化ユニットテスト用の最高評価を受けたAIツールを発見してください。当社が厳選したこれらのツールは、Jest、PyTest、JUnitのテストケースを瞬時に生成するための強力で革新的なソリューションです。XIX.AIでは、無料オプションと有料オプションを実際のテストデータと共に比較し、毎週更新されるランキングもご覧いただけます。今すぐAIの力を活用して、開発生産性を向上させましょう。

10 ツール
xix.ai
コメント (0)
0/500
OR