グーグル、Gemini 2.5 FlashでAI推論のユーザー制御を可能に
グーグルは、ジェミニ2.5のフラッシュモデルにAI推論制御機能を実装し、開発者にシステムが問題解決に使用する処理能力に上限を設ける機能を提供した。
4月17日に発表されたこの "思考予算 "は、高度なAIモデルがしばしば単純な問題を考えすぎて計算資源を浪費し、運用コストや環境コストを増大させるという、業界の高まる問題に対処するものだ。
画期的なものではないが、この開発は、推論機能が商用AIシステムの標準になるにつれて浮上してきた効率性の問題に取り組むための実用的な動きである。
この新しい制御により、開発者はモデルが応答する前に処理リソースを正確に調整できるようになり、AI利用による財政的・環境的影響を処理する方法を変える可能性がある。
「ジェミニの製品管理ディレクターであるTulsee Doshi氏は、「モデルは考えすぎてしまいます。「基本的なプロンプトに対して、モデルは必要以上に考えてしまうのです」。
この認識は、高度な推論モデルが直面するジレンマを浮き彫りにしている。
推論機能への移行は、予期せぬ欠点をもたらした。従来の大規模な言語モデルは、トレーニング・データからパターンをマッチングさせることに頼っていたが、新しいバージョンは問題を理路整然と解決しようとする。この論理的なステップ・バイ・ステップのアプローチは、複雑なタスクではより良い結果をもたらしますが、単純な要求では大きな非効率を生み出します。
コストとパフォーマンスのバランス
制御されていないAIの推論が財務に与える影響は大きい。グーグルのテクニカルノートによると、完全な推論を有効にした場合、出力を生成するコストは標準的な処理の約6倍になるという。このコスト増は、正確な制御を求める強い動機となる。
Hugging Face社で推論モデルを研究しているエンジニアのネイサン・ハビブは、この問題を業界で広く見られる問題だと呼んでいる。「よりスマートなAIを実証しようとする競争の中で、企業は推論モデルを不必要なときでも万能ツールのように使っています」と彼はMITテクノロジーレビューに語った。
無駄は単なる仮説にとどまらない。ハビブ氏は、トップクラスの推論モデルが、有機化学の問題を解こうとしている間に、繰り返しループにはまり、何百回も「待った、しかし......」と言いながら、処理能力を消費しながら、本質的には計算の破綻に苦しんでいることを示した。
DeepMindでGeminiモデルの評価を行っているKate Olszewskaは、Googleのシステムが時々同様の問題に直面し、答えの質を向上させることなくコンピューティングリソースを使用するループに陥ることを確認した。
きめ細かな制御メカニズム
グーグルのAI推論制御は、開発者に正確な調整能力を与える。このシステムは、ゼロ(最小限の推論)から24,576トークンの「思考バジェット」(モデルの内部処理を表す計算単位)までの柔軟なスケールを提供する。この詳細なアプローチにより、特定のニーズに基づいたカスタマイズされた実装が可能になる。
ディープマインドの主任研究員であるジャック・ライは、理想的な推論レベルを決定することは依然として困難であると指摘する。
開発哲学の転換
AI推論制御の導入は、人工知能の進歩の仕方に変化をもたらすかもしれない。2019年以降、企業はより多くのパラメーターと学習データを持つより大きなモデルを作成することで改善を追求してきた。グーグルの戦略は、規模の大きさよりも効率を優先する、異なる方向性を示唆している。
「スケーリングの法則に取って代わられつつある」とハビブ氏は観察し、将来の進歩は、モデルサイズを際限なく拡大するのではなく、推論プロセスを洗練させることでもたらされる可能性があることを示唆している。
環境への影響も同様に重要である。推論モデルがより一般的になると、それに伴ってエネルギー使用量も増加する。研究によれば、推論によってAIの応答が生成されることで、技術の二酸化炭素排出量は最初のトレーニング段階よりも増加する。グーグルの推論制御は、この憂慮すべき傾向に対する可能な解決策を提供している。
競争力学
グーグルは真空地帯で仕事をしているわけではない。今年初めに登場した "オープンウェイト "のディープシークR1モデルは、潜在的に低いコストで強力な推論能力を示し、市場の不安定性を引き起こし、1兆ドル近い株式市場の変動につながったと伝えられている。
グーグル独自の方法とは異なり、ディープシークは開発者がローカルで実行できるように内部構成を公開している。
このような競争にもかかわらず、Google DeepMindの最高技術責任者であるKoray Kavukcuoglu氏は、極めて高い精度が要求される特殊な分野では、独自のモデルが優位性を保つと考えている。
産業成熟の兆し
AIの推論制御の創造は、業界が技術的な測定を超えた実用的な限界に直面していることを反映している。各社が推論能力を進化させ続ける一方で、グーグルのアプローチは重要な現実を認識している。つまり、商業アプリケーションでは、効率は生の性能と同じくらい重要なのだ。
この特徴はまた、技術的進歩と持続可能性への配慮の間の緊張を強調している。推論モデルのパフォーマンス・トラッカーは、個々のタスクの完了に200ドル以上のコストがかかることを示しており、このような機能を実世界の環境で大規模に実装することへの懸念を高めている。
開発者が実際の要件に応じて推論レベルを調整できるようにすることで、グーグルはAI導入の経済的側面と環境的側面の両方に対処している。
「推論は知能を構築する基本的な能力です。「モデルが思考を開始した瞬間に、そのエージェンシーが出現する。この言葉は、推論モデルの可能性と難しさの両方を捉えている。推論モデルの独立性は、可能性とリソース管理の両方の課題を生み出す。
AIソリューションを導入する組織にとって、推論予算を微調整する能力は、運用効率を維持しながら高度な機能をより利用しやすくする可能性がある。
Googleは、Gemini 2.5 Flashが「他の主要なモデルに匹敵する性能を、わずかなコストとサイズで」達成すると述べている。
実用的な意味合い
AI推論制御機能は、実世界ですぐに利用できる。商用アプリケーションを作成する開発者は、処理の深さと運用コストの間で意識的な選択を行うことができる。
基本的な顧客問い合わせのような簡単なアプリケーションでは、最小限の推論設定でリソースを節約しながら、モデルの能力を活用することができます。深い理解を必要とする複雑な分析には、完全な推論能力を利用できる。
グーグルの推論「ダイヤル」は、性能基準を維持しながらコスト予測可能性を達成する方法を提供する。
こちらもご覧ください:Gemini 2.5:グーグル、これまでで「最もインテリジェントな」AIモデルを開発
業界のリーダーからAIとビッグデータについてもっと学びたいですか?アムステルダム、カリフォルニア、ロンドンで開催されるAI & Big Data Expoをチェックしよう。この包括的なイベントは、Intelligent Automation Conference、BlockX、Digital Transformation Week、Cyber Security & Cloud Expoなどの他の主要イベントと併催されています。
テックフォージが提供するその他の企業向けテクノロジーイベントやウェビナーについては、こちらをご覧ください。
関連記事
カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示
カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
関連特集おすすめ
コメント (1)
0/500
グーグルは、ジェミニ2.5のフラッシュモデルにAI推論制御機能を実装し、開発者にシステムが問題解決に使用する処理能力に上限を設ける機能を提供した。
4月17日に発表されたこの "思考予算 "は、高度なAIモデルがしばしば単純な問題を考えすぎて計算資源を浪費し、運用コストや環境コストを増大させるという、業界の高まる問題に対処するものだ。
画期的なものではないが、この開発は、推論機能が商用AIシステムの標準になるにつれて浮上してきた効率性の問題に取り組むための実用的な動きである。
この新しい制御により、開発者はモデルが応答する前に処理リソースを正確に調整できるようになり、AI利用による財政的・環境的影響を処理する方法を変える可能性がある。
「ジェミニの製品管理ディレクターであるTulsee Doshi氏は、「モデルは考えすぎてしまいます。「基本的なプロンプトに対して、モデルは必要以上に考えてしまうのです」。
この認識は、高度な推論モデルが直面するジレンマを浮き彫りにしている。
推論機能への移行は、予期せぬ欠点をもたらした。従来の大規模な言語モデルは、トレーニング・データからパターンをマッチングさせることに頼っていたが、新しいバージョンは問題を理路整然と解決しようとする。この論理的なステップ・バイ・ステップのアプローチは、複雑なタスクではより良い結果をもたらしますが、単純な要求では大きな非効率を生み出します。
コストとパフォーマンスのバランス
制御されていないAIの推論が財務に与える影響は大きい。グーグルのテクニカルノートによると、完全な推論を有効にした場合、出力を生成するコストは標準的な処理の約6倍になるという。このコスト増は、正確な制御を求める強い動機となる。
Hugging Face社で推論モデルを研究しているエンジニアのネイサン・ハビブは、この問題を業界で広く見られる問題だと呼んでいる。「よりスマートなAIを実証しようとする競争の中で、企業は推論モデルを不必要なときでも万能ツールのように使っています」と彼はMITテクノロジーレビューに語った。
無駄は単なる仮説にとどまらない。ハビブ氏は、トップクラスの推論モデルが、有機化学の問題を解こうとしている間に、繰り返しループにはまり、何百回も「待った、しかし......」と言いながら、処理能力を消費しながら、本質的には計算の破綻に苦しんでいることを示した。
DeepMindでGeminiモデルの評価を行っているKate Olszewskaは、Googleのシステムが時々同様の問題に直面し、答えの質を向上させることなくコンピューティングリソースを使用するループに陥ることを確認した。
きめ細かな制御メカニズム
グーグルのAI推論制御は、開発者に正確な調整能力を与える。このシステムは、ゼロ(最小限の推論)から24,576トークンの「思考バジェット」(モデルの内部処理を表す計算単位)までの柔軟なスケールを提供する。この詳細なアプローチにより、特定のニーズに基づいたカスタマイズされた実装が可能になる。
ディープマインドの主任研究員であるジャック・ライは、理想的な推論レベルを決定することは依然として困難であると指摘する。
開発哲学の転換
AI推論制御の導入は、人工知能の進歩の仕方に変化をもたらすかもしれない。2019年以降、企業はより多くのパラメーターと学習データを持つより大きなモデルを作成することで改善を追求してきた。グーグルの戦略は、規模の大きさよりも効率を優先する、異なる方向性を示唆している。
「スケーリングの法則に取って代わられつつある」とハビブ氏は観察し、将来の進歩は、モデルサイズを際限なく拡大するのではなく、推論プロセスを洗練させることでもたらされる可能性があることを示唆している。
環境への影響も同様に重要である。推論モデルがより一般的になると、それに伴ってエネルギー使用量も増加する。研究によれば、推論によってAIの応答が生成されることで、技術の二酸化炭素排出量は最初のトレーニング段階よりも増加する。グーグルの推論制御は、この憂慮すべき傾向に対する可能な解決策を提供している。
競争力学
グーグルは真空地帯で仕事をしているわけではない。今年初めに登場した "オープンウェイト "のディープシークR1モデルは、潜在的に低いコストで強力な推論能力を示し、市場の不安定性を引き起こし、1兆ドル近い株式市場の変動につながったと伝えられている。
グーグル独自の方法とは異なり、ディープシークは開発者がローカルで実行できるように内部構成を公開している。
このような競争にもかかわらず、Google DeepMindの最高技術責任者であるKoray Kavukcuoglu氏は、極めて高い精度が要求される特殊な分野では、独自のモデルが優位性を保つと考えている。
産業成熟の兆し
AIの推論制御の創造は、業界が技術的な測定を超えた実用的な限界に直面していることを反映している。各社が推論能力を進化させ続ける一方で、グーグルのアプローチは重要な現実を認識している。つまり、商業アプリケーションでは、効率は生の性能と同じくらい重要なのだ。
この特徴はまた、技術的進歩と持続可能性への配慮の間の緊張を強調している。推論モデルのパフォーマンス・トラッカーは、個々のタスクの完了に200ドル以上のコストがかかることを示しており、このような機能を実世界の環境で大規模に実装することへの懸念を高めている。
開発者が実際の要件に応じて推論レベルを調整できるようにすることで、グーグルはAI導入の経済的側面と環境的側面の両方に対処している。
「推論は知能を構築する基本的な能力です。「モデルが思考を開始した瞬間に、そのエージェンシーが出現する。この言葉は、推論モデルの可能性と難しさの両方を捉えている。推論モデルの独立性は、可能性とリソース管理の両方の課題を生み出す。
AIソリューションを導入する組織にとって、推論予算を微調整する能力は、運用効率を維持しながら高度な機能をより利用しやすくする可能性がある。
Googleは、Gemini 2.5 Flashが「他の主要なモデルに匹敵する性能を、わずかなコストとサイズで」達成すると述べている。
実用的な意味合い
AI推論制御機能は、実世界ですぐに利用できる。商用アプリケーションを作成する開発者は、処理の深さと運用コストの間で意識的な選択を行うことができる。
基本的な顧客問い合わせのような簡単なアプリケーションでは、最小限の推論設定でリソースを節約しながら、モデルの能力を活用することができます。深い理解を必要とする複雑な分析には、完全な推論能力を利用できる。
グーグルの推論「ダイヤル」は、性能基準を維持しながらコスト予測可能性を達成する方法を提供する。
こちらもご覧ください:Gemini 2.5:グーグル、これまでで「最もインテリジェントな」AIモデルを開発
業界のリーダーからAIとビッグデータについてもっと学びたいですか?アムステルダム、カリフォルニア、ロンドンで開催されるAI & Big Data Expoをチェックしよう。この包括的なイベントは、Intelligent Automation Conference、BlockX、Digital Transformation Week、Cyber Security & Cloud Expoなどの他の主要イベントと併催されています。
テックフォージが提供するその他の企業向けテクノロジーイベントやウェビナーについては、こちらをご覧ください。
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて





家






