アリババの「ZeroSearch」AI、自律学習でトレーニングコストを88%削減

アリババのゼロサーチ:AIの学習効率に変革をもたらす
アリババグループの研究者は、AIシステムが情報検索を学習する方法に革命を起こす可能性のある画期的な方法を開拓し、コストのかかる商用検索エンジンAPIを完全に回避した。彼らのZeroSearchテクノロジーは、大規模な言語モデルが、トレーニング段階において、従来の検索エンジンとのやりとりの代わりに、シミュレートされた環境を通して洗練された検索能力を培うことを可能にする。
「従来の強化学習では、大規模な検索要求が必要なため、APIコストがかさみ、スケーラビリティの妨げになっていました」と、研究者たちは新たに発表したarXiv論文で説明している。"ZeroSearchは、実際の検索エンジンに依存せずにLLMの検索機能を強化する、費用対効果の高い強化学習フレームワークを表している。"
検索不要のトレーニングを支える仕組み
現在のAI学習方法は、主に2つの制約に直面している:学習サイクル中の商用検索エンジンによる一貫性のない文書品質と、Google検索のようなサービスへの膨大なAPIコール量による法外な費用である。
ZeroSearchは、革新的な2段階のアプローチを実装している:
- 最初の教師付き微調整は、LLMを文書生成モジュールに変換する。
- 高度なカリキュラムベースの強化は、出力品質を徐々に変化させる。
「我々の基本的な発見は、事前に訓練されたLLMは、文脈に適した文書を生成するのに十分な世界知識を持っていることを明らかにした」と研究者たちは述べている。「シミュレートされた検索出力と実際の検索出力の主な違いは、実質的な内容のギャップではなく、文体的なテキストの違いである。
性能ベンチマークが示す大きな利点
7つの異なる質問回答データセットでの厳密なテストにより、ZeroSearchの優位性が実証された:
- 7BのパラメータモデルがGoogle検索の精度と一致
- 14Bのパラメータ構成は、商用検索のパフォーマンスを上回りました。
経済的な影響は特に顕著です:
- 64Kクエリを使用した従来のトレーニング:SerpAPI経由で586.70ドル
- A100GPUを4台使用したZeroSearchと同等:70.80ドル
- 総コスト削減:88
「これらの結果は、強化学習の実装において、LLMが従来の検索エンジンの代替となることを証明するものです」と研究チームは結論付けている。
AI開発への広範な影響
ZeroSearchは、外部ツールに依存しない自律的な能力開発を実証することで、人工知能トレーニング手法のパラダイムシフトを意味する。
このテクノロジーは、いくつかの変革的影響を約束する:
- コストの民主化:高価なAPI依存を排除することで、新興企業にとっての経済的障壁を軽減する。
- トレーニングの制御:モデル開発中の情報入力の正確な制御を可能にする。
- アーキテクチャの柔軟性:Qwen-2.5やLLaMA-3.2を含む主要なモデルファミリーに互換性があります。
アリババは、コードベース、トレーニングデータセット、事前学習済みモデルを含む完全な実装を、GitHubとHugging Faceリポジトリを通じてオープンソース化している。
この技術革新は、外部サービスに依存するのではなく、高度なシミュレーションを通じて高度な能力が生まれるという、新たなAI開発の展望を予見させるものだ。このような自給自足のトレーニング技術が成熟するにつれて、主要なプラットフォームAPIに依存している現在の技術エコシステムを大幅に再編成する可能性がある。
関連記事
マルチバース・コンピューティング、無料圧縮生成AIモデルを発表
大規模言語モデルは重大な課題に直面している:その膨大なサイズである。スペインのスタートアップMultiverse Computingは、最先端AIの能力と企業が実用的に導入できる範囲とのギャップを埋めるべく設計された圧縮モデルを開発することでこの問題に取り組んでいる。同社の革新的な技術「CompactifAI」は量子コンピューティング原理に着想を得た圧縮技術であり、バスク地方のこの企業はOpenA
AIがニュースコンテンツに潜む隠された意図を明らかにする
ChatGPTスタイルのモデルは現在、ニュース記事の根底にある視点を解明するよう訓練されている——たとえその視点が引用文やフレームワーク、あるいは(時に不誠実な)中立性の覆いの下に隠されていても。見出し、リード文、引用文といったセグメントに記事を分割することで、新たなシステムは長文のプロフェッショナルなジャーナリズムにおいても偏りを識別することを学習する。 執筆者や発言者の真の立場を把握する能力—
秘密の追跡データがAIモデルの盗難を暴露
新たな手法により、ChatGPTのようなモデルに再学習なしで数秒で目に見えない透かしを埋め込める。標準出力に痕跡を残さず、あらゆる実用的な除去試みを耐えうる。 透かしと「著作権侵害の誘引」の主な違いは、透かし(可視・不可視を問わず)が通常、画像データセットなどのコレクション全体に一貫して配置され、軽率な複製に対する抑止力として設計されている点である。これに対し、偽装エントリとは、大規模な汎用コレク
関連特集おすすめ
コメント (1)
0/500

アリババのゼロサーチ:AIの学習効率に変革をもたらす
アリババグループの研究者は、AIシステムが情報検索を学習する方法に革命を起こす可能性のある画期的な方法を開拓し、コストのかかる商用検索エンジンAPIを完全に回避した。彼らのZeroSearchテクノロジーは、大規模な言語モデルが、トレーニング段階において、従来の検索エンジンとのやりとりの代わりに、シミュレートされた環境を通して洗練された検索能力を培うことを可能にする。
「従来の強化学習では、大規模な検索要求が必要なため、APIコストがかさみ、スケーラビリティの妨げになっていました」と、研究者たちは新たに発表したarXiv論文で説明している。"ZeroSearchは、実際の検索エンジンに依存せずにLLMの検索機能を強化する、費用対効果の高い強化学習フレームワークを表している。"
検索不要のトレーニングを支える仕組み
現在のAI学習方法は、主に2つの制約に直面している:学習サイクル中の商用検索エンジンによる一貫性のない文書品質と、Google検索のようなサービスへの膨大なAPIコール量による法外な費用である。
ZeroSearchは、革新的な2段階のアプローチを実装している:
- 最初の教師付き微調整は、LLMを文書生成モジュールに変換する。
- 高度なカリキュラムベースの強化は、出力品質を徐々に変化させる。
「我々の基本的な発見は、事前に訓練されたLLMは、文脈に適した文書を生成するのに十分な世界知識を持っていることを明らかにした」と研究者たちは述べている。「シミュレートされた検索出力と実際の検索出力の主な違いは、実質的な内容のギャップではなく、文体的なテキストの違いである。
性能ベンチマークが示す大きな利点
7つの異なる質問回答データセットでの厳密なテストにより、ZeroSearchの優位性が実証された:
- 7BのパラメータモデルがGoogle検索の精度と一致
- 14Bのパラメータ構成は、商用検索のパフォーマンスを上回りました。
経済的な影響は特に顕著です:
- 64Kクエリを使用した従来のトレーニング:SerpAPI経由で586.70ドル
- A100GPUを4台使用したZeroSearchと同等:70.80ドル
- 総コスト削減:88
「これらの結果は、強化学習の実装において、LLMが従来の検索エンジンの代替となることを証明するものです」と研究チームは結論付けている。
AI開発への広範な影響
ZeroSearchは、外部ツールに依存しない自律的な能力開発を実証することで、人工知能トレーニング手法のパラダイムシフトを意味する。
このテクノロジーは、いくつかの変革的影響を約束する:
- コストの民主化:高価なAPI依存を排除することで、新興企業にとっての経済的障壁を軽減する。
- トレーニングの制御:モデル開発中の情報入力の正確な制御を可能にする。
- アーキテクチャの柔軟性:Qwen-2.5やLLaMA-3.2を含む主要なモデルファミリーに互換性があります。
アリババは、コードベース、トレーニングデータセット、事前学習済みモデルを含む完全な実装を、GitHubとHugging Faceリポジトリを通じてオープンソース化している。
この技術革新は、外部サービスに依存するのではなく、高度なシミュレーションを通じて高度な能力が生まれるという、新たなAI開発の展望を予見させるものだ。このような自給自足のトレーニング技術が成熟するにつれて、主要なプラットフォームAPIに依存している現在の技術エコシステムを大幅に再編成する可能性がある。
マルチバース・コンピューティング、無料圧縮生成AIモデルを発表
大規模言語モデルは重大な課題に直面している:その膨大なサイズである。スペインのスタートアップMultiverse Computingは、最先端AIの能力と企業が実用的に導入できる範囲とのギャップを埋めるべく設計された圧縮モデルを開発することでこの問題に取り組んでいる。同社の革新的な技術「CompactifAI」は量子コンピューティング原理に着想を得た圧縮技術であり、バスク地方のこの企業はOpenA
AIがニュースコンテンツに潜む隠された意図を明らかにする
ChatGPTスタイルのモデルは現在、ニュース記事の根底にある視点を解明するよう訓練されている——たとえその視点が引用文やフレームワーク、あるいは(時に不誠実な)中立性の覆いの下に隠されていても。見出し、リード文、引用文といったセグメントに記事を分割することで、新たなシステムは長文のプロフェッショナルなジャーナリズムにおいても偏りを識別することを学習する。 執筆者や発言者の真の立場を把握する能力—
秘密の追跡データがAIモデルの盗難を暴露
新たな手法により、ChatGPTのようなモデルに再学習なしで数秒で目に見えない透かしを埋め込める。標準出力に痕跡を残さず、あらゆる実用的な除去試みを耐えうる。 透かしと「著作権侵害の誘引」の主な違いは、透かし(可視・不可視を問わず)が通常、画像データセットなどのコレクション全体に一貫して配置され、軽率な複製に対する抑止力として設計されている点である。これに対し、偽装エントリとは、大規模な汎用コレク





家






