Hy3 プレビュー:Yuanの再編後初のオープンソース版リリース、実用性とエージェント機能が強化
4月23日、テンセントのHuan Yuanは、言語モデル「Hy3preview」をオープンソースとして公開した。 このハイブリッドエキスパートモデルは、高速推論と低速推論を組み合わせたもので、総パラメータ数2,950億、アクティブパラメータ数210億を誇り、最大256Kのコンテキスト長に対応しています。これはHuan Yuanの再構築後にトレーニングされた最初のモデルであり、Huan Yuan史上最も知能の高いモデルとして、複雑な推論、指示の遂行、コンテキスト内学習、コード生成、エージェント機能、および全体的な推論性能において大幅な向上を実現しています。
2026年2月、テンセント・Huan Yuanは、実用的な有用性を実現するための3つの指針を確立するとともに、事前学習および強化学習のインフラを再構築しました:
1. 体系的な能力:専門化を重視するのではなく、コードエージェントのような単一のアプリケーションでさえ、推論、長文コンテキスト処理、指示の遂行、対話、コーディング、ツール使用といった領域にわたる深い連携が必要であることを認識しています。
2. 実証的な評価:容易に操作可能な公開ベンチマークにとどまらず、社内で開発した質問、最新の試験問題、人間による評価、製品固有のクラウドテストなどの手法を用いて、モデルの実世界における有効性を評価・向上させます。
3. 費用対効果への注力:実用性は商業的な実現可能性と一致していなければなりません。共同設計されたモデルアーキテクチャと推論フレームワークにより、タスクコストを大幅に低減し、AIを手頃な価格で効果的なものにします。
Hy3previewは、現実世界の問題を解決する実用的な大規模言語モデルの開発を加速させる、Huan Yuanの取り組みの始まりを告げるものです。
テンセントのチーフAIサイエンティストである姚順宇氏は、Hy3previewがHuan Yuanのモデル再構築における第一歩であると指摘しました。今回のオープンソース公開を通じて、コミュニティやユーザーからの真摯なフィードバックを期待しており、それらが公式版Hy3の実用性をさらに磨き上げる助けとなるでしょう。 同時に、私たちは事前学習と強化学習のスケールアップを継続し、モデルの知能の限界をさらに高めています。数多くのテンセント製品との深い共同設計を通じて、モデルの実世界でのパフォーマンスを着実に向上させ、特化型モデルの機能の探求も開始しています。
現在、Hy3previewはTencent Cloud、Yua、ima、CodeBuddy、WorkBuddy、QQ、QQ Browser、Tencent Docs、Tencent LeXiangで利用可能です。WeChat公式アカウント、Peace Elite、Tencent News、Tencent Stock Selection、Tencent Customer Service、WeChat Readingなどの主要製品への展開も順次進められています。 さらに、Hy3previewはOpenClaw、OpenCode、KiloCodeなどの主要なオープンソースエージェントフレームワークと統合されており、Tencent Cloudの大規模モデルサービスプラットフォーム「TokenHub」にも掲載されています。
Hy3previewは、エージェント機能の大幅な向上により、全方位的な実用性を重視しています
複数の評価により、Hy3previewの能力が全面的に向上したことが確認されています。
1.卓越した文脈学習および指示遵守能力
多様な実世界の運用環境や日常のシナリオにおいて、乱雑で長大な文脈を解析し、複雑で変化し続けるルールに従うことは、モデルにとって依然として重要な課題です。Tencentのビジネスユースケースを参考に、Huan Yuanは文脈内学習を革新的に評価するためのCL-benchおよびCL-bench-Lifeを導入し、Hy3previewの文脈学習能力と指示遵守能力を大幅に向上させました。

2. 卓越した複雑推論能力:中国・清華大学の数学博士課程入学試験で最高得点を達成
複雑な推論能力は、多様な問題に取り組むモデルの基盤となります。Hy3previewは、FrontierScience-OlympiadやIMOAnswerBenchといった難易度の高いSTEM推論ベンチマークで優れた成績を収め、最新の清華大学曲真学院数学博士課程資格試験(2026年春)および全国高校生物コンテスト(CHSBO2025)でも傑出したスコアを記録し、堅牢な汎用推論能力を実証しました。

3. コードおよびエージェント機能の大幅な進歩により、高い費用対効果を実証
コードおよびエージェント機能は、Hy3previewにおける最も顕著な改善点です。刷新された事前学習および強化学習(RL)インフラと、RLタスクの規模拡大により、Tencent Huan Yuanは、SWE-Bench VerifiedやTerminal-Bench2.0といった主要なコードエージェントベンチマーク、ならびにBrowseCompやWideSearchといった検索エージェントベンチマークにおいて、短期間で競争力のあるスコアを達成しました。

デジタル領域において、コードは開発環境でのタスク実行能力を測定し、検索はオープンソースからの情報取得・フィルタリング・統合能力を評価する。これらを総合することで、OpenClawのような複雑なエージェントシナリオにおいてモデルが真に有用かどうかが判断される。Hy3previewはClawEvalやWildClawBenchなどの評価で優れた結果を達成し、当社のエージェント能力が完全性と実用性に向けて着実に進歩していることを示した。

公開ベンチマークに加え、Tencent Huan Yuanは実際の開発環境におけるモデルの性能を測定するため、複数の内部評価スイートを構築しました。その結果、バックエンドエンジニアリングタスクセット「Hy-Backend」、開発者向けの「Hy-Vibe Bench」、そして難易度の高いソフトウェアエンジニアリングセット「Hy-SWE Max」のすべてにおいて、Hy3previewは高い競争力を発揮しました。

オープンソースの競合モデルとのモデルサイズおよびエージェントの総合性能を比較した場合、Hy3previewはその高い費用対効果で際立っています。

テンセントの中核事業は完全に統合されており、複数の主要AI製品において明確なメリットが確認されています
正式リリースに先立ち、Hy3previewはテンセントの主要なAI製品群でテストされ、顕著な好結果をもたらしました。
Yuaに関しては、Huan YuanとYuaの間で綿密な共同設計が行われました。意図理解精度、テキスト生成品質、ディープサーチといった主要指標におけるモデルのパフォーマンスが向上したほか、文章スタイル、表現力、感情的知性、コンテンツ構造、専門性についても微調整が施されました。このモデルと製品の緊密な連携により、ユーザーにはより知的で人間らしい対話体験が提供されました。
imaのナレッジベースQAおよび一般的なQAシナリオにおけるテストでは、Hy3previewが長文処理、特に検索タスクにおいて優れた性能を発揮し、回答の精度、網羅性、包括性において高い水準を達成していることが明らかになりました。
CodeBuddyおよびWorkBuddyにおいて、Hy3previewのファーストトークン遅延は54%短縮され、エンドツーエンドの処理時間は47%短縮され、成功率は99.99%以上に上昇しました。実際のユーザー環境では、文書処理、データ分析、ナレッジ検索、MCPツールチェーンのオーケストレーションなど、多様なオフィス業務にまたがる最大495ステップの複雑なエージェントワークフローを安定して実行しています。
WeChat公式アカウントのAIアバターおよびAIカスタマーサービスに関する専用評価において、Hy3previewはHy2と比較してより包括的な機能向上を実現しました。ユーザーの意図理解、複雑な文脈の継続、および知識の整理において、より高い成熟度を示しました。 曖昧なクエリ、短い文、多ターン対話に対処する際、ユーザーのニーズをより的確に把握し、より明確で安定した応答を生成しました。ナレッジベース、ユーザー記憶、文脈生成を統合することで、その出力はAIアバターやカスタマーサービスの役割により密接に合致し、過剰な想像、主観的な推測、感情的なトーンを大幅に低減させ、全体的なインタラクションを「信頼でき、自然で、効率的な」体験に近づけました。
『Peace Elite』のAI NPCシナリオにおいて、チームはHy3previewのリリース後、迅速に統合・評価を行い、全体として印象的な結果を得ました。 ゲーム外でのキャラクターロールプレイにおいて、Hy3previewはキャラクター設定を正確に把握し、自由回答形式の質問に対して関連性が高く付加価値のあるコンテンツを提供することで、より現実的で自然かつ没入感のある会話を創出しました。複雑なゲーム内戦闘シナリオにおいても、モデルの応答タイミングは実在のプレイヤーに近いものとなり、優れた安定性と人間のようなロールプレイ能力を示し、全体として卓越したパフォーマンスを発揮しました。
Tencent DocsのAI PPTシナリオにおいて、以前のHy2バージョンと比較して、Hy3previewは大幅な向上を示しました。生成成功率は20%上昇し、評価スコアは10%向上し、生成時間は20%短縮されました。全体として、新モデルはテンプレートの選択、配色の調整、アウトラインの生成、コンテンツの補完において優れた性能を発揮し、幻覚現象がなく、テーマに沿っており、視覚的な魅力も高いものでした。
QQのAIアシスタント「Xiao Q」においては、Hy3previewが導入されたことで、前バージョンと比較して、長文の初回応答遅延、全体的な応答速度、ストリーミング効率において大幅な最適化が実現しました。数学的推論などのコア機能は著しく向上し、マルチシナリオでの指示遵守能力や汎化能力もさらに強化されました。 ツール呼び出し推論やマルチターン参照解決においては、より安定的かつ効率的なパフォーマンスを発揮した。OpenClawによる公式PinchBench QQインテリジェントエージェントシナリオテストでは、傑出した結果を達成し、全体的なユーザー体験が著しく向上した。
推論効率は40%向上し、同等のコストで最適な知能密度を実現
モデルと推論フレームワークの深い連携に加え、推論フレームワーク、演算子のパフォーマンス、量子化アルゴリズムなどにおける包括的な最適化により、全体的な推論効率は40%向上し、Hy3previewのコストは前世代に比べて大幅に低下しました。
Tencent Cloudの大規模モデルサービスプラットフォーム「TokenHub」において、Hy3previewの入力価格は100万トークンあたりわずか1.2元、入力キャッシュは100万トークンあたり0.4元、出力は100万トークンあたり4元となっています。 さらに、Tencent CloudとHuan Yuanは共同でカスタマイズされた「Hy3preview Token Plan」パッケージを導入しており、個人向けエディションは月額28元から利用可能です。これは、エージェント開発や「Lobster」アプリケーションの構築において、コストパフォーマンスに優れた選択肢となります。


関連記事
Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ
AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか?
イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(
関連特集おすすめ
コメント (0)
0/500
4月23日、テンセントのHuan Yuanは、言語モデル「Hy3preview」をオープンソースとして公開した。 このハイブリッドエキスパートモデルは、高速推論と低速推論を組み合わせたもので、総パラメータ数2,950億、アクティブパラメータ数210億を誇り、最大256Kのコンテキスト長に対応しています。これはHuan Yuanの再構築後にトレーニングされた最初のモデルであり、Huan Yuan史上最も知能の高いモデルとして、複雑な推論、指示の遂行、コンテキスト内学習、コード生成、エージェント機能、および全体的な推論性能において大幅な向上を実現しています。
2026年2月、テンセント・Huan Yuanは、実用的な有用性を実現するための3つの指針を確立するとともに、事前学習および強化学習のインフラを再構築しました:
1. 体系的な能力:専門化を重視するのではなく、コードエージェントのような単一のアプリケーションでさえ、推論、長文コンテキスト処理、指示の遂行、対話、コーディング、ツール使用といった領域にわたる深い連携が必要であることを認識しています。
2. 実証的な評価:容易に操作可能な公開ベンチマークにとどまらず、社内で開発した質問、最新の試験問題、人間による評価、製品固有のクラウドテストなどの手法を用いて、モデルの実世界における有効性を評価・向上させます。
3. 費用対効果への注力:実用性は商業的な実現可能性と一致していなければなりません。共同設計されたモデルアーキテクチャと推論フレームワークにより、タスクコストを大幅に低減し、AIを手頃な価格で効果的なものにします。
Hy3previewは、現実世界の問題を解決する実用的な大規模言語モデルの開発を加速させる、Huan Yuanの取り組みの始まりを告げるものです。
テンセントのチーフAIサイエンティストである姚順宇氏は、Hy3previewがHuan Yuanのモデル再構築における第一歩であると指摘しました。今回のオープンソース公開を通じて、コミュニティやユーザーからの真摯なフィードバックを期待しており、それらが公式版Hy3の実用性をさらに磨き上げる助けとなるでしょう。 同時に、私たちは事前学習と強化学習のスケールアップを継続し、モデルの知能の限界をさらに高めています。数多くのテンセント製品との深い共同設計を通じて、モデルの実世界でのパフォーマンスを着実に向上させ、特化型モデルの機能の探求も開始しています。
現在、Hy3previewはTencent Cloud、Yua、ima、CodeBuddy、WorkBuddy、QQ、QQ Browser、Tencent Docs、Tencent LeXiangで利用可能です。WeChat公式アカウント、Peace Elite、Tencent News、Tencent Stock Selection、Tencent Customer Service、WeChat Readingなどの主要製品への展開も順次進められています。 さらに、Hy3previewはOpenClaw、OpenCode、KiloCodeなどの主要なオープンソースエージェントフレームワークと統合されており、Tencent Cloudの大規模モデルサービスプラットフォーム「TokenHub」にも掲載されています。
Hy3previewは、エージェント機能の大幅な向上により、全方位的な実用性を重視しています
複数の評価により、Hy3previewの能力が全面的に向上したことが確認されています。
1.卓越した文脈学習および指示遵守能力
多様な実世界の運用環境や日常のシナリオにおいて、乱雑で長大な文脈を解析し、複雑で変化し続けるルールに従うことは、モデルにとって依然として重要な課題です。Tencentのビジネスユースケースを参考に、Huan Yuanは文脈内学習を革新的に評価するためのCL-benchおよびCL-bench-Lifeを導入し、Hy3previewの文脈学習能力と指示遵守能力を大幅に向上させました。

2. 卓越した複雑推論能力:中国・清華大学の数学博士課程入学試験で最高得点を達成
複雑な推論能力は、多様な問題に取り組むモデルの基盤となります。Hy3previewは、FrontierScience-OlympiadやIMOAnswerBenchといった難易度の高いSTEM推論ベンチマークで優れた成績を収め、最新の清華大学曲真学院数学博士課程資格試験(2026年春)および全国高校生物コンテスト(CHSBO2025)でも傑出したスコアを記録し、堅牢な汎用推論能力を実証しました。

3. コードおよびエージェント機能の大幅な進歩により、高い費用対効果を実証
コードおよびエージェント機能は、Hy3previewにおける最も顕著な改善点です。刷新された事前学習および強化学習(RL)インフラと、RLタスクの規模拡大により、Tencent Huan Yuanは、SWE-Bench VerifiedやTerminal-Bench2.0といった主要なコードエージェントベンチマーク、ならびにBrowseCompやWideSearchといった検索エージェントベンチマークにおいて、短期間で競争力のあるスコアを達成しました。

デジタル領域において、コードは開発環境でのタスク実行能力を測定し、検索はオープンソースからの情報取得・フィルタリング・統合能力を評価する。これらを総合することで、OpenClawのような複雑なエージェントシナリオにおいてモデルが真に有用かどうかが判断される。Hy3previewはClawEvalやWildClawBenchなどの評価で優れた結果を達成し、当社のエージェント能力が完全性と実用性に向けて着実に進歩していることを示した。

公開ベンチマークに加え、Tencent Huan Yuanは実際の開発環境におけるモデルの性能を測定するため、複数の内部評価スイートを構築しました。その結果、バックエンドエンジニアリングタスクセット「Hy-Backend」、開発者向けの「Hy-Vibe Bench」、そして難易度の高いソフトウェアエンジニアリングセット「Hy-SWE Max」のすべてにおいて、Hy3previewは高い競争力を発揮しました。

オープンソースの競合モデルとのモデルサイズおよびエージェントの総合性能を比較した場合、Hy3previewはその高い費用対効果で際立っています。

テンセントの中核事業は完全に統合されており、複数の主要AI製品において明確なメリットが確認されています
正式リリースに先立ち、Hy3previewはテンセントの主要なAI製品群でテストされ、顕著な好結果をもたらしました。
Yuaに関しては、Huan YuanとYuaの間で綿密な共同設計が行われました。意図理解精度、テキスト生成品質、ディープサーチといった主要指標におけるモデルのパフォーマンスが向上したほか、文章スタイル、表現力、感情的知性、コンテンツ構造、専門性についても微調整が施されました。このモデルと製品の緊密な連携により、ユーザーにはより知的で人間らしい対話体験が提供されました。
imaのナレッジベースQAおよび一般的なQAシナリオにおけるテストでは、Hy3previewが長文処理、特に検索タスクにおいて優れた性能を発揮し、回答の精度、網羅性、包括性において高い水準を達成していることが明らかになりました。
CodeBuddyおよびWorkBuddyにおいて、Hy3previewのファーストトークン遅延は54%短縮され、エンドツーエンドの処理時間は47%短縮され、成功率は99.99%以上に上昇しました。実際のユーザー環境では、文書処理、データ分析、ナレッジ検索、MCPツールチェーンのオーケストレーションなど、多様なオフィス業務にまたがる最大495ステップの複雑なエージェントワークフローを安定して実行しています。
WeChat公式アカウントのAIアバターおよびAIカスタマーサービスに関する専用評価において、Hy3previewはHy2と比較してより包括的な機能向上を実現しました。ユーザーの意図理解、複雑な文脈の継続、および知識の整理において、より高い成熟度を示しました。 曖昧なクエリ、短い文、多ターン対話に対処する際、ユーザーのニーズをより的確に把握し、より明確で安定した応答を生成しました。ナレッジベース、ユーザー記憶、文脈生成を統合することで、その出力はAIアバターやカスタマーサービスの役割により密接に合致し、過剰な想像、主観的な推測、感情的なトーンを大幅に低減させ、全体的なインタラクションを「信頼でき、自然で、効率的な」体験に近づけました。
『Peace Elite』のAI NPCシナリオにおいて、チームはHy3previewのリリース後、迅速に統合・評価を行い、全体として印象的な結果を得ました。 ゲーム外でのキャラクターロールプレイにおいて、Hy3previewはキャラクター設定を正確に把握し、自由回答形式の質問に対して関連性が高く付加価値のあるコンテンツを提供することで、より現実的で自然かつ没入感のある会話を創出しました。複雑なゲーム内戦闘シナリオにおいても、モデルの応答タイミングは実在のプレイヤーに近いものとなり、優れた安定性と人間のようなロールプレイ能力を示し、全体として卓越したパフォーマンスを発揮しました。
Tencent DocsのAI PPTシナリオにおいて、以前のHy2バージョンと比較して、Hy3previewは大幅な向上を示しました。生成成功率は20%上昇し、評価スコアは10%向上し、生成時間は20%短縮されました。全体として、新モデルはテンプレートの選択、配色の調整、アウトラインの生成、コンテンツの補完において優れた性能を発揮し、幻覚現象がなく、テーマに沿っており、視覚的な魅力も高いものでした。
QQのAIアシスタント「Xiao Q」においては、Hy3previewが導入されたことで、前バージョンと比較して、長文の初回応答遅延、全体的な応答速度、ストリーミング効率において大幅な最適化が実現しました。数学的推論などのコア機能は著しく向上し、マルチシナリオでの指示遵守能力や汎化能力もさらに強化されました。 ツール呼び出し推論やマルチターン参照解決においては、より安定的かつ効率的なパフォーマンスを発揮した。OpenClawによる公式PinchBench QQインテリジェントエージェントシナリオテストでは、傑出した結果を達成し、全体的なユーザー体験が著しく向上した。
推論効率は40%向上し、同等のコストで最適な知能密度を実現
モデルと推論フレームワークの深い連携に加え、推論フレームワーク、演算子のパフォーマンス、量子化アルゴリズムなどにおける包括的な最適化により、全体的な推論効率は40%向上し、Hy3previewのコストは前世代に比べて大幅に低下しました。
Tencent Cloudの大規模モデルサービスプラットフォーム「TokenHub」において、Hy3previewの入力価格は100万トークンあたりわずか1.2元、入力キャッシュは100万トークンあたり0.4元、出力は100万トークンあたり4元となっています。 さらに、Tencent CloudとHuan Yuanは共同でカスタマイズされた「Hy3preview Token Plan」パッケージを導入しており、個人向けエディションは月額28元から利用可能です。これは、エージェント開発や「Lobster」アプリケーションの構築において、コストパフォーマンスに優れた選択肢となります。


Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ
AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか?
イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(





家






