オプション
ニュース
Hy3 プレビュー:Yuanの再編後初のオープンソース版リリース、実用性とエージェント機能が強化

Hy3 プレビュー:Yuanの再編後初のオープンソース版リリース、実用性とエージェント機能が強化

2026年6月1日
21

4月23日、テンセントのHuan Yuanは、言語モデル「Hy3preview」をオープンソースとして公開した。 このハイブリッドエキスパートモデルは、高速推論と低速推論を組み合わせたもので、総パラメータ数2,950億、アクティブパラメータ数210億を誇り、最大256Kのコンテキスト長に対応しています。これはHuan Yuanの再構築後にトレーニングされた最初のモデルであり、Huan Yuan史上最も知能の高いモデルとして、複雑な推論、指示の遂行、コンテキスト内学習、コード生成、エージェント機能、および全体的な推論性能において大幅な向上を実現しています。

2026年2月、テンセント・Huan Yuanは、実用的な有用性を実現するための3つの指針を確立するとともに、事前学習および強化学習のインフラを再構築しました:

1. 体系的な能力:専門化を重視するのではなく、コードエージェントのような単一のアプリケーションでさえ、推論、長文コンテキスト処理、指示の遂行、対話、コーディング、ツール使用といった領域にわたる深い連携が必要であることを認識しています。

2. 実証的な評価:容易に操作可能な公開ベンチマークにとどまらず、社内で開発した質問、最新の試験問題、人間による評価、製品固有のクラウドテストなどの手法を用いて、モデルの実世界における有効性を評価・向上させます。

3. 費用対効果への注力:実用性は商業的な実現可能性と一致していなければなりません。共同設計されたモデルアーキテクチャと推論フレームワークにより、タスクコストを大幅に低減し、AIを手頃な価格で効果的なものにします。

Hy3previewは、現実世界の問題を解決する実用的な大規模言語モデルの開発を加速させる、Huan Yuanの取り組みの始まりを告げるものです。

テンセントのチーフAIサイエンティストである姚順宇氏は、Hy3previewがHuan Yuanのモデル再構築における第一歩であると指摘しました。今回のオープンソース公開を通じて、コミュニティやユーザーからの真摯なフィードバックを期待しており、それらが公式版Hy3の実用性をさらに磨き上げる助けとなるでしょう。 同時に、私たちは事前学習と強化学習のスケールアップを継続し、モデルの知能の限界をさらに高めています。数多くのテンセント製品との深い共同設計を通じて、モデルの実世界でのパフォーマンスを着実に向上させ、特化型モデルの機能の探求も開始しています。

現在、Hy3previewはTencent Cloud、Yua、ima、CodeBuddy、WorkBuddy、QQ、QQ Browser、Tencent Docs、Tencent LeXiangで利用可能です。WeChat公式アカウント、Peace Elite、Tencent News、Tencent Stock Selection、Tencent Customer Service、WeChat Readingなどの主要製品への展開も順次進められています。 さらに、Hy3previewはOpenClaw、OpenCode、KiloCodeなどの主要なオープンソースエージェントフレームワークと統合されており、Tencent Cloudの大規模モデルサービスプラットフォーム「TokenHub」にも掲載されています。

Hy3previewは、エージェント機能の大幅な向上により、全方位的な実用性を重視しています

複数の評価により、Hy3previewの能力が全面的に向上したことが確認されています。

1.卓越した文脈学習および指示遵守能力

多様な実世界の運用環境や日常のシナリオにおいて、乱雑で長大な文脈を解析し、複雑で変化し続けるルールに従うことは、モデルにとって依然として重要な課題です。Tencentのビジネスユースケースを参考に、Huan Yuanは文脈内学習を革新的に評価するためのCL-benchおよびCL-bench-Lifeを導入し、Hy3previewの文脈学習能力と指示遵守能力を大幅に向上させました。

image.png

2. 卓越した複雑推論能力:中国・清華大学の数学博士課程入学試験で最高得点を達成

複雑な推論能力は、多様な問題に取り組むモデルの基盤となります。Hy3previewは、FrontierScience-OlympiadやIMOAnswerBenchといった難易度の高いSTEM推論ベンチマークで優れた成績を収め、最新の清華大学曲真学院数学博士課程資格試験(2026年春)および全国高校生物コンテスト(CHSBO2025)でも傑出したスコアを記録し、堅牢な汎用推論能力を実証しました。

image.png

3. コードおよびエージェント機能の大幅な進歩により、高い費用対効果を実証

コードおよびエージェント機能は、Hy3previewにおける最も顕著な改善点です。刷新された事前学習および強化学習(RL)インフラと、RLタスクの規模拡大により、Tencent Huan Yuanは、SWE-Bench VerifiedやTerminal-Bench2.0といった主要なコードエージェントベンチマーク、ならびにBrowseCompやWideSearchといった検索エージェントベンチマークにおいて、短期間で競争力のあるスコアを達成しました。

image.png

デジタル領域において、コードは開発環境でのタスク実行能力を測定し、検索はオープンソースからの情報取得・フィルタリング・統合能力を評価する。これらを総合することで、OpenClawのような複雑なエージェントシナリオにおいてモデルが真に有用かどうかが判断される。Hy3previewはClawEvalやWildClawBenchなどの評価で優れた結果を達成し、当社のエージェント能力が完全性と実用性に向けて着実に進歩していることを示した。

image.png

公開ベンチマークに加え、Tencent Huan Yuanは実際の開発環境におけるモデルの性能を測定するため、複数の内部評価スイートを構築しました。その結果、バックエンドエンジニアリングタスクセット「Hy-Backend」、開発者向けの「Hy-Vibe Bench」、そして難易度の高いソフトウェアエンジニアリングセット「Hy-SWE Max」のすべてにおいて、Hy3previewは高い競争力を発揮しました。

48920987-bdbb-464b-adca-513891f742e1.png

オープンソースの競合モデルとのモデルサイズおよびエージェントの総合性能を比較した場合、Hy3previewはその高い費用対効果で際立っています。

image.png

テンセントの中核事業は完全に統合されており、複数の主要AI製品において明確なメリットが確認されています

正式リリースに先立ち、Hy3previewはテンセントの主要なAI製品群でテストされ、顕著な好結果をもたらしました。

Yuaに関しては、Huan YuanとYuaの間で綿密な共同設計が行われました。意図理解精度、テキスト生成品質、ディープサーチといった主要指標におけるモデルのパフォーマンスが向上したほか、文章スタイル、表現力、感情的知性、コンテンツ構造、専門性についても微調整が施されました。このモデルと製品の緊密な連携により、ユーザーにはより知的で人間らしい対話体験が提供されました。

imaのナレッジベースQAおよび一般的なQAシナリオにおけるテストでは、Hy3previewが長文処理、特に検索タスクにおいて優れた性能を発揮し、回答の精度、網羅性、包括性において高い水準を達成していることが明らかになりました。

CodeBuddyおよびWorkBuddyにおいて、Hy3previewのファーストトークン遅延は54%短縮され、エンドツーエンドの処理時間は47%短縮され、成功率は99.99%以上に上昇しました。実際のユーザー環境では、文書処理、データ分析、ナレッジ検索、MCPツールチェーンのオーケストレーションなど、多様なオフィス業務にまたがる最大495ステップの複雑なエージェントワークフローを安定して実行しています。

WeChat公式アカウントのAIアバターおよびAIカスタマーサービスに関する専用評価において、Hy3previewはHy2と比較してより包括的な機能向上を実現しました。ユーザーの意図理解、複雑な文脈の継続、および知識の整理において、より高い成熟度を示しました。 曖昧なクエリ、短い文、多ターン対話に対処する際、ユーザーのニーズをより的確に把握し、より明確で安定した応答を生成しました。ナレッジベース、ユーザー記憶、文脈生成を統合することで、その出力はAIアバターやカスタマーサービスの役割により密接に合致し、過剰な想像、主観的な推測、感情的なトーンを大幅に低減させ、全体的なインタラクションを「信頼でき、自然で、効率的な」体験に近づけました。

『Peace Elite』のAI NPCシナリオにおいて、チームはHy3previewのリリース後、迅速に統合・評価を行い、全体として印象的な結果を得ました。 ゲーム外でのキャラクターロールプレイにおいて、Hy3previewはキャラクター設定を正確に把握し、自由回答形式の質問に対して関連性が高く付加価値のあるコンテンツを提供することで、より現実的で自然かつ没入感のある会話を創出しました。複雑なゲーム内戦闘シナリオにおいても、モデルの応答タイミングは実在のプレイヤーに近いものとなり、優れた安定性と人間のようなロールプレイ能力を示し、全体として卓越したパフォーマンスを発揮しました。

Tencent DocsのAI PPTシナリオにおいて、以前のHy2バージョンと比較して、Hy3previewは大幅な向上を示しました。生成成功率は20%上昇し、評価スコアは10%向上し、生成時間は20%短縮されました。全体として、新モデルはテンプレートの選択、配色の調整、アウトラインの生成、コンテンツの補完において優れた性能を発揮し、幻覚現象がなく、テーマに沿っており、視覚的な魅力も高いものでした。

QQのAIアシスタント「Xiao Q」においては、Hy3previewが導入されたことで、前バージョンと比較して、長文の初回応答遅延、全体的な応答速度、ストリーミング効率において大幅な最適化が実現しました。数学的推論などのコア機能は著しく向上し、マルチシナリオでの指示遵守能力や汎化能力もさらに強化されました。 ツール呼び出し推論やマルチターン参照解決においては、より安定的かつ効率的なパフォーマンスを発揮した。OpenClawによる公式PinchBench QQインテリジェントエージェントシナリオテストでは、傑出した結果を達成し、全体的なユーザー体験が著しく向上した。

推論効率は40%向上し、同等のコストで最適な知能密度を実現

モデルと推論フレームワークの深い連携に加え、推論フレームワーク、演算子のパフォーマンス、量子化アルゴリズムなどにおける包括的な最適化により、全体的な推論効率は40%向上し、Hy3previewのコストは前世代に比べて大幅に低下しました。

Tencent Cloudの大規模モデルサービスプラットフォーム「TokenHub」において、Hy3previewの入力価格は100万トークンあたりわずか1.2元、入力キャッシュは100万トークンあたり0.4元、出力は100万トークンあたり4元となっています。 さらに、Tencent CloudとHuan Yuanは共同でカスタマイズされた「Hy3preview Token Plan」パッケージを導入しており、個人向けエディションは月額28元から利用可能です。これは、エージェント開発や「Lobster」アプリケーションの構築において、コストパフォーマンスに優れた選択肢となります。

image.png

image.png

関連記事
Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した 人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ DeepSeek Code、まもなくリリースへ AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか? マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか? イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(
関連特集おすすめ
仕事 おすすめのAI採用ツール:履歴書の選考と候補者の面接スケジュール管理を自動化
おすすめのAI採用ツール:履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう!

10 ツール
xix.ai
生産性 AIパーソナルウェルネス&集中力コーチ:バーンアウトの予防とメンタルエネルギーの向上
AIパーソナルウェルネス&集中力コーチ:バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス&集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール
xix.ai
チャットボット 高評価のAI恋愛チャットボット:一貫した個性で長期的な関係を築く
高評価のAI恋愛チャットボット:一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール
xix.ai
教育と学習 最高のAIデータサイエンスメンター:SQL、Pandas、および機械学習ワークフローをマスターしましょう
最高のAIデータサイエンスメンター:SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール
xix.ai
チャットボット 最高のAIを使ったナンパ&会話トレーニング:社交的な魅力と自信をリアルタイムで高める
最高のAIを使ったナンパ&会話トレーニング:社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール
xix.ai
コード 自動化ユニットテストに最適なAIツール:ワンクリックでJest、PyTest、JUnitのテストケースを生成する
自動化ユニットテストに最適なAIツール:ワンクリックでJest、PyTest、JUnitのテストケースを生成する

2026年に登場した、自動化ユニットテスト用の最高評価を受けたAIツールを発見してください。当社が厳選したこれらのツールは、Jest、PyTest、JUnitのテストケースを瞬時に生成するための強力で革新的なソリューションです。XIX.AIでは、無料オプションと有料オプションを実際のテストデータと共に比較し、毎週更新されるランキングもご覧いただけます。今すぐAIの力を活用して、開発生産性を向上させましょう。

10 ツール
xix.ai
コメント (0)
0/500
OR