アリババのオープンソースAIモデル「Qwen」が推論の記録を更新
アリババのQwenチームは、オープンソースの推論AIモデルの新バージョンを発表し、驚くべきベンチマーク結果を披露した。
Introducing Qwen3-235B-A22B-Thinking-2507.この3ヶ月間、Qwenチームはモデルの「思考能力」と呼ばれるものを集中的にスケールアップし、推論プロセスの質と深さの両方を高めることに努めてきた。
その結果、論理的推論、複雑な数学、科学的課題、高度なコーディングなど、最も要求の厳しい分野で真価を発揮するモデルが誕生した。通常、人間の専門知識が要求される分野において、この最新のQwenモデルは、オープンソースAIの新たな基準を打ち立てつつある。
推論ベンチマークにおいて、Qwenの最新のオープンソースAIモデルは、AIME25で92.3、LiveCodeBench v6のコーディングで74.1のスコアを記録しています。また、人間の嗜好との整合性を評価する指標であるArena-Hard v2で79.7を達成するなど、より広範な能力評価においても高いパフォーマンスを発揮しています。

基本的に、これはQwenチームによる大規模推論AIモデルであり、合計2,350億個のパラメータを備えている。しかし、MoE(Mixture-of-Experts)アーキテクチャを採用しているため、これらのパラメータのサブセット(約220億個)のみが常にアクティブである。128人のスペシャリストで構成される広大なチームがスタンバイしており、特定のタスクについて上位8人のエキスパートだけが実際に作業している状態を想像してほしい。
Qwenの特長のひとつは、その卓越したメモリ容量だ。Qwenのオープンソース推論AIモデルは、ネイティブで262,144トークンのコンテキスト長をサポートしており、膨大な情報の理解を必要とするタスクに大きなアドバンテージを提供する。
開発者や愛好家のために、Qwenチームは開始プロセスを合理化した。このモデルはHugging Faceでアクセス可能で、sglangやvllmのようなツールを使って個人のAPIエンドポイントを設定し、デプロイすることができる。チームはまた、モデルのツール呼び出し機能を活用する最適な方法として、彼らのQwen-Agentフレームワークを強調している。
このオープンソースのAI推論モデルで最高のパフォーマンスを達成するために、Qwenチームはいくつかの推奨事項を提示している。標準的なタスクの場合、32,768トークン程度の出力長を推奨しているが、非常に複雑な問題の場合、これを81,920トークンに増やすことで、AIが "考える "ための十分なスペースを確保できる。また、数学的な問題では「ステップバイステップの推論」アプローチを要求するなど、プロンプトに明示的な指示を使用することで、最も正確でよく整理された回答を得ることができるという。
この新しいQwenモデルの登場は、特に複雑で知的要求の高い課題に取り組む際に、主要なプロプライエタリモデルと競合できる強力なオープンソースの推論AIを提供する。開発者コミュニティがこの技術を使ってどのようなものを生み出すのか、興味深く見守りたい。
こちらもご覧ください:AIアクションプラン:米国のリーダーシップは「揺るぎない」ものでなければならない
業界の専門家からAIとビッグデータに関する知識を深めることに興味がありますか?アムステルダム、カリフォルニア、ロンドンで開催されるAI & Big Data Expoにご参加ください。この包括的なイベントは、Intelligent Automation Conference、BlockX、Digital Transformation Week、Cyber Security & Cloud Expoなど、他の主要なカンファレンスと並行して開催されます。
テックフォージが提供するその他のエンタープライズ向けテクノロジーイベントやウェビナーについては、こちらをご覧ください。
関連記事
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大
火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
真の違い:あることではなく、別のこと
物事は、ある側面だけでなく、別の側面も併せ持っていることがあります。「これは単にこれだけではなく、あれでもある」という表現は、AIが生成した文章においてあまりにも一般的になったため、もはや合成コンテンツの単なるヒントというだけでなく、ほぼ確実な証拠となっています。だからこそ、企業コミュニケーションにおいてこの文構造が急増しているという『バロンズ』のレポートを目にした時、私は単に興味をそそられただけ
関連特集おすすめ
コメント (1)
0/500
アリババのQwenチームは、オープンソースの推論AIモデルの新バージョンを発表し、驚くべきベンチマーク結果を披露した。
Introducing Qwen3-235B-A22B-Thinking-2507.この3ヶ月間、Qwenチームはモデルの「思考能力」と呼ばれるものを集中的にスケールアップし、推論プロセスの質と深さの両方を高めることに努めてきた。
その結果、論理的推論、複雑な数学、科学的課題、高度なコーディングなど、最も要求の厳しい分野で真価を発揮するモデルが誕生した。通常、人間の専門知識が要求される分野において、この最新のQwenモデルは、オープンソースAIの新たな基準を打ち立てつつある。
推論ベンチマークにおいて、Qwenの最新のオープンソースAIモデルは、AIME25で92.3、LiveCodeBench v6のコーディングで74.1のスコアを記録しています。また、人間の嗜好との整合性を評価する指標であるArena-Hard v2で79.7を達成するなど、より広範な能力評価においても高いパフォーマンスを発揮しています。

基本的に、これはQwenチームによる大規模推論AIモデルであり、合計2,350億個のパラメータを備えている。しかし、MoE(Mixture-of-Experts)アーキテクチャを採用しているため、これらのパラメータのサブセット(約220億個)のみが常にアクティブである。128人のスペシャリストで構成される広大なチームがスタンバイしており、特定のタスクについて上位8人のエキスパートだけが実際に作業している状態を想像してほしい。
Qwenの特長のひとつは、その卓越したメモリ容量だ。Qwenのオープンソース推論AIモデルは、ネイティブで262,144トークンのコンテキスト長をサポートしており、膨大な情報の理解を必要とするタスクに大きなアドバンテージを提供する。
開発者や愛好家のために、Qwenチームは開始プロセスを合理化した。このモデルはHugging Faceでアクセス可能で、sglangやvllmのようなツールを使って個人のAPIエンドポイントを設定し、デプロイすることができる。チームはまた、モデルのツール呼び出し機能を活用する最適な方法として、彼らのQwen-Agentフレームワークを強調している。
このオープンソースのAI推論モデルで最高のパフォーマンスを達成するために、Qwenチームはいくつかの推奨事項を提示している。標準的なタスクの場合、32,768トークン程度の出力長を推奨しているが、非常に複雑な問題の場合、これを81,920トークンに増やすことで、AIが "考える "ための十分なスペースを確保できる。また、数学的な問題では「ステップバイステップの推論」アプローチを要求するなど、プロンプトに明示的な指示を使用することで、最も正確でよく整理された回答を得ることができるという。
この新しいQwenモデルの登場は、特に複雑で知的要求の高い課題に取り組む際に、主要なプロプライエタリモデルと競合できる強力なオープンソースの推論AIを提供する。開発者コミュニティがこの技術を使ってどのようなものを生み出すのか、興味深く見守りたい。
こちらもご覧ください:AIアクションプラン:米国のリーダーシップは「揺るぎない」ものでなければならない
業界の専門家からAIとビッグデータに関する知識を深めることに興味がありますか?アムステルダム、カリフォルニア、ロンドンで開催されるAI & Big Data Expoにご参加ください。この包括的なイベントは、Intelligent Automation Conference、BlockX、Digital Transformation Week、Cyber Security & Cloud Expoなど、他の主要なカンファレンスと並行して開催されます。
テックフォージが提供するその他のエンタープライズ向けテクノロジーイベントやウェビナーについては、こちらをご覧ください。
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大
火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
真の違い:あることではなく、別のこと
物事は、ある側面だけでなく、別の側面も併せ持っていることがあります。「これは単にこれだけではなく、あれでもある」という表現は、AIが生成した文章においてあまりにも一般的になったため、もはや合成コンテンツの単なるヒントというだけでなく、ほぼ確実な証拠となっています。だからこそ、企業コミュニケーションにおいてこの文構造が急増しているという『バロンズ』のレポートを目にした時、私は単に興味をそそられただけ





家






