阿里巴巴的開源 Qwen AI 模型打破推理紀錄

首頁

新聞

2025-12-08

SamuelClark

124

# ai # models # alibaba # China # qwen

阿里巴巴的 Qwen 團隊推出了新版本的開源推理 AI 模型，展示了非凡的基準結果。

Introducing Qwen3-235B-A22B-Thinking-2507.在過去的三個月裡，Qwen 團隊一直在強化模型的「思考能力」，努力提升推理過程的質量和深度。

其結果是，該模型在邏輯推理、複雜數學、科學挑戰和先進編碼等要求最嚴苛的領域中真正大放異彩。在通常需要人類專業知識的領域中，最新的 Qwen 模型為開源 AI 設定了新的標準。

在推理基準上，Qwen 最新的開源 AI 模型在 AIME25 上獲得 92.3 分，在 LiveCodeBench v6 的編碼上獲得 74.1 分。它在更廣泛的能力評估中也表現優異，在Arena-Hard v2（一項評估與人類偏好一致性的指標）中獲得79.7分。

基本上，這是來自 Qwen 團隊的大型推理 AI 模型，總共擁有 2,350 億個參數。然而，它採用的是 Mixture-of-Experts (MoE) 架構，意即在任何特定時間，只有這些參數的子集 (約 220 億個) 處於活躍狀態。將它想像成一個由 128 位待命專家組成的龐大團隊，但實際上只有最頂尖的八位專家在處理特定任務。

它最突出的特質之一就是超強的記憶體容量。Qwen 的開放原始碼推理 AI 模型原生支援 262,144 個字元的上下文長度，為需要理解大量資訊的任務提供了顯著的優勢。

對於開發者和愛好者而言，Qwen 團隊簡化了入門流程。該模型可在 Hugging Face 上存取，並可使用 sglang 或 vllm 等工具來設定個人 API 端點。該團隊也強調他們的 Qwen-Agent 框架是利用模型的工具呼叫功能的最佳方法。

為了讓這個開放原始碼的 AI 推理模型達到最佳效能，Qwen 團隊提供了幾項建議。他們建議標準任務的輸出長度約為 32,768 個字元，但對於高度複雜的問題，可增加至 81,920 個字元，讓 AI 有足夠的空間「思考」。他們也建議在您的提示中使用明確的指示，例如針對數學問題要求「逐步推理」的方法，以獲得最精確、最有條理的回覆。

全新 Qwen 模型的推出，提供了一個強大、開放源碼的推理人工智能，能夠與領先的專利模型競爭，尤其是在處理複雜、智力要求高的挑戰時。觀察開發者社群如何運用這項技術，將會是一件非常有趣的事。

另請參閱：AI 行動計劃：美國的領導地位不容挑戰

有興趣從業界專家身上加深您對 AI 和大資料的認識嗎？參加在阿姆斯特丹、加州和倫敦舉行的 AI & Big Data Expo。這項綜合活動與其他大型會議同時舉行，包括智慧自動化會議 (Intelligent Automation Conference)、BlockX、數位轉型週 (Digital Transformation Week)，以及網路安全與雲端博覽會 (Cyber Security & Cloud Expo)。

在此瞭解更多由 TechForge 提供的即將舉行的企業技術活動和網路研討會。

WordPress.com 現已允許 AI 代理程式撰寫並發布文章，還有更多功能廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布，將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容，同時也能管理留言、更新與修正元資料，並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制，網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能，網站幾乎可以完全由人工指導的 AI 代理

Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖 Kakao Mobility 計畫內部開發第 4 級自動駕駛技術，作為其實體人工智慧策略的一環。在首爾COEX舉行的2026年世界資訊科技展（World IT Show）會議上，Kakao Mobility副總裁兼實體AI部門負責人金鎮奎（Kim Jin-kyu）發表了該發展藍圖。他的演講聚焦於實體AI時代以移動平台為核心的自動駕駛服務。據韓聯社報導，這場名為「超越構想，付諸行動：AI 推動現

巴里·迪勒：隨著通用人工智慧（AGI）日益臨近，對山姆·奧特曼的信任已無關緊要儘管近期有報導指出相反的看法，但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時，為奧特曼辯護；奧特曼此前曾遭到部分前同事和董事會成員指控，指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒，當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言，提問者探討了被稱為「通用人工智慧」（AGI）的理

相關專題推薦

文字轉語音

專為閱讀障礙設計的頂尖 AI 語音合成應用程式：協助學生提升學習與閱讀效率

探索 2026 年最新精選、專為閱讀障礙者設計的頂級 AI 語音合成（TTS）應用程式。我們的專家評比將免費與付費工具進行對照，重點介紹能提升閱讀效率與學習成效的強大功能。發掘這些必試且能帶來革命性改變的解決方案，釋放學生的潛能。立即前往 XIX.AI 展開您的探索之旅。

10 個工具

xix.ai

漫畫創作

少年漫畫頂尖 AI 生成器：打造高張力動作場面與能量特效

立即前往 XIX.AI，探索 2026 年最優秀的少年漫畫 AI 生成工具。我們精心挑選的頂級清單，匯集了能打造高張力動作場面與動態能量特效的強大工具。透過實際測試，比較免費與付費選項的差異。釋放您的創作潛能，今天就開始打造史詩級漫畫吧！

15 個工具

xix.ai

商業

最佳 AI 支出追蹤工具：掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具：備受好評的解決方案，可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案，助您輕鬆管理報銷、精準追蹤財務，並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南，將協助您找到最合適的選擇。透過 XIX.AI 的專家精選，釋放您的 AI 優勢。

10 個工具

xix.ai

商業

最佳 AI 招聘工具：篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案，可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜，比較免費與付費選項。立即找到最適合您的招聘助手，並優化您的招聘流程！

10 個工具

xix.ai

生產率

AI 個人健康與專注力教練：管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具，助您管理倦怠感並提升精神能量。透過實際使用心得，比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具

xix.ai

聊天機器人

最受好評的 AI 浪漫聊天機器人：透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人，助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較，以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶，並開始建立這段關係吧。

10 個工具

xix.ai

評論 (1)

0/500

請登錄後再操作

HaroldMoore

2026-03-25 06:00:39

AlibabaのオープンソースAIがまたすごい成果を出しましたね！Qwenの推論能力、本当に進化が早い。最近は色んな企業が自社モデルを公開して競争が激しいけど、オープンソースでここまでできると、商用モデルもプレッシャー感じるんじゃないかな？個人的には、こういう技術がもっと手軽に使えるようになったら、普段の仕事の効率も上がりそうで楽しみです✨

頭號新聞

AI Builder和Power Automate革新文件摘要 AI寄主Notebooklm播客現已上中國發布國家級人形機器人與具身智能標準 Ramp 數據顯示，企業對 AI 的採納已進入停滯期 Bing圖像創作者教程：AI藝術生成指南學習使用您的聲音創建AI音樂：逐步Suno教程 iMyFone MagicMic：實時AI變聲器評測與教程 2025頂級AI影片生成器：Pika Labs與其他對比 DeepSeek V4 崛起為多模態人工智慧的變革者 Embodied Intelligence 公布首項業界標準，以遏止無序擴張

精選