阿里巴巴的開源 Qwen AI 模型打破推理紀錄
阿里巴巴的 Qwen 團隊推出了新版本的開源推理 AI 模型,展示了非凡的基準結果。
Introducing Qwen3-235B-A22B-Thinking-2507.在過去的三個月裡,Qwen 團隊一直在強化模型的「思考能力」,努力提升推理過程的質量和深度。
其結果是,該模型在邏輯推理、複雜數學、科學挑戰和先進編碼等要求最嚴苛的領域中真正大放異彩。在通常需要人類專業知識的領域中,最新的 Qwen 模型為開源 AI 設定了新的標準。
在推理基準上,Qwen 最新的開源 AI 模型在 AIME25 上獲得 92.3 分,在 LiveCodeBench v6 的編碼上獲得 74.1 分。它在更廣泛的能力評估中也表現優異,在Arena-Hard v2(一項評估與人類偏好一致性的指標)中獲得79.7分。

基本上,這是來自 Qwen 團隊的大型推理 AI 模型,總共擁有 2,350 億個參數。然而,它採用的是 Mixture-of-Experts (MoE) 架構,意即在任何特定時間,只有這些參數的子集 (約 220 億個) 處於活躍狀態。將它想像成一個由 128 位待命專家組成的龐大團隊,但實際上只有最頂尖的八位專家在處理特定任務。
它最突出的特質之一就是超強的記憶體容量。Qwen 的開放原始碼推理 AI 模型原生支援 262,144 個字元的上下文長度,為需要理解大量資訊的任務提供了顯著的優勢。
對於開發者和愛好者而言,Qwen 團隊簡化了入門流程。該模型可在 Hugging Face 上存取,並可使用 sglang 或 vllm 等工具來設定個人 API 端點。該團隊也強調他們的 Qwen-Agent 框架是利用模型的工具呼叫功能的最佳方法。
為了讓這個開放原始碼的 AI 推理模型達到最佳效能,Qwen 團隊提供了幾項建議。他們建議標準任務的輸出長度約為 32,768 個字元,但對於高度複雜的問題,可增加至 81,920 個字元,讓 AI 有足夠的空間「思考」。他們也建議在您的提示中使用明確的指示,例如針對數學問題要求「逐步推理」的方法,以獲得最精確、最有條理的回覆。
全新 Qwen 模型的推出,提供了一個強大、開放源碼的推理人工智能,能夠與領先的專利模型競爭,尤其是在處理複雜、智力要求高的挑戰時。觀察開發者社群如何運用這項技術,將會是一件非常有趣的事。
另請參閱:AI 行動計劃:美國的領導地位不容挑戰
有興趣從業界專家身上加深您對 AI 和大資料的認識嗎?參加在阿姆斯特丹、加州和倫敦舉行的 AI & Big Data Expo。這項綜合活動與其他大型會議同時舉行,包括智慧自動化會議 (Intelligent Automation Conference)、BlockX、數位轉型週 (Digital Transformation Week),以及網路安全與雲端博覽會 (Cyber Security & Cloud Expo)。
在此瞭解更多由 TechForge 提供的即將舉行的企業技術活動和網路研討會。
相關文章
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖
Kakao Mobility 計畫內部開發第 4 級自動駕駛技術,作為其實體人工智慧策略的一環。在首爾COEX舉行的2026年世界資訊科技展(World IT Show)會議上,Kakao Mobility副總裁兼實體AI部門負責人金鎮奎(Kim Jin-kyu)發表了該發展藍圖。他的演講聚焦於實體AI時代以移動平台為核心的自動駕駛服務。據韓聯社報導,這場名為「超越構想,付諸行動:AI 推動現
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
相關專題推薦
評論 (1)
0/500
阿里巴巴的 Qwen 團隊推出了新版本的開源推理 AI 模型,展示了非凡的基準結果。
Introducing Qwen3-235B-A22B-Thinking-2507.在過去的三個月裡,Qwen 團隊一直在強化模型的「思考能力」,努力提升推理過程的質量和深度。
其結果是,該模型在邏輯推理、複雜數學、科學挑戰和先進編碼等要求最嚴苛的領域中真正大放異彩。在通常需要人類專業知識的領域中,最新的 Qwen 模型為開源 AI 設定了新的標準。
在推理基準上,Qwen 最新的開源 AI 模型在 AIME25 上獲得 92.3 分,在 LiveCodeBench v6 的編碼上獲得 74.1 分。它在更廣泛的能力評估中也表現優異,在Arena-Hard v2(一項評估與人類偏好一致性的指標)中獲得79.7分。

基本上,這是來自 Qwen 團隊的大型推理 AI 模型,總共擁有 2,350 億個參數。然而,它採用的是 Mixture-of-Experts (MoE) 架構,意即在任何特定時間,只有這些參數的子集 (約 220 億個) 處於活躍狀態。將它想像成一個由 128 位待命專家組成的龐大團隊,但實際上只有最頂尖的八位專家在處理特定任務。
它最突出的特質之一就是超強的記憶體容量。Qwen 的開放原始碼推理 AI 模型原生支援 262,144 個字元的上下文長度,為需要理解大量資訊的任務提供了顯著的優勢。
對於開發者和愛好者而言,Qwen 團隊簡化了入門流程。該模型可在 Hugging Face 上存取,並可使用 sglang 或 vllm 等工具來設定個人 API 端點。該團隊也強調他們的 Qwen-Agent 框架是利用模型的工具呼叫功能的最佳方法。
為了讓這個開放原始碼的 AI 推理模型達到最佳效能,Qwen 團隊提供了幾項建議。他們建議標準任務的輸出長度約為 32,768 個字元,但對於高度複雜的問題,可增加至 81,920 個字元,讓 AI 有足夠的空間「思考」。他們也建議在您的提示中使用明確的指示,例如針對數學問題要求「逐步推理」的方法,以獲得最精確、最有條理的回覆。
全新 Qwen 模型的推出,提供了一個強大、開放源碼的推理人工智能,能夠與領先的專利模型競爭,尤其是在處理複雜、智力要求高的挑戰時。觀察開發者社群如何運用這項技術,將會是一件非常有趣的事。
另請參閱:AI 行動計劃:美國的領導地位不容挑戰
有興趣從業界專家身上加深您對 AI 和大資料的認識嗎?參加在阿姆斯特丹、加州和倫敦舉行的 AI & Big Data Expo。這項綜合活動與其他大型會議同時舉行,包括智慧自動化會議 (Intelligent Automation Conference)、BlockX、數位轉型週 (Digital Transformation Week),以及網路安全與雲端博覽會 (Cyber Security & Cloud Expo)。
在此瞭解更多由 TechForge 提供的即將舉行的企業技術活動和網路研討會。
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理





首頁






