針對消費性 PC 和筆記型電腦推出 Qwen 2.5-Omni-3B AI 機型

中國電子商務和雲領導者阿里巴巴繼續以其最新的創新成果挑戰全球的人工智能開發者。在推出先進的開源 Qwen3 大型推理模型系列後不久,Qwen 團隊又推出了 Qwen2.5-Omni-3B--一個針對消費級硬體進行優化的精簡型多模態模型,同時在文字、音訊、圖像和視頻處理方面保持強大的性能。
Qwen2.5-Omni-3B 是旗艦級 70 億參數模型的 30 億參數迭代。參數定義了模型的操作複雜性,而更高的參數通常能夠實現更大的功能。儘管規模縮小了,這個精簡版本仍保留了前代版本 90% 以上的多模態效能,同時提供即時文字和自然語音生成功能。
關鍵的改進在於 GPU 記憶體最佳化。據開發團隊報告,在處理 25,000 個字元的擴展輸入時,VRAM 消耗量減少了 50%。透過技術改進,記憶體需求從 60.2 GB (7B 機型) 降至 28.2 GB (3B 機型),可在高級消費性裝置的 24GB GPU 而非企業級硬體上運作。
這樣的效率來自創新的架構元素,包括 Thinker-Talker 框架和客製化 TMRoPE 定位編碼,可同步處理視訊和音訊。目前的授權僅限於研究應用,企業需要從阿里巴巴的 Qwen Team 獲得額外許可才能進行商業實施。
該版本滿足了市場對可部署的多模態解決方案日益增長的需求,其性能指標可媲美大型機型。可透過以下方式存取:
- 抱抱臉
- GitHub
- 模型範圍
整合選項包括 Hugging Face Transformers、Docker containers 和阿里巴巴的 vLLM 平台,並可選用 FlashAttention 2 和 BF16 精度等增強功能,以加速效能並降低記憶體開銷。
基準效能比較
任務 Qwen2.5-Omni-3B Qwen2.5-Omni-7B
OmniBench (多模式推理) 52.2 56.1
VideoBench (音訊理解) 68.8 74.1
MMMU (影像推理) 53.1 59.2
MVBench (視訊推理) 68.7 70.3
Seed-tts-eval test-hard(語音生成) 92.1 93.5
視聽任務的效能差異極小,強調了 3B 模型的設計效率,對於需要高品質輸出的即時應用程式而言尤其寶貴。
即時多模式功能
Qwen2.5-Omni-3B 可處理同步的多模態輸入,同時產生即時的文字和音訊回應。該機型整合了語音個人化功能,提供兩種預設選項-Chelsie (女性) 和 Ethan (男性),可適用於不同的使用情況。使用者可選擇語音或純文字輸出,並可選擇關閉語音以進一步節省記憶體。
社群發展
Qwen 團隊透過全面的工具包、預先訓練的檢查點、API 可訪問性和部署文件,提倡開放源碼合作。Qwen2.5-Omni 系列已獲得顯著的吸引力,在 Hugging Face 的趨勢模型排名中名列前茅。團隊成員林俊陽在 X 上指出:「雖然許多用戶要求部署精簡的 Omni 模型,但我們正是提供了這樣的產品。
企業影響
對於監督 AI 開發與基礎架構的技術領導者而言,Qwen2.5-Omni-3B 同時帶來了機會與限制。Qwen2.5-Omni-3B 在消費性硬體上的效能可媲美大型機型,這顯示了實際的部署潛力,但授權限制也需要謹慎考量。
根據阿里巴巴雲的 Qwen 研究授權協議,該模型僅限於非商業應用。機構可以為內部研究進行評估、基準測試和改良,但如果沒有獲得商業許可,則不能在面向客戶或創收的系統中實施。
因此,Qwen2.5-Omni-3B 主要定位為原型與評估工具,而非生產解決方案。IT 團隊可以利用它在研究參數範圍內進行管道開發、工具改進和架構評估。資料工程師和安全專業人員可探索其功能,以進行內部驗證,但使用敏感資料進行生產部署需要符合授權規定。
最終,該模型降低了多模式 AI 實驗的技術障礙,同時維持了商業限制。它可作為企業權衡建立與購買決策的策略評估資源,但生產部署需要正式參與阿里巴巴的授權框架。
相關文章
德國法院支持泰瑞達機器人公司,對 Elite Robots 頒布禁制令
泰瑞達(Teradyne)旗下子公司 Universal Robots 近日在 MODEX 貿易展上展示了其配備 UR 協作機器人手臂的移動式操作機器人。來源:泰瑞達隨著漢諾威工業博覽會本週在德國揭幕,漢堡地區法院針對 Elite Robots Deutschland GmbH 頒布了初步禁制令。此裁決是針對泰瑞達機器人公司(Teradyne Robotics A/S)提起的著作權侵權訴訟所作出的
Multiverse Computing 推出免費壓縮生成式人工智慧模型
大型語言模型面臨著重大挑戰:其龐大的體積。西班牙新創公司Multiverse Computing正透過開發壓縮模型來解決此問題,旨在彌合尖端AI能力與企業實際可負擔部署方案之間的差距。其核心創新在於「CompactifAI」壓縮技術——這項受量子運算原理啟發的技術,已被這家巴斯克公司用於優化OpenAI的模型。即日起,開發者可在Hugging Face平台免費使用Multiverse增強版的Hyp
現代汽車於AW展會首度亮相MobED機器人,人工智慧正重塑製造業格局
現代汽車將於2026年自動化世界博覽會(AW)展示其MobED機器人及其他韓國系統。來源:現代汽車集團隨著機器人與人工智慧在製造、物流等領域的應用日益普及,現代汽車集團機器人實驗室將於下週在首爾舉行的「智慧工廠與自動化世界博覽會」(AW)首度公開其MobED移動平台。本次活動亦將匯聚其他頂尖工業機器人供應商。這款名為「移動偏心機器人」(MobED)的設備於2025年12月首度亮相,採用四組獨立控制
相關專題推薦
評論 (1)
0/500

中國電子商務和雲領導者阿里巴巴繼續以其最新的創新成果挑戰全球的人工智能開發者。在推出先進的開源 Qwen3 大型推理模型系列後不久,Qwen 團隊又推出了 Qwen2.5-Omni-3B--一個針對消費級硬體進行優化的精簡型多模態模型,同時在文字、音訊、圖像和視頻處理方面保持強大的性能。
Qwen2.5-Omni-3B 是旗艦級 70 億參數模型的 30 億參數迭代。參數定義了模型的操作複雜性,而更高的參數通常能夠實現更大的功能。儘管規模縮小了,這個精簡版本仍保留了前代版本 90% 以上的多模態效能,同時提供即時文字和自然語音生成功能。
關鍵的改進在於 GPU 記憶體最佳化。據開發團隊報告,在處理 25,000 個字元的擴展輸入時,VRAM 消耗量減少了 50%。透過技術改進,記憶體需求從 60.2 GB (7B 機型) 降至 28.2 GB (3B 機型),可在高級消費性裝置的 24GB GPU 而非企業級硬體上運作。
這樣的效率來自創新的架構元素,包括 Thinker-Talker 框架和客製化 TMRoPE 定位編碼,可同步處理視訊和音訊。目前的授權僅限於研究應用,企業需要從阿里巴巴的 Qwen Team 獲得額外許可才能進行商業實施。
該版本滿足了市場對可部署的多模態解決方案日益增長的需求,其性能指標可媲美大型機型。可透過以下方式存取:
- 抱抱臉
- GitHub
- 模型範圍
整合選項包括 Hugging Face Transformers、Docker containers 和阿里巴巴的 vLLM 平台,並可選用 FlashAttention 2 和 BF16 精度等增強功能,以加速效能並降低記憶體開銷。
基準效能比較
| 任務 | Qwen2.5-Omni-3B | Qwen2.5-Omni-7B |
|---|---|---|
| OmniBench (多模式推理) | 52.2 | 56.1 |
| VideoBench (音訊理解) | 68.8 | 74.1 |
| MMMU (影像推理) | 53.1 | 59.2 |
| MVBench (視訊推理) | 68.7 | 70.3 |
| Seed-tts-eval test-hard(語音生成) | 92.1 | 93.5 |
視聽任務的效能差異極小,強調了 3B 模型的設計效率,對於需要高品質輸出的即時應用程式而言尤其寶貴。
即時多模式功能
Qwen2.5-Omni-3B 可處理同步的多模態輸入,同時產生即時的文字和音訊回應。該機型整合了語音個人化功能,提供兩種預設選項-Chelsie (女性) 和 Ethan (男性),可適用於不同的使用情況。使用者可選擇語音或純文字輸出,並可選擇關閉語音以進一步節省記憶體。
社群發展
Qwen 團隊透過全面的工具包、預先訓練的檢查點、API 可訪問性和部署文件,提倡開放源碼合作。Qwen2.5-Omni 系列已獲得顯著的吸引力,在 Hugging Face 的趨勢模型排名中名列前茅。團隊成員林俊陽在 X 上指出:「雖然許多用戶要求部署精簡的 Omni 模型,但我們正是提供了這樣的產品。
企業影響
對於監督 AI 開發與基礎架構的技術領導者而言,Qwen2.5-Omni-3B 同時帶來了機會與限制。Qwen2.5-Omni-3B 在消費性硬體上的效能可媲美大型機型,這顯示了實際的部署潛力,但授權限制也需要謹慎考量。
根據阿里巴巴雲的 Qwen 研究授權協議,該模型僅限於非商業應用。機構可以為內部研究進行評估、基準測試和改良,但如果沒有獲得商業許可,則不能在面向客戶或創收的系統中實施。
因此,Qwen2.5-Omni-3B 主要定位為原型與評估工具,而非生產解決方案。IT 團隊可以利用它在研究參數範圍內進行管道開發、工具改進和架構評估。資料工程師和安全專業人員可探索其功能,以進行內部驗證,但使用敏感資料進行生產部署需要符合授權規定。
最終,該模型降低了多模式 AI 實驗的技術障礙,同時維持了商業限制。它可作為企業權衡建立與購買決策的策略評估資源,但生產部署需要正式參與阿里巴巴的授權框架。
德國法院支持泰瑞達機器人公司,對 Elite Robots 頒布禁制令
泰瑞達(Teradyne)旗下子公司 Universal Robots 近日在 MODEX 貿易展上展示了其配備 UR 協作機器人手臂的移動式操作機器人。來源:泰瑞達隨著漢諾威工業博覽會本週在德國揭幕,漢堡地區法院針對 Elite Robots Deutschland GmbH 頒布了初步禁制令。此裁決是針對泰瑞達機器人公司(Teradyne Robotics A/S)提起的著作權侵權訴訟所作出的
Multiverse Computing 推出免費壓縮生成式人工智慧模型
大型語言模型面臨著重大挑戰:其龐大的體積。西班牙新創公司Multiverse Computing正透過開發壓縮模型來解決此問題,旨在彌合尖端AI能力與企業實際可負擔部署方案之間的差距。其核心創新在於「CompactifAI」壓縮技術——這項受量子運算原理啟發的技術,已被這家巴斯克公司用於優化OpenAI的模型。即日起,開發者可在Hugging Face平台免費使用Multiverse增強版的Hyp
現代汽車於AW展會首度亮相MobED機器人,人工智慧正重塑製造業格局
現代汽車將於2026年自動化世界博覽會(AW)展示其MobED機器人及其他韓國系統。來源:現代汽車集團隨著機器人與人工智慧在製造、物流等領域的應用日益普及,現代汽車集團機器人實驗室將於下週在首爾舉行的「智慧工廠與自動化世界博覽會」(AW)首度公開其MobED移動平台。本次活動亦將匯聚其他頂尖工業機器人供應商。這款名為「移動偏心機器人」(MobED)的設備於2025年12月首度亮相,採用四組獨立控制





首頁






