32B
模型參數數量
Alibaba
附屬組織
開源
許可證類型
2024-04-03
發佈時間
模型簡介
Qwen1.5 是 Qwen2 的測試版本,仍然採用解碼器-only 的 Transformer 架構,包含 SwiGLU 激活函數、RoPE 和多頭注意力機制。它提供了九種模型大小,並增強了多語言和聊天模型能力,支持長達 32,768 個標記的上下文長度。所有模型均已啟用角色扮演的系統提示,並且代碼在 transformers 中支援原生實現。
向左向右滑動以查看更多
語言理解能力
可以處理對日常對話的基本理解,但是在隱喻和技術術語中掙扎。
6.0
知識覆蓋範圍
具有重要的知識盲點,經常顯示事實錯誤並重複過時的信息。
6.8
推理能力
無法維持連貫的推理鏈,通常會導致因果關係或錯誤估計。
4.1
模型比較
Qwen1.5-32B-Chat vs Qwen2.5-7B-Instruct
與Qwen2一樣,Qwen2.5語言模型支援高達128K個tokens,並且可以生成高達8K個tokens。它們還持續支援超過29種語言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、義大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等。
Qwen1.5-32B-Chat vs Spark-X1
科大訊飛發佈的推理模型Spark X1,在國內數學任務領先的基礎上,針對推理、文本生成和語言理解等通用任務的表現,對標OpenAI的o1和DeepSeek的R1。
相關模型
Qwen3-Next-80B-A3B-Thinking
Qwen系列最新發布的Qwen3-Next系列,透過創新的模型架構提升擴展效率。
Qwen3-235B-A22B-Thinking-2507
Qwen3 是 Qwen 系列最新一代的大型語言模型,提供一套完整的稠密模型與專家混合模型(MoE)組合。
Qwen3-Max-2026-01-23
Qwen新推出的旗艦推理模型,引入了兩項創新功能:自適應工具調用與測試時擴展。
Qwen3-Next-80B-A3B-Thinking
Qwen 機型中最新發表的 Qwen3-Next 系列,透過創新的機型架構提升擴充效率。
Qwen3-235B-A22B-Thinking-2507
Qwen3 是 Qwen 系列中最新一代的大型語言模型,提供一套完整的密集與專家混合 (MoE) 模型。
相關文件
在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工
人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫,預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業,正積極將其核心技術推向國際市場。目前,Cursor 已在新加坡設立辦公室,由資深技術高管 Simon Green 領軍,招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的
Claude 被用於製作惡意 npm 套件:逾 670 個套件遭入侵,威脅開源社群
一則近期發生的網路安全事件揭露了大型語言模型(LLMs)如何被用作開發惡意軟體的工具。資安研究員 Sibi Moosa 發現一名化名為「mousie-5212-super-formatter」的攻擊者,利用 Anthropic 的 Claude AI 生成有害程式碼,並污染 npm 套件生態系統。 在短時間內,超過 670 個惡意套件被上傳至 npm 套件庫,此類攻擊的速度與自動化程度引發了高度警
隨著印度加速推動科技發展,信實集團公布了1,100億美元的人工智慧投資計畫
印度信實集團(Reliance)的億萬富豪主席穆克什·安巴尼(Mukesh Ambani)於週四宣布,將斥資10兆盧比(約合1,100億美元),在未來七年間於印度各地建設人工智慧運算基礎設施。安巴尼週四在新德里舉行的「印度人工智慧影響力峰會」上表示,這筆投資將用於支持吉瓦級數據中心、全國性的邊緣運算網路,以及與信實集團旗下Jio電信平台整合的新人工智慧服務。安巴尼指出,信實集團已開始在古吉拉特邦的
智源WITA以首份合規申報書為「裸體」機器人互動畫下句點
具身智能領域已達成一項重要里程碑。根據上海市網絡信息辦公室的最新公告,智源研究所研發的WITA大模型已成功完成備案,成為國內首個符合規範部署的具身智能交互大模型。這項成就不僅僅是取得許可證。WITA 的核心宗旨在於讓類人型機器人能夠真正進行對話、感知情緒,並發展出鮮明的個性。它專為機器人互動場景設計,透過自然且富有情感表達的溝通方式,將冰冷的機械軀體轉化為具備連續記憶與個人特質的「矽基夥伴」。 作
一項人類學研究指出,經過潤飾的人工智慧產出內容會削弱人類的思考能力
當你看到人工智慧瞬間產出一段結構完善、邏輯清晰的程式碼或文件時,是否會不假思索地選擇相信它?根據AIbase 的報導,領先的人工智慧公司Anthropic最近發布了一份名為《AI 流暢度指數》的研究報告。 在分析了近 10,000 份匿名Claude對話樣本後,這項研究揭露了一個令人擔憂的趨勢:AI 產出的內容看起來越是精緻,使用者就越不願意去查證事實。報告揭示,當Claude產出小型應用程式、網





首頁
