110B
模型參數數量
Alibaba
附屬組織
開源
許可證類型
2024-04-25
發佈時間
模型簡介
Qwen1.5 是 Qwen2 的測試版本,保持了解碼器-only 變換架構模型,具有 SwiGLU 激活函數、RoPE 和多頭注意力機制。它提供了九種模型大小,並增強了多語言和聊天模型能力,支援 32,768 個標記的上下文長度。所有模型均已啟用角色扮演系統提示,程式碼在 transformers 中支援本地實現。
向左向右滑動以查看更多
語言理解能力
通常會做出語義錯誤的判斷,從而導致響應中明顯的邏輯斷開連接。
5.3
知識覆蓋範圍
擁有主流學科的核心知識,但對尖端跨學科領域的覆蓋範圍有限。
7.9
推理能力
無法維持連貫的推理鏈,通常會導致因果關係或錯誤估計。
4.5
模型比較
Qwen1.5-110B-Chat vs Qwen2.5-7B-Instruct
與Qwen2一樣,Qwen2.5語言模型支援高達128K個tokens,並且可以生成高達8K個tokens。它們還持續支援超過29種語言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、義大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等。
Qwen1.5-110B-Chat vs Spark-X1
科大訊飛發佈的推理模型Spark X1,在國內數學任務領先的基礎上,針對推理、文本生成和語言理解等通用任務的表現,對標OpenAI的o1和DeepSeek的R1。
相關模型
Qwen3-Next-80B-A3B-Thinking
Qwen系列最新發布的Qwen3-Next系列,透過創新的模型架構提升擴展效率。
Qwen3-235B-A22B-Thinking-2507
Qwen3 是 Qwen 系列最新一代的大型語言模型,提供一套完整的稠密模型與專家混合模型(MoE)組合。
Qwen3-Max-2026-01-23
Qwen新推出的旗艦推理模型,引入了兩項創新功能:自適應工具調用與測試時擴展。
Qwen3-Next-80B-A3B-Thinking
Qwen 機型中最新發表的 Qwen3-Next 系列,透過創新的機型架構提升擴充效率。
Qwen3-235B-A22B-Thinking-2507
Qwen3 是 Qwen 系列中最新一代的大型語言模型,提供一套完整的密集與專家混合 (MoE) 模型。
相關文件
Claude 被用於製作惡意 npm 套件:逾 670 個套件遭入侵,威脅開源社群
一則近期發生的網路安全事件揭露了大型語言模型(LLMs)如何被用作開發惡意軟體的工具。資安研究員 Sibi Moosa 發現一名化名為「mousie-5212-super-formatter」的攻擊者,利用 Anthropic 的 Claude AI 生成有害程式碼,並污染 npm 套件生態系統。 在短時間內,超過 670 個惡意套件被上傳至 npm 套件庫,此類攻擊的速度與自動化程度引發了高度警
隨著印度加速推動科技發展,信實集團公布了1,100億美元的人工智慧投資計畫
印度信實集團(Reliance)的億萬富豪主席穆克什·安巴尼(Mukesh Ambani)於週四宣布,將斥資10兆盧比(約合1,100億美元),在未來七年間於印度各地建設人工智慧運算基礎設施。安巴尼週四在新德里舉行的「印度人工智慧影響力峰會」上表示,這筆投資將用於支持吉瓦級數據中心、全國性的邊緣運算網路,以及與信實集團旗下Jio電信平台整合的新人工智慧服務。安巴尼指出,信實集團已開始在古吉拉特邦的
智源WITA以首份合規申報書為「裸體」機器人互動畫下句點
具身智能領域已達成一項重要里程碑。根據上海市網絡信息辦公室的最新公告,智源研究所研發的WITA大模型已成功完成備案,成為國內首個符合規範部署的具身智能交互大模型。這項成就不僅僅是取得許可證。WITA 的核心宗旨在於讓類人型機器人能夠真正進行對話、感知情緒,並發展出鮮明的個性。它專為機器人互動場景設計,透過自然且富有情感表達的溝通方式,將冰冷的機械軀體轉化為具備連續記憶與個人特質的「矽基夥伴」。 作
一項人類學研究指出,經過潤飾的人工智慧產出內容會削弱人類的思考能力
當你看到人工智慧瞬間產出一段結構完善、邏輯清晰的程式碼或文件時,是否會不假思索地選擇相信它?根據AIbase 的報導,領先的人工智慧公司Anthropic最近發布了一份名為《AI 流暢度指數》的研究報告。 在分析了近 10,000 份匿名Claude對話樣本後,這項研究揭露了一個令人擔憂的趨勢:AI 產出的內容看起來越是精緻,使用者就越不願意去查證事實。報告揭示,當Claude產出小型應用程式、網
英國各政府部門就人工智慧資料中心的能源需求產生分歧
英國政府正面臨一項重大挑戰:在推動清潔能源的同時,力求成為人工智慧領域的全球領導者。然而,負責這些目標的各部會之間卻顯現出嚴重的分歧。 科學、創新與技術部(DSIT)與能源安全及淨零部(DESNZ)對於人工智慧資料中心的未來電力需求,持著截然不同的預測。DSIT預測,到2030年,人工智慧資料中心將需要6吉瓦的電力;而DESNZ的估計則不到該數字的十分之一。 這項差距引起了非營利組織「Foxglo





首頁
