選項
首頁
AL模型列表
DeepSeek-V3
模型參數數量
671B
模型參數數量
附屬組織
DeepSeek
附屬組織
開源
許可證類型
發佈時間
2024-12-26
發佈時間

模型簡介
DeepSeek-V3 的評估分數高於其他開源模型,例如 Qwen2.5-72B 和 Llama-3.1-405B,其表現與世界上頂尖的閉源模型如 GPT-4o 和 Claude-3.5-Sonnet 不相上下。
向左向右滑動以查看更多
語言理解能力 語言理解能力
語言理解能力
通常會做出語義錯誤的判斷,從而導致響應中明顯的邏輯斷開連接。
6.8
知識覆蓋範圍 知識覆蓋範圍
知識覆蓋範圍
擁有主流學科的核心知識,但對尖端跨學科領域的覆蓋範圍有限。
8.8
推理能力 推理能力
推理能力
無法維持連貫的推理鏈,通常會導致因果關係或錯誤估計。
6.7
相關模型
DeepSeek-V3.2 Deepseek V3系列模型的最新版本。
DeepSeek-V3.2-Exp Deepseek V3 系列機型的最新實驗版本。
DeepSeek-R1-0528 最新版本的 Deepseek R1。
DeepSeek-V3-0324 DeepSeek-V3 在多項評估中超越 Qwen2.5-72B 與 Llama-3.1-405B 等開源模型,性能媲美 GPT-4 與 Claude-3.5-Sonnet 等頂尖閉源模型。
DeepSeek-R1-0528 Deepseek R1 的最新版本。
相關文件
DeepSeek-V3揭曉:硬體感知AI設計如何降低成本並提升效能 DeepSeek-V3:AI發展的成本效益飛躍AI產業正處於十字路口。雖然大型語言模型(LLMs)日益強大,其運算需求卻急劇上升,使尖端AI開發對大多數組織而言成本過高。DeepSeek-V3透過證明智慧硬體-軟體協同設計—而非僅靠暴力擴展—能在成本僅為一小部分的情況下實現頂尖效能,挑戰此趨勢。僅在2,048 NVIDIA H800 GPUs上訓練,DeepSeek-V3利用多頭潛在注意力(MLA
Snowflake 投資逾 6 億美元開發 AWS 客製化晶片,以推動企業級人工智慧發展 雲端數據巨頭 Snowflake 宣布,計劃在未來六年內投資超過 6 億美元,用於採購由亞馬遜網路服務(AWS)開發的 Graviton 系列 CPU 及 AI 加速器。 這項重大基礎設施投資是執行長 Sridhar Ramaswamy 領導下的核心計畫,標誌著公司全面轉向「AI 優先」策略,旨在大幅提升其數據雲端平台上處理大規模 AI 工作負載的成本效益。拉馬斯瓦米強調,建構企業級AI平台需要將
中國電信投資綿比智能,為大型語言模型與數據基礎設施籌集資金至71.3萬元 在大模型領域,這支「國家隊」與清華大學的領軍人物正深化戰略合作。 根據企查查最新企業登記資料顯示,2026年3月1日,北京綿比智能科技有限公司進行了重大股權重組,正式引入電信巨頭及產業基金的投資。此舉不僅是資本注入,更預示著國內大型模型在公共數據平台及智慧硬體領域的商業化進程將大幅加速。重點摘要:電信與本土基金雙重背書此次股權變更後,面壁智能的股東陣容新增了數家重要機構:中國電信全資投資:新股東「
陶天集團加速推進 AI 原生轉型,並向實習生發放免費代幣配額 TaoTian Group 近期推出「AI 生產力計畫」,旨在透過資源配置與工具補助,加速將 AI 技術整合至電商營運及研發工作流程中。此計畫現已開放給所有實習生,讓他們在實習期間享有與正式員工相同的 AI 權限、運算配額及審批流程。自 3 月 17 日起,淘天集團員工已獲授權免費使用多款付費 AI 工具,包括「悟空」及「Qoder」系列。這些工具支援廣泛的應用場景,從基礎技術研發到一般辦公室生產
Glean 瞄準企業 AI 基礎設施市場,展開搶佔先機之舉 企業人工智慧主導權的競爭正加速進行。微軟正將 Copilot 整合至 Office,Google 則將 Gemini 整合至 Workspace,而 OpenAI 和 Anthropic 兩家企業也正直接向企業銷售服務。與此同時,如今幾乎每家 SaaS 供應商都已內建人工智慧助理。在各方爭相掌控使用者介面的熱潮中,Glean 卻採取了一種較不顯眼的策略:成為底層的智慧層。七年前,Glean 最初定
模型比較
開始比較
OR