向左向右滑動以查看更多
模型名稱 | 提供者 | 參數 |
分數 |
發布日期 |
比較 |
---|---|---|---|---|---|
DeepSeek-V3 在多項評估中超越 Qwen2.5-72B 與 Llama-3.1-405B 等開源模型,性能媲美 GPT-4 與 Claude-3.5-Sonnet 等頂尖閉源模型。
|
DeepSeek | 671B | 5.4 | 2025-03-24 | |
o4-mini 在高模式下,具有更長的回應時間和更強的推理能力。
|
OpenAI | N/A | 6.2 | 2025-04-16 | |
騰訊發布的最新開源 MoE 模型
|
Tencent | 80B | 5.1 | 2025-06-27 | |
Moonshot AI 推出的最新模型,具備增強的編碼能力和在通用 Agent 任務中的卓越表現,基於 MoE 架構構建。
|
Moonshot | 1000B | 5.5 | 2025-07-11 | |
百靈大語言模型是一款通用型LLM,已完成生成式AI備案流程,基於數兆個標記進行訓練。其版本號為Bailing-Pro-20250225。
|
Ant Group | N/A | 4.4 | 2025-02-25 | |
科大訊飛發布的推理模型Spark X1,在國內領先的數學任務基礎上,針對推理、文本生成和語言理解等通用任務的性能,對標OpenAI o系列和DeepSeek R1。
|
iFLYTEK | N/A | 5.4 | 2025-07-20 | |
MiniMax-Text-01 是一個強大的語言模型,擁有總計 4560 億個參數,其中每個 token 激活 459 億個參數。為了更好地發揮模型的長上下文能力,MiniMax-Text-01 採用了一種混合架構,結合了 Lightning Attention、Softmax Attention 和專家混合(MoE)技術。
|
MiniMax | 456B | 3.8 | 2025-01-15 | |
GLM 發布的新 GLM-4.5 推理模型系列
|
Zhipu AI | 110B | 5.6 | 2025-07-29 | |
Minimax 發布的全球首個人工智能開源權重大規模混合注意力推理模型
|
MiniMax | 456B | 5.5 | 2025-06-17 | |
Qwen3 是 Qwen 系列的最新一代大型語言模型,提供了一套全面的密集和專家混合(MoE)模型。
|
Alibaba | 235B | 5.7 | 2025-07-22 |