모델 이름 | 공급자 | 매개 변수 |
점수 |
출시일 |
비교하다 |
---|---|---|---|---|---|
DeepSeek-V3는 Qwen2.5-72B 및 Llama-3.1-405B와 같은 다른 오픈소스 모델을 여러 평가에서 능가하며 GPT-4 및 Claude-3.5-Sonnet과 같은 최상위 비공개 모델의 성능에 필적합니다.
|
DeepSeek | 671B | 5.4 | 2025년 3월 24일 | |
o4-mini는 높은 모드에서 더 긴 응답 시간과 더 강력한 추론 능력을 가지고 있습니다.
|
OpenAI | N/A | 6.2 | 2025년 4월 16일 | |
텐센트에서 출시한 최신 오픈소스 MoE 모델.
|
Tencent | 80B | 5.1 | 2025년 6월 27일 | |
Moonshot AI가 출시한 최신 모델로, 향상된 코딩 기능과 일반 에이전트 작업에서 우수한 성능을 제공하며, MoE 아키텍처를 기반으로 구축되었습니다.
|
Moonshot | 1000B | 5.5 | 2025년 7월 11일 | |
베일링 대형 언어 모델은 생성형 AI 등록 절차를 완료한 범용 LLM으로, 수조 개의 토큰으로 훈련되었습니다. 버전 번호 Bailing-Pro-20250225를 채택했습니다.
|
Ant Group | N/A | 4.4 | 2025년 2월 25일 | |
iFlytek에서 출시한 추론 모델 Spark X1은 국내 선도적인 수학 과제를 기반으로 추론, 텍스트 생성, 언어 이해와 같은 일반 과제의 성능을 OpenAI o 시리즈 및 DeepSeek R1과 비교합니다.
|
iFLYTEK | N/A | 5.4 | 2025년 7월 20일 | |
MiniMax-Text-01은 총 4560억 개의 매개변수를 가진 강력한 언어 모델로, 이 중 459억 개가 토큰당 활성화됩니다. 모델의 긴 문맥 처리 능력을 더 잘 활용하기 위해 MiniMax-Text-01은 Lightning Attention, Softmax Attention, Mixture-of-Experts(MoE)를 결합한 하이브리드 아키텍처를 채택했습니다.
|
MiniMax | 456B | 3.8 | 2025년 1월 15일 | |
GLM에서 출시한 새로운 GLM-4.5 추론 모델 시리즈.
|
Zhipu AI | 110B | 5.6 | 2025년 7월 29일 | |
Minimax에서 출시한 세계 최초의 오픈 웨이트 대규모 하이브리드 주의 추론 모델.
|
MiniMax | 456B | 5.5 | 2025년 6월 17일 | |
Qwen3는 Qwen 시리즈의 최신 대형 언어 모델로, 밀집 모델과 전문가 혼합(MoE) 모델의 포괄적인 제품군을 제공합니다.
|
Alibaba | 235B | 5.7 | 2025년 7월 22일 |