Introdução ao modelo
MiniMax-Text-01 é um modelo de linguagem poderoso com um total de 456 bilhões de parâmetros, dos quais 45,9 bilhões são ativados por token. Para desbloquear melhor as capacidades de contexto longo do modelo, MiniMax-Text-01 adota uma arquitetura híbrida que combina Lightning Attention, Softmax Attention e Mixture-of-Experts (MoE).
Capacidade de compreensão de idiomas
Muitas vezes, faz mal julgamentos semânticos, levando a óbvias desconexões lógicas nas respostas.
6.3
Escopo de cobertura do conhecimento
Possui conhecimento central das disciplinas convencionais, mas tem cobertura limitada de campos interdisciplinares de ponta.
8.5
Capacidade de raciocínio
Incapaz de manter cadeias de raciocínio coerentes, geralmente causando causalidade invertida ou erros de cálculo.
4.0