Introdução ao modelo
Mixtral 8x22B é um modelo Mixture-of-Experts (SMoE) esparsa que utiliza apenas 39B de parâmetros ativos de um total de 141B, oferecendo uma eficiência de custo sem precedentes para seu tamanho.
Capacidade de compreensão de idiomas
Muitas vezes, faz mal julgamentos semânticos, levando a óbvias desconexões lógicas nas respostas.
3.3
Escopo de cobertura do conhecimento
Possui conhecimento central das disciplinas convencionais, mas tem cobertura limitada de campos interdisciplinares de ponta.
7.2
Capacidade de raciocínio
Incapaz de manter cadeias de raciocínio coerentes, geralmente causando causalidade invertida ou erros de cálculo.
2.8