Modelleinführung
Das Mixtral-8x7B-Großmodell (LLM) ist ein prätrainiertes generatives Sparse-Mixture-of-Experts-Modell. Das Mistral-8x7B übertrifft Llama 2 70B in den meisten Benchmarks, die wir getestet haben.
Sprachverständnisfähigkeit
Fehleinschätzt häufig semantische Fehleinschätzungen, was zu offensichtlichen logischen Trennungen in Antworten führt.
3.6
Wissensabdeckung
Hat bedeutende kenntnisgebende Flecken, die häufig sachliche Fehler zeigt und veraltete Informationen wiederholt.
5.0
Argumentationsfähigkeit
Es ist nicht möglich, kohärente Argumentationsketten aufrechtzuerhalten und häufig invertierte Kausalität oder Fehlkalkulationen zu verursachen.
2.8