모델 소개
DBRX-Instruct 은 DataBricks 에 의해 처음부터 훈련된 MoE 모델로, 16명의 전문가 중 4명을 선택하는 방식을 사용하며 활성 파라미터 수는 36B 입니다. 이 모델은 12T 토큰으로 사전 훈련되었으며 32K 컨텍스트를 지원합니다.\n
언어 이해 능력
종종 의미 론적 잘못 판단을 내리며, 논리적 인 분리가 응답으로 이어집니다.
2.5
지식 범위 범위
상당한 지식 사각 지대가 있으며, 종종 사실 오류와 구식 정보를 반복하는 경우가 많습니다.
6.6
추론 능력
일관된 추론 사슬을 유지할 수 없으며 종종 역 원인 또는 오해를 유발합니다.
2.0