モデルの紹介
DBRX-Instruct は、DataBricks によってゼロから訓練された MoE モデルであり、16 個のエキスパートの中から 4 つを選択する選択方式を採用しています。活動パラメータ数は 36B です。このモデルは、12T のトークンで事前学習され、32K のコンテキストをサポートしています。\n
言語理解能力
多くの場合、セマンティックな誤判断を行い、応答の明らかな論理的切断につながります。
3.8
知識カバレッジの範囲
重要な知識の盲点があり、多くの場合、事実上の誤りを示し、時代遅れの情報を繰り返します。
5.9
推論能力
コヒーレントな推論チェーンを維持することができず、多くの場合、反転した因果関係や誤算を引き起こします。
2.6