モデルの紹介
DBRX-Instruct は、DataBricks によってゼロからトレーニングされた MoE モデルであり、16 個のエキスパートから 4 個を選択する選択方式を使用しています。アクティブなパラメータ数は 36B です。このモデルは、12T のトークンで事前学習され、32K コンテキストをサポートしています。\n
言語理解能力
多くの場合、セマンティックな誤判断を行い、応答の明らかな論理的切断につながります。
2.5
知識カバレッジの範囲
重要な知識の盲点があり、多くの場合、事実上の誤りを示し、時代遅れの情報を繰り返します。
6.6
推論能力
コヒーレントな推論チェーンを維持することができず、多くの場合、反転した因果関係や誤算を引き起こします。
2.0