モデルの紹介
DeepSeek-V3は、Qwen2.5-72BやLlama-3.1-405Bなどのオープンソースモデルを複数の評価で上回り、GPT-4やClaude-3.5-Sonnetなどのトップクラスのクローズドソースモデルと同等の性能を発揮します。
言語理解能力
複雑なコンテキストを理解し、論理的に一貫性のある文を生成することができますが、時にはトーンコントロールがオフです。
7.5
知識カバレッジの範囲
主流の分野の中心的な知識を持っていますが、最先端の学際的な分野の報道は限られています。
8.8
推論能力
コヒーレントな推論チェーンを維持することができず、多くの場合、反転した因果関係や誤算を引き起こします。
5.4