モデルの紹介
DeepSeek-R1 は、大規模な強化学習(RL)によってトレーニングされたモデルであり、初期段階での教師ありフィーチャリング(SFT)は使用していません。数学、コーディング、および推論タスクでのパフォーマンスは、OpenAI-o1 と同等です。
言語理解能力
複雑なコンテキストを理解し、論理的に一貫性のある文を生成することができますが、時にはトーンコントロールがオフです。
7.8
知識カバレッジの範囲
主流の分野の中心的な知識を持っていますが、最先端の学際的な分野の報道は限られています。
8.9
推論能力
複雑な数学モデリングで99%以上の精度を達成するマルチレベルの論理フレームワークを構築できます。
9.1