モデルの紹介
DeepSeek-R1は、ポストトレーニングフェーズで強化学習技術を広範囲に活用し、最小限のアノテーションデータのみで、モデルの推論能力を大幅に向上させた。数学、コーディング、自然言語推論を含むタスクにおいて、その性能はOpenAIのo1の公式リリースと同等である。
言語理解能力
複雑なコンテキストを理解し、論理的に一貫性のある文を生成することができますが、時にはトーンコントロールがオフです。
7.5
知識カバレッジの範囲
200を超える専門分野をカバーし、最新の調査結果と異文化間知識をリアルタイムで統合します。
9.0
推論能力
非線形関係を処理するときに効率が低下するが、3つ以上のステップで論理的な推論を実行できます。
8.5