Grok-3守住智能基线,Step-1-8K因奖励黑客问题丧失基础认知能力
Grok-3模型具备中等语言能力,而Step-1-8K模型语言输出频繁出错,难以满足基本沟通需求。
两个模型的AI推理计算能力均不足,在处理任务时错误频发,难以承担实际的计算分析任务。