选项
首页
快讯
内容
RogerMartinez
RogerMartinez
2026-02-06

美团LongCat团队推出LongCat-Flash-Lite语言模型,该模型采用创新的嵌入扩展方法替代专家模型缩放。其总参数达685亿,但通过高效的N-gram嵌入层,每次推理仅激活29亿至45亿参数。 系统优化使推断速度达到500-700令牌/秒。该模型在SWE-Bench等智能体和编码基准测试中表现领先(54.4%),并在MMLU任务上取得85.52分。该模型现已完全开源。

美团LongCat团队推出LongCat-Flash-Lite语言模型,该模型采用创新的嵌入扩展方法替代专家模型缩放。其总参数达685亿,但通过高效的N-gram嵌入层,每次推理仅激活29亿至45亿参数。 系统优化使推断速度达到500-700令牌/秒。该模型在SWE-Bench等智能体和编码基准测试中表现领先(54.4%),并在MMLU任务上取得85.52分。该模型现已完全开源。 美团LongCat团队推出LongCat-Flash-Lite语言模型,该模型采用创新的嵌入扩展方法替代专家模型缩放。其总参数达685亿,但通过高效的N-gram嵌入层,每次推理仅激活29亿至45亿参数。 系统优化使推断速度达到500-700令牌/秒。该模型在SWE-Bench等智能体和编码基准测试中表现领先(54.4%),并在MMLU任务上取得85.52分。该模型现已完全开源。
评论 (0)
0/300
OR