選項
首頁
快訊
內容
RogerMartinez
RogerMartinez
2026-02-06

美團的LongCat團隊推出LongCat-Flash-Lite語言模型,採用創新的嵌入擴展方法取代專家模型擴展。該模型總參數達685億,但透過高效的N-gram嵌入層,每次推理僅需激活29億至45億個參數。 系統優化使推論速度達每秒500-700個詞元,在SWE-Bench等代理與編碼基準測試中以54.4%準率領先,並於MMLU任務取得85.52分。該模型現已全面開源。

美團的LongCat團隊推出LongCat-Flash-Lite語言模型,採用創新的嵌入擴展方法取代專家模型擴展。該模型總參數達685億,但透過高效的N-gram嵌入層,每次推理僅需激活29億至45億個參數。 系統優化使推論速度達每秒500-700個詞元,在SWE-Bench等代理與編碼基準測試中以54.4%準率領先,並於MMLU任務取得85.52分。該模型現已全面開源。 美團的LongCat團隊推出LongCat-Flash-Lite語言模型,採用創新的嵌入擴展方法取代專家模型擴展。該模型總參數達685億,但透過高效的N-gram嵌入層,每次推理僅需激活29億至45億個參數。 系統優化使推論速度達每秒500-700個詞元,在SWE-Bench等代理與編碼基準測試中以54.4%準率領先,並於MMLU任務取得85.52分。該模型現已全面開源。
評論 (0)
0/300
OR