オプション
速報
コンテンツ
RogerMartinez
RogerMartinez
2026年2月6日

美団のLongCatチームは、エキスパートのスケーリングではなく新規の埋め込み拡張手法を採用した言語モデル「LongCat-Flash-Lite」を発表した。総パラメータ数685億ながら、効率的なN-gram埋め込み層により推論ごとに29億~45億のパラメータのみを活性化させる。 システム最適化により500-700トークン/秒の処理速度を実現。SWE-Bench(54.4%)などのエージェント・コーディングベンチマークで首位を保持し、MMLUでは85.52点を記録。本モデルは完全オープンソース化されました。

美団のLongCatチームは、エキスパートのスケーリングではなく新規の埋め込み拡張手法を採用した言語モデル「LongCat-Flash-Lite」を発表した。総パラメータ数685億ながら、効率的なN-gram埋め込み層により推論ごとに29億~45億のパラメータのみを活性化させる。 システム最適化により500-700トークン/秒の処理速度を実現。SWE-Bench(54.4%)などのエージェント・コーディングベンチマークで首位を保持し、MMLUでは85.52点を記録。本モデルは完全オープンソース化されました。 美団のLongCatチームは、エキスパートのスケーリングではなく新規の埋め込み拡張手法を採用した言語モデル「LongCat-Flash-Lite」を発表した。総パラメータ数685億ながら、効率的なN-gram埋め込み層により推論ごとに29億~45億のパラメータのみを活性化させる。 システム最適化により500-700トークン/秒の処理速度を実現。SWE-Bench(54.4%)などのエージェント・コーディングベンチマークで首位を保持し、MMLUでは85.52点を記録。本モデルは完全オープンソース化されました。
コメント (0)
0/300
OR