вариант
Дом
Срочные новости
Содержание
RogerMartinez
RogerMartinez
6 февраля 2026 г.

Команда LongCat из Meituan представила LongCat-Flash-Lite, языковую модель, использующую новый подход к расширению встраивания вместо масштабирования экспертов. Имея в общей сложности 68,5 млрд параметров, она активирует только 2,9–4,5 млрд на каждый вывод благодаря эффективному слою встраивания N-грамм. Оптимизация системы позволяет достигать скорости 500–700 токенов в секунду. Она лидирует в тестах агентов и кодирования, таких как SWE-Bench (54,4%), и набирает 85,52 балла в MMLU. Модель теперь полностью открыта для всех.

Команда LongCat из Meituan представила LongCat-Flash-Lite, языковую модель, использующую новый подход к расширению встраивания вместо масштабирования экспертов. Имея в общей сложности 68,5 млрд параметров, она активирует только 2,9–4,5 млрд на каждый вывод благодаря эффективному слою встраивания N-грамм. Оптимизация системы позволяет достигать скорости 500–700 токенов в секунду. Она лидирует в тестах агентов и кодирования, таких как SWE-Bench (54,4%), и набирает 85,52 балла в MMLU. Модель теперь полностью открыта для всех. Команда LongCat из Meituan представила LongCat-Flash-Lite, языковую модель, использующую новый подход к расширению встраивания вместо масштабирования экспертов. Имея в общей сложности 68,5 млрд параметров, она активирует только 2,9–4,5 млрд на каждый вывод благодаря эффективному слою встраивания N-грамм. Оптимизация системы позволяет достигать скорости 500–700 токенов в секунду. Она лидирует в тестах агентов и кодирования, таких как SWE-Bench (54,4%), и набирает 85,52 балла в MMLU. Модель теперь полностью открыта для всех.
OR