Дом
JD.com представляет модель JoyAI-LLM-Flash для ускорения развития искусственного интеллекта

14 февраля компания JD.com открыла доступ к своей новейшей большой языковой модели JoyAI-LLM-Flash на платформе Hugging Face. Модель насчитывает в общей сложности 4,8 миллиарда параметров, из которых 3 миллиарда активируются во время инференции. Она была предварительно обучена на 20 триллионах текстовых токенов и демонстрирует высокую эффективность в понимании современных знаний, логическом мышлении и решении задач программирования.
JoyAI-LLM-Flash использует новую оптимизационную структуру FiberPO, которая внедряет теорию пучков волокон в обучение с подкреплением. В сочетании с оптимизатором Muon и технологией плотного многотокенного прогнозирования (MTP) этот подход эффективно решает проблемы нестабильности, характерные для масштабирования традиционных моделей. По сравнению с версиями без MTP ее пропускная способность увеличилась в 1,3–1,7 раза, что значительно повысило как эффективность обучения, так и потенциал практического применения.
Модель построена на архитектуре «смеси экспертов» (MoE) и состоит из 40 слоев. Она поддерживает длину контекста в 128 тысяч токенов и имеет словарный запас в 129 тысяч токенов, что представляет собой существенный шаг вперед для JD.com в области искусственного интеллекта.
Связанная статья
Snowflake инвестирует более 600 млн долларов в разработку специализированных чипов для AWS в рамках продвижения ИИ в корпоративном секторе
Snowflake, гигант в сфере облачных данных, объявил о планах инвестировать более 600 миллионов долларов в течение следующих шести лет в приобретение процессоров серии Graviton и ускорителей искусственн
China Telecom инвестирует в Mianbi Intelligence, увеличив капитал до 713 000 юаней для развития больших языковых моделей и инфраструктуры обработки данных
«Национальная команда» и ведущий специалист из Университета Цинхуа в сфере крупных моделей углубляют свое стратегическое сотрудничество. 1 марта 2026 года, согласно последним данным о регистрации пред
Группа Taotian ускоряет реструктуризацию с ориентацией на искусственный интеллект и предоставляет стажерам бесплатные квоты на токены
Группа TaoTian недавно представила «План повышения производительности с помощью ИИ», призванный ускорить интеграцию технологий искусственного интеллекта в операционную деятельность в сфере электронной
Рекомендации по связанным специальным темам
Комментарии (1)

14 февраля компания JD.com открыла доступ к своей новейшей большой языковой модели JoyAI-LLM-Flash на платформе Hugging Face. Модель насчитывает в общей сложности 4,8 миллиарда параметров, из которых 3 миллиарда активируются во время инференции. Она была предварительно обучена на 20 триллионах текстовых токенов и демонстрирует высокую эффективность в понимании современных знаний, логическом мышлении и решении задач программирования.
JoyAI-LLM-Flash использует новую оптимизационную структуру FiberPO, которая внедряет теорию пучков волокон в обучение с подкреплением. В сочетании с оптимизатором Muon и технологией плотного многотокенного прогнозирования (MTP) этот подход эффективно решает проблемы нестабильности, характерные для масштабирования традиционных моделей. По сравнению с версиями без MTP ее пропускная способность увеличилась в 1,3–1,7 раза, что значительно повысило как эффективность обучения, так и потенциал практического применения.
Модель построена на архитектуре «смеси экспертов» (MoE) и состоит из 40 слоев. Она поддерживает длину контекста в 128 тысяч токенов и имеет словарный запас в 129 тысяч токенов, что представляет собой существенный шаг вперед для JD.com в области искусственного интеллекта.
Snowflake инвестирует более 600 млн долларов в разработку специализированных чипов для AWS в рамках продвижения ИИ в корпоративном секторе
Snowflake, гигант в сфере облачных данных, объявил о планах инвестировать более 600 миллионов долларов в течение следующих шести лет в приобретение процессоров серии Graviton и ускорителей искусственн
China Telecom инвестирует в Mianbi Intelligence, увеличив капитал до 713 000 юаней для развития больших языковых моделей и инфраструктуры обработки данных
«Национальная команда» и ведущий специалист из Университета Цинхуа в сфере крупных моделей углубляют свое стратегическое сотрудничество. 1 марта 2026 года, согласно последним данным о регистрации пред
Группа Taotian ускоряет реструктуризацию с ориентацией на искусственный интеллект и предоставляет стажерам бесплатные квоты на токены
Группа TaoTian недавно представила «План повышения производительности с помощью ИИ», призванный ускорить интеграцию технологий искусственного интеллекта в операционную деятельность в сфере электронной











