Дом
Ant Group представила Ling-2.6-flash с открытым исходным кодом — новую версию в семействе моделей Baoling
Сегодня серия крупных моделей Baoling от Ant Group получила значительное обновление: модель Ling-2.6-flash теперь официально доступна разработчикам по всему миру. Для обеспечения совместимости с различными аппаратными средами и снижения барьеров для внедрения в этой версии модели также представлены несколько вариантов точности, включая BF16, FP8 и INT4, что предоставляет разработчикам более гибкие возможности для инференса.
Ling-2.6-flash — это модель типа Instruct с общим количеством параметров 104 млрд и 7,4 млрд активированных параметров, которая ранее тестировалась под псевдонимом «Elephant Alpha» на платформе OpenRouter. В ходе двухнедельного испытания команда разработчиков собрала обширные отзывы из реальной практики и провела целенаправленную оптимизацию, в частности, значительно повысив плавность переключения между китайским и английским языками и улучшив совместимость с основными программными фреймворками.

Технические особенности: гибридная архитектура и превосходная эффективность
Основная силаLing-2.6-flash заключается в ее уникальной архитектуре и высокой операционной эффективности:
Гибридная линейная архитектура: благодаря низкоуровневой вычислительной оптимизации модель достигает превосходной скорости инференса. С 4 картами H20 она достигает до 340 токенов/с. По пропускной способности Prefill она превосходит Nemotron-3-Super в 2,2 раза, что значительно сокращает задержку отклика.
Впечатляющий коэффициент эффективности токенов: команда тщательно откалибровала эффективность токенов во время обучения. Данные оценки показывают, что для задач эквивалентного качества Ling-2.6-flash потребляет всего около 15 млн токенов — примерно одну десятую от сопоставимых конкурентов — что значительно снижает коммерческие затраты.
Углубление сценариев: целенаправленное улучшение возможностей агентов
Для сценариев с агентами — одного из наиболее распространенных вариантов использования больших моделей —Ling-2.6-flash был специально усовершенствован. Будь то обработка сложных вызовов инструментов, многоэтапное планирование или выполнение конечных задач, модель работает надежно. В нескольких отраслевых стандартных оценках, таких как BFCL-V4 и SWE-bench, даже по сравнению с моделями с большим количеством активированных параметров Ling-2.6-flash демонстрирует сопоставимую или даже передовую (SOTA) производительность.
Теперь разработчики могут получить доступ к открытым ресурсам модели через Hugging Face и ModelScope (сообщество Moba), что открывает возможности для дальнейшего изучения ее потенциала в различных отраслевых приложениях.
Связанная статья
Укажите название статьи, чтобы переформулировать его в виде вопроса.
В современном цифровом мире искусственный интеллект кардинально меняет все отрасли, и блогинг не является исключением. Блогеры постоянно ищут способы оптимизировать свои рабочие процессы, повысить кач
Conntour привлекла 7 млн долларов от General Catalyst и YC на разработку системы поиска по видеозаписям с использованием ИИ
В настоящее время отрасль технологий видеонаблюдения находится под пристальным вниманием, хотя и не по самым благоприятным причинам. Скандалы разгорелись после того, как, по сообщениям, Служба иммигра
Представлено первое аппаратное обеспечение Apple на базе ИИ: AirPods с камерой вступают в стадию DVT
Амбиции Apple в области аппаратного обеспечения для искусственного интеллекта становятся все более очевидными. Известный технический журналист Марк Гурман сообщает, что долгожданные AirPods со встроен
Рекомендации по связанным специальным темам
Комментарии (0)
Сегодня серия крупных моделей Baoling от Ant Group получила значительное обновление:

Технические особенности: гибридная архитектура и превосходная эффективность
Основная сила
Гибридная линейная архитектура: благодаря низкоуровневой вычислительной оптимизации модель достигает превосходной скорости инференса. С 4 картами H20 она достигает до 340 токенов/с. По пропускной способности Prefill она превосходит Nemotron-3-Super в 2,2 раза, что значительно сокращает задержку отклика.
Впечатляющий коэффициент эффективности токенов: команда тщательно откалибровала эффективность токенов во время обучения. Данные оценки показывают, что для задач эквивалентного качества
Углубление сценариев: целенаправленное улучшение возможностей агентов
Для сценариев с агентами — одного из наиболее распространенных вариантов использования больших моделей —
Теперь разработчики могут получить доступ к открытым ресурсам модели через Hugging Face и ModelScope (сообщество Moba), что открывает возможности для дальнейшего изучения ее потенциала в различных отраслевых приложениях.
Укажите название статьи, чтобы переформулировать его в виде вопроса.
В современном цифровом мире искусственный интеллект кардинально меняет все отрасли, и блогинг не является исключением. Блогеры постоянно ищут способы оптимизировать свои рабочие процессы, повысить кач
Conntour привлекла 7 млн долларов от General Catalyst и YC на разработку системы поиска по видеозаписям с использованием ИИ
В настоящее время отрасль технологий видеонаблюдения находится под пристальным вниманием, хотя и не по самым благоприятным причинам. Скандалы разгорелись после того, как, по сообщениям, Служба иммигра
Представлено первое аппаратное обеспечение Apple на базе ИИ: AirPods с камерой вступают в стадию DVT
Амбиции Apple в области аппаратного обеспечения для искусственного интеллекта становятся все более очевидными. Известный технический журналист Марк Гурман сообщает, что долгожданные AirPods со встроен











