вариант
Дом
Новости
Новый Llama-3.1 Nemotron Ultra Outperforms DeepSeek R1 в половине размера

Новый Llama-3.1 Nemotron Ultra Outperforms DeepSeek R1 в половине размера

13 апреля 2025 г.
164

Новый Llama-3.1 Nemotron Ultra Outperforms DeepSeek R1 в половине размера

Пока Meta сталкивается с пристальным вниманием к своей последней семейной модели Llama 4, Nvidia тихо представила новую полностью открытую большую языковую модель (LLM), основанную на более ранней модели Meta Llama-3.1-405B-Instruct. Названная Llama-3.1-Nemotron-Ultra-253B-v1, эта модель обладает 253 миллиардами параметров и разработана для превосходства в сложных рассуждениях, следовании инструкциям и рабочих процессах AI-ассистентов. Nvidia впервые намекнула на эту модель во время своей ежегодной конференции GPU Technology Conference (GTC) в марте.

Выпуск подчеркивает продолжающуюся приверженность Nvidia повышению производительности за счет архитектурных инноваций и тщательных процессов пост-обучения. Анонсированная 7 апреля 2025 года, код модели, веса и данные пост-обучения теперь свободно доступны на Hugging Face. Она разработана для плавного переключения между сложными задачами рассуждения и более простыми результатами на основе системных подсказок, предоставляя разработчикам гибкость в их приложениях.

Разработана для эффективного вывода

Опираясь на предыдущие усилия Nvidia по оптимизации LLM для вывода, Llama-3.1-Nemotron-Ultra-253B включает процесс поиска нейронной архитектуры (NAS) для уточнения своей архитектуры. Это включает инновационные функции, такие как пропущенные слои внимания, объединенные прямые нейронные сети (FFNs) и переменные коэффициенты сжатия FFN. Эти изменения снижают использование памяти и вычислительные требования модели, что делает ее развертываемой на одном узле 8x H100 GPU без ущерба для качества вывода.

Nvidia утверждает, что эта модель обеспечивает высокую производительность при экономичной стоимости для развертывания в дата-центрах. Она совместима с микроархитектурами Nvidia B100 и Hopper и была протестирована в режимах точности BF16 и FP8.

Пост-обучение для рассуждений и выравнивания

Модель прошла всесторонний режим пост-обучения. Это включало контролируемое тонкое настройка по различным доменам, таким как математика, генерация кода, чат и использование инструментов, с последующим обучением с подкреплением с использованием оптимизации групповой относительной политики (GRPO) для улучшения способностей следования инструкциям и рассуждения.

Дальнейшее уточнение проводилось через фазу дистилляции знаний на 65 миллиардах токенов и непрерывное предварительное обучение на дополнительных 88 миллиардах токенов. Источники обучающих данных включали FineWeb, Buzz-V1.2 и Dolma, с пост-обучающими подсказками и ответами, взятыми как из публичных корпусов, так и из методов синтетической генерации. Этот подход помог модели различать свои режимы рассуждения.

Улучшенная производительность в многочисленных доменах и тестах

При включении режима рассуждения модель показала значительные улучшения в различных тестах. Например, в тесте MATH500 производительность выросла с 80,40% в стандартном режиме до 97,00% с включенным рассуждением. Аналогично, результаты AIME25 подскочили с 16,67% до 72,50%, а результаты LiveCodeBench более чем удвоились, с 29,03% до 66,31%.

Модель также преуспела в задачах, связанных с использованием инструментов, и в общем ответе на вопросы (GPQA), набрав 76,01% в режиме рассуждения по сравнению с 56,60% без него. Эти тесты проводились с максимальной длиной последовательности 32 000 токенов, и каждый тест повторялся до 16 раз для точности.

По сравнению с современной моделью MoE DeepSeek R1, которая имеет 671 миллиард параметров, модель Nvidia держится на равных, несмотря на меньшее количество параметров. Она превосходит DeepSeek R1 в задачах, таких как GPQA (76,01 против 71,5), IFEval следование инструкциям (89,45 против 83,3) и задачи кодирования LiveCodeBench (66,31 против 65,9). Однако DeepSeek R1 немного опережает в некоторых математических оценках, особенно в AIME25 (79,8 против 72,50) и MATH500 (97,3 против 97,00).

Эти результаты показывают, что плотная модель Nvidia может соответствовать или превосходить модели MoE в рассуждениях и общем выравнивании инструкций, хотя немного отстает в категориях с интенсивной математикой.

Использование и интеграция

Модель легко интегрируется с библиотекой Hugging Face Transformers (рекомендуется версия 4.48.3) и поддерживает последовательности до 128 000 токенов. Разработчики могут переключать поведение рассуждения с помощью системных подсказок и выбирать стратегии декодирования в зависимости от потребностей задачи. Для задач рассуждения Nvidia предлагает использовать выборку температуры (0,6) с значением top-p 0,95, в то время как для детерминированных выходов рекомендуется жадное декодирование.

Llama-3.1-Nemotron-Ultra-253B поддерживает многоязычные приложения, включая английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский. Она хорошо подходит для различных случаев использования LLM, таких как разработка чат-ботов, рабочие процессы AI-агентов, генерация с дополненным извлечением (RAG) и генерация кода.

Лицензирована для коммерческого использования

Выпущена под лицензией Nvidia Open Model License и регулируется соглашением о лицензии сообщества Llama 3.1, модель готова для коммерческих приложений. Nvidia подчеркивает важность ответственного развития AI, призывая команды оценивать выравнивание, безопасность и предвзятость модели для их конкретных случаев использования.

Олексий Кучаев, директор Nvidia по пост-обучению AI-моделей, поделился восторгом от этого открытого выпуска на X, подчеркнув плотный дизайн 253B с переключаемыми возможностями рассуждения и включение открытых весов и данных.

Связанная статья
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
Теперь Meta AI отвечает на сообщения покупателей на Facebook Marketplace Теперь Meta AI отвечает на сообщения покупателей на Facebook Marketplace Facebook Marketplace внедряет новые функции Meta AI, в том числе автоматические ответы на запросы покупателей, как сообщила компания в четверг. Платформа также использует искусственный интеллект для у
Meta заключила контракт на поставку миллионов процессоров Amazon для искусственного интеллекта Meta заключила контракт на поставку миллионов процессоров Amazon для искусственного интеллекта Компания Amazon заключила важное партнерское соглашение с Meta, вновь сделав ставку на свои собственные чипы, разработанные по индивидуальному заказу. Как подтвердила Amazon в пятницу, Meta согласилас
Рекомендации по связанным специальным темам
чат-бот Создайте свою собственную любовную историю с ИИ с помощью этих инструментов для ролевых игр
Создайте свою собственную любовную историю с ИИ с помощью этих инструментов для ролевых игр

Откройте для себя 2026 лучших инструментов для ролевых игр на базе ИИ, которые помогут вам создавать захватывающие истории. В тщательно подобранном списке XIX.AI представлены мощные, революционные помощники, которые раскроют ваш творческий потенциал в повествовании и придадут ему эмоциональную глубину. Сравните бесплатные и платные варианты на основе реальных тестов. Начните свое уникальное путешествие уже сегодня.

10 инструментов
xix.ai
Преобразование текста в речь Лучшие инструменты искусственного интеллекта для независимых разработчиков игр: как сэкономить время на озвучке для RPG и визуальных новелл
Лучшие инструменты искусственного интеллекта для независимых разработчиков игр: как сэкономить время на озвучке для RPG и визуальных новелл

Откройте для себя лучшие инструменты искусственного интеллекта для озвучивания в 2026 году, предназначенные для разработчиков игр! В тщательно составленном списке XIX.AI представлены самые популярные и революционные решения, которые помогут вам сэкономить время и деньги на озвучивании ролевых игр и визуальных новелл. Ознакомьтесь с сравнением бесплатных и платных версий, результатами реальных тестов и еженедельно обновляемыми рейтингами. Найдите свой идеальный инструмент для озвучивания уже сегодня!

10 инструментов
xix.ai
Образование и обучение Лучшие инструменты искусственного интеллекта для систематического повторения материала: оптимизация учебных планов студентов-медиков и юристов
Лучшие инструменты искусственного интеллекта для систематического повторения материала: оптимизация учебных планов студентов-медиков и юристов

Откройте для себя лучшие инструменты для повторения материала с использованием технологий искусственного интеллекта в 2026 году, подобранные компанией XIX.AI. Наши самые популярные и революционные инструменты помогут студентам-медикам и юристам оптимизировать расписание занятий для лучшего запоминания информации. Сравните бесплатные и платные варианты с использованием реальных примеров и еженедельно обновляемых рейтингов. Раскройте для себя все возможности эффективного обучения уже сегодня.

10 инструментов
xix.ai
Создание видео Лучшие платформы для преобразования текста в видео с помощью ИИ для написания сценариев и визуального повествования
Лучшие платформы для преобразования текста в видео с помощью ИИ для написания сценариев и визуального повествования

2026: лучшие платформы для преобразования текста в видео с помощью ИИ: самые популярные инструменты для написания сценариев и визуального повествования. Откройте для себя мощные, революционные решения, которые помогут превратить ваш текст в увлекательные видеоролики. Сравните бесплатные и платные варианты с помощью наших еженедельно обновляемых рейтингов и реальных тестов. Найдите идеальную платформу, которая поможет вам раскрыть свой творческий потенциал и повысить продуктивность. Ознакомьтесь с тщательно подобранной подборкой на сайте XIX.AI.

10 инструментов
xix.ai
чат-бот АИ-оркестраторы множественных агентов: создание сложных автоматизированных рабочих процессов с использованием естественного языка
АИ-оркестраторы множественных агентов: создание сложных автоматизированных рабочих процессов с использованием естественного языка

2026 Год: Откройте для себя лучшие инструменты на основе искусственного интеллекта, предназначенные для создания сложных автоматизированных рабочих процессов с использованием естественного языка. Наш отобранный список включает наиболее популярные и мощные платформы, обеспечивающие бесшовную автоматизацию задач и интеллектуальное управление процессами. Сравните бесплатные и платные варианты с примерами реального использования. Получите преимущества, предоставляемые технологиями искусственного интеллекта, благодаря еженедельно обновляемым рейтингам от XIX.AI.

10 инструментов
xix.ai
Редактирование изображений Лучшее программное обеспечение для снижения шума на основе искусственного интеллекта: устранение зерна и артефактов на снимках, сделанных в условиях слабого освещения ночью
Лучшее программное обеспечение для снижения шума на основе искусственного интеллекта: устранение зерна и артефактов на снимках, сделанных в условиях слабого освещения ночью

Откройте для себя лучшие программы по уменьшению шума на основе искусственного интеллекта в 2026 году, предназначенные для фотографии в условиях слабого освещения ночью. Наш список, составленный специально для вас, сравнивает бесплатные и платные инструменты, включает результаты реальных тестов и еженедельно обновляемые рейтинги. Избавьтесь от шума и других нежелательных эффектов без особых усилий. Откройте для себя преимущества искусственного интеллекта в сервисе XIX.AI.

10 инструментов
xix.ai
Комментарии (54)
0/500
JonathanNelson
JonathanNelson 9 декабря 2025 г., 11:30:42 GMT+03:00

Интересно, как Nvidia удалось упаковать все эти параметры в модель размером вдвое меньше. Выходит, вложения в архитектуру дают больше преимуществ, чем просто увеличение данных? Хотя, конечно, с учётом их вычислительных ресурсов не стоит удивляться. Что особенно ценно, так это тот факт, что модель открыта. На этом фоне заявления Meta порой звучат слишком громко и с многочисленными оговорками 🤔 Это может изменить правила игры для независимых исследователей!

CharlesYoung
CharlesYoung 3 ноября 2025 г., 7:30:34 GMT+03:00

¿Nvidia saca otro modelo open-source más potente que DeepSeek R1? 🤔 Me pregunto si esto realmente marcará una diferencia práctica para los desarrolladores o es solo otra carrera por los números en los benchmarks. ¡253 mil millones de parámetros parece excesivo!

DouglasMartínez
DouglasMartínez 18 августа 2025 г., 18:01:00 GMT+03:00

Nvidia's new model sounds like a beast! Half the size of DeepSeek R1 but still outperforms it? That's wild efficiency. Can't wait to see how devs play with this open-source gem! 🚀

StephenRoberts
StephenRoberts 1 августа 2025 г., 5:48:18 GMT+03:00

Nvidia's new model sounds like a beast! Half the size of DeepSeek R1 but still outshines it? That's some serious tech flex. Can't wait to see how devs play with this open-source gem! 😎

AnthonyRoberts
AnthonyRoberts 24 апреля 2025 г., 11:35:07 GMT+03:00

Nvidia's new Llama-3.1 Nemotron Ultra is a beast! It's amazing how it outperforms DeepSeek R1 with half the size. I've been using it for my projects and the results are incredible. Just wish it was a bit faster, but overall, a solid choice! 🚀

JohnRoberts
JohnRoberts 23 апреля 2025 г., 3:03:45 GMT+03:00

¡El Llama-3.1 Nemotron Ultra de Nvidia es impresionante! Supera al DeepSeek R1 con la mitad del tamaño, lo cual es alucinante. Lo he estado usando en mis proyectos y es súper eficiente. Lo único es que puede ser un poco complicado de configurar. Aún así, una excelente opción para quien busque un LLM potente. 🚀

OR