Дом
Nvidia представила модель искусственного интеллекта Nemotron-Nano-9B-v2 с открытым исходным кодом и возможностью отключаемого рассуждения
Небольшие языковые модели набирают популярность. После дебюта модели искусственного зрения размером со смарт-часы от Liquid AI, созданной на базе технологий MIT, и предложения Google для смартфонов, Nvidia теперь выходит на сцену со своим собственным упрощенным конкурентом: Nemotron-Nano-9B-V2. Эта новая модель лидирует в своем классе по ключевым показателям и обладает уникальной функцией, которая позволяет пользователям включать или отключать «рассуждения» ИИ — по сути, процесс самопроверки перед предоставлением окончательного ответа.
Хотя 9 миллиардов параметров превышают масштаб микромоделей с миллионами параметров, о которых мы недавно сообщали, Nvidia подчеркивает, что это значительная оптимизация по сравнению с первоначальными 12 миллиардами параметров. Переработанный размер специально разработан для работы на одном широко доступном графическом процессоре Nvidia A10.
Как объяснил Олексий Кучиаев, директор Nvidia по пост-обучению моделей искусственного интеллекта, в ответ на вопрос о X: «Мы сократили модель с 12 миллиардов до 9 миллиардов, чтобы она идеально подходила для A10, популярного графического процессора для развертывания. Кроме того, это гибридная архитектура, которая позволяет обрабатывать более крупные пакеты данных и достигать скорости, в шесть раз превышающей скорость традиционных трансформаторных моделей аналогичного размера».
Для сравнения: многие ведущие большие языковые модели работают в диапазоне 70+ миллиардов параметров. Параметры — это внутренние настройки, которые определяют поведение модели, где более высокие значения обычно указывают на большие возможности, но также требуют значительно большей вычислительной мощности.
Модель поддерживает несколько языков, включая английский, немецкий, испанский, французский, итальянский и японский. Расширенные возможности также охватывают корейский, португальский, русский и китайский языки. Она хорошо подходит для задач, начиная от выполнения инструкций и заканчивая генерацией кода.
Nemotron-Nano-9B-V2 и ее предварительно обученные наборы данных в настоящее время доступны на Hugging Face и через собственный каталог моделей Nvidia.
Слияние архитектур Transformer и Mamba
Модель построена на основе Nemotron-H, семейства гибридных моделей Mamba-Transformer, которые служат основой для новейших продуктов Nvidia в области искусственного интеллекта.
Хотя доминирующие LLM обычно полагаются исключительно на архитектуру Transformer и ее механизмы внимания, они могут стать непомерно дорогостоящими с точки зрения памяти и вычислений по мере увеличения длины входных последовательностей.
Модели Nemotron-H и другие модели, использующие архитектуру Mamba, разработанную исследователями из Университета Карнеги-Меллона и Принстона, включают в себя модели выборочного пространства состояний (SSM). Эти SSM эффективно управляют чрезвычайно длинными последовательностями, поддерживая внутреннее состояние.
Эти слои масштабируются линейно по длине последовательности, что позволяет им обрабатывать гораздо более длинные контексты, чем стандартное самовнимание, без таких же вычислительных затрат.
Гибридная конструкция Mamba-Transformer снижает затраты за счет замены большинства слоев внимания слоями пространства состояний с линейным временем. Это может дать до 2–3 раз более высокую пропускную способность при выполнении задач с длинным контекстом при сохранении сопоставимой точности.
Nvidia не единственная компания, использующая этот подход; другие исследовательские лаборатории в области ИИ, такие как AI2, также выпустили модели, основанные на архитектуре Mamba.
Включение и выключение рассуждений с помощью простых команд
Nemotron-Nano-9B-v2 разработан как унифицированная текстовая модель, способная как к разговорному взаимодействию, так и к сложному рассуждению, обученная полностью с нуля.
По умолчанию система генерирует подробный отчет о рассуждениях, прежде чем дать окончательный ответ. Пользователи могут контролировать это поведение с помощью простых командных токенов, таких как /think или /no_think.
Модель также вводит управление «бюджетом мышления» во время выполнения. Это позволяет разработчикам устанавливать максимальный предел количества токенов, которые модель может использовать для внутреннего мышления, прежде чем она должна дать ответ.
Этот механизм предназначен для балансирования точности и задержки ответа, что имеет решающее значение для таких приложений, как чат-боты для поддержки клиентов или автономные агенты.
Бенчмарки показывают высокую производительность
Результаты оценки демонстрируют конкурентоспособную точность по сравнению с другими ведущими небольшими открытыми моделями. При тестировании с включенным рассуждением с использованием набора NeMo-Skills, Nemotron-Nano-9B-v2 достиг результатов 72,1% по AIME25, 97,8% по MATH500, 64,0% по GPQA и 71,1% по LiveCodeBench.
Результаты тестов на следование инструкциям и длинный контекст также высоки: 90,3% по IFEval и 78,9% по тесту RULER 128K, с дополнительными измеримыми улучшениями по BFCL v3 и тесту HLE.

В ходе нескольких оценок Nano-9B-v2 постоянно демонстрирует более высокую точность, чем обычная точка сравнения, модель Qwen3-8B.

Nvidia представляет эти результаты с помощью кривых «точность против бюджета», которые иллюстрируют, как производительность улучшается по мере увеличения количества токенов, выделенных для рассуждений. Компания отмечает, что тщательный контроль бюджета позволяет разработчикам оптимизировать как качество, так и скорость в производственных средах.
Обучение на синтетических наборах данных
Как модель Nano, так и более широкая семья Nemotron-H обучены на смеси тщательно отобранных веб-данных, проприетарных источников и синтетических обучающих данных.
Корпус обучения включает общий текст, код, математику, научную литературу, юридические и финансовые документы, а также наборы данных с вопросами и ответами, ориентированные на согласование.
Nvidia подтверждает использование синтетических следов рассуждений, сгенерированных другими крупными моделями, для повышения производительности при выполнении сложных тестовых задач.
Лицензирование и коммерческое использование
Модель Nano-9B-v2 выпускается в соответствии с лицензионным соглашением Nvidia Open Model License Agreement, которое в последний раз обновлялось в июне 2025 года.
Эта лицензия разработана с учетом требований разрешительности и удобства для предприятий. Nvidia прямо заявляет, что модели готовы к коммерческому использованию и что разработчики могут свободно создавать и распространять производные работы.
Важно отметить, что Nvidia не претендует на право собственности на любые результаты, сгенерированные моделью, оставляя все права и обязанности за разработчиком или организацией, использующей ее.
Для корпоративных разработчиков это означает, что модель может быть немедленно внедрена в производство без необходимости заключения отдельного коммерческого лицензионного соглашения или уплаты сборов в зависимости от объема использования, выручки или количества пользователей. В отличие от некоторых многоуровневых открытых лицензий других поставщиков, в соглашении нет положений, которые вступают в силу при достижении компанией определенного масштаба.
Тем не менее, соглашение содержит несколько важных условий, которые должны соблюдаться предприятиями:
- Ограждения: пользователи не могут обходить или отключать встроенные механизмы безопасности (называемые «ограждениями») без внедрения подходящих, эквивалентных заменителей для их конкретного развертывания.
- Перераспределение: любое перераспределение модели или ее производных должно включать полный текст лицензии Nvidia Open Model License и надлежащую атрибуцию («Лицензировано Nvidia Corporation в соответствии с лицензией Nvidia Open Model License»).
- Соблюдение: пользователи должны соблюдать все применимые торговые правила и ограничения, такие как законы США об экспортном контроле.
- Условия надежного ИИ: Использование должно соответствовать руководящим принципам Nvidia по надежному ИИ, которые охватывают принципы ответственного развертывания и этические соображения.
- Положение о судебных разбирательствах: лицензия автоматически прекращает свое действие, если пользователь инициирует судебное разбирательство по поводу авторских прав или патентов против другой стороны, утверждая, что имело место нарушение, связанное с моделью.
Эти условия направлены на обеспечение соблюдения законодательства и ответственного использования, а не на ограничение коммерческого масштаба. Предприятиям не нужно запрашивать дополнительное разрешение или платить роялти Nvidia за создание продуктов, монетизацию услуг или расширение базы пользователей. Вместо этого они должны обеспечить, чтобы их практики развертывания соответствовали требованиям безопасности, обеспечивали надлежащее указание авторства и соответствовали всем обязательствам по соблюдению законодательства.
Позиционирование на рынке
С Nemotron-Nano-9B-v2 Nvidia нацелена на разработчиков, которым необходимо сбалансировать возможности рассуждения и эффективность развертывания в меньших масштабах.
Функции контроля бюджета времени выполнения и переключения рассуждений призваны дать системным разработчикам большую гибкость в управлении компромиссом между точностью и скоростью отклика.
Их доступность в Hugging Face и каталоге моделей Nvidia сигнализирует о намерении обеспечить широкую доступность, поощряя эксперименты и интеграцию.
Выпуск Nvidia Nemotron-Nano-9B-v2 подчеркивает постоянное внимание компании к эффективности и контролируемому рассуждению в языковых моделях.
Объединяя гибридные архитектуры с передовыми технологиями сжатия и обучения, Nvidia стремится предоставить разработчикам инструменты, которые сохраняют высокую точность и одновременно снижают операционные затраты и задержки.
Связанная статья
Вариант OpenClaw от Nvidia может решить самую серьезную проблему: безопасность
Генеральный директор Nvidia Дженсен Хуанг считает, что каждой компании нужна стратегия OpenClaw — и Nvidia готова ее предоставить.Во время своего выступления на конференции GTC в понедельник Хуанг объ
Пентагон заключил соглашения с Nvidia, Microsoft и AWS о внедрении технологий искусственного интеллекта в секретные сети.
После предыдущих соглашений с Google, SpaceX и OpenAI, Министерство обороны США в пятницу объявило о подписании договоров с Nvidia, Microsoft, Amazon Web Services и Reflection AI о использовании их технологий и моделей искусственного интеллекта в сек
На конференции Nvidia GTC представлены NemoClaw, робот Олаф и ставка на 1 триллион долларов
Загрузка плеера…Генеральный директор Дженсен Хуанг вышел на сцену на конференции Nvidia GTC на этой неделе в своей фирменной кожаной куртке, чтобы выступить с двухчасовой речью, в которой он прогнозир
Рекомендации по связанным специальным темам
Комментарии (1)
Небольшие языковые модели набирают популярность. После дебюта модели искусственного зрения размером со смарт-часы от Liquid AI, созданной на базе технологий MIT, и предложения Google для смартфонов, Nvidia теперь выходит на сцену со своим собственным упрощенным конкурентом: Nemotron-Nano-9B-V2. Эта новая модель лидирует в своем классе по ключевым показателям и обладает уникальной функцией, которая позволяет пользователям включать или отключать «рассуждения» ИИ — по сути, процесс самопроверки перед предоставлением окончательного ответа.
Хотя 9 миллиардов параметров превышают масштаб микромоделей с миллионами параметров, о которых мы недавно сообщали, Nvidia подчеркивает, что это значительная оптимизация по сравнению с первоначальными 12 миллиардами параметров. Переработанный размер специально разработан для работы на одном широко доступном графическом процессоре Nvidia A10.
Как объяснил Олексий Кучиаев, директор Nvidia по пост-обучению моделей искусственного интеллекта, в ответ на вопрос о X: «Мы сократили модель с 12 миллиардов до 9 миллиардов, чтобы она идеально подходила для A10, популярного графического процессора для развертывания. Кроме того, это гибридная архитектура, которая позволяет обрабатывать более крупные пакеты данных и достигать скорости, в шесть раз превышающей скорость традиционных трансформаторных моделей аналогичного размера».
Для сравнения: многие ведущие большие языковые модели работают в диапазоне 70+ миллиардов параметров. Параметры — это внутренние настройки, которые определяют поведение модели, где более высокие значения обычно указывают на большие возможности, но также требуют значительно большей вычислительной мощности.
Модель поддерживает несколько языков, включая английский, немецкий, испанский, французский, итальянский и японский. Расширенные возможности также охватывают корейский, португальский, русский и китайский языки. Она хорошо подходит для задач, начиная от выполнения инструкций и заканчивая генерацией кода.
Nemotron-Nano-9B-V2 и ее предварительно обученные наборы данных в настоящее время доступны на Hugging Face и через собственный каталог моделей Nvidia.
Слияние архитектур Transformer и Mamba
Модель построена на основе Nemotron-H, семейства гибридных моделей Mamba-Transformer, которые служат основой для новейших продуктов Nvidia в области искусственного интеллекта.
Хотя доминирующие LLM обычно полагаются исключительно на архитектуру Transformer и ее механизмы внимания, они могут стать непомерно дорогостоящими с точки зрения памяти и вычислений по мере увеличения длины входных последовательностей.
Модели Nemotron-H и другие модели, использующие архитектуру Mamba, разработанную исследователями из Университета Карнеги-Меллона и Принстона, включают в себя модели выборочного пространства состояний (SSM). Эти SSM эффективно управляют чрезвычайно длинными последовательностями, поддерживая внутреннее состояние.
Эти слои масштабируются линейно по длине последовательности, что позволяет им обрабатывать гораздо более длинные контексты, чем стандартное самовнимание, без таких же вычислительных затрат.
Гибридная конструкция Mamba-Transformer снижает затраты за счет замены большинства слоев внимания слоями пространства состояний с линейным временем. Это может дать до 2–3 раз более высокую пропускную способность при выполнении задач с длинным контекстом при сохранении сопоставимой точности.
Nvidia не единственная компания, использующая этот подход; другие исследовательские лаборатории в области ИИ, такие как AI2, также выпустили модели, основанные на архитектуре Mamba.
Включение и выключение рассуждений с помощью простых команд
Nemotron-Nano-9B-v2 разработан как унифицированная текстовая модель, способная как к разговорному взаимодействию, так и к сложному рассуждению, обученная полностью с нуля.
По умолчанию система генерирует подробный отчет о рассуждениях, прежде чем дать окончательный ответ. Пользователи могут контролировать это поведение с помощью простых командных токенов, таких как /think или /no_think.
Модель также вводит управление «бюджетом мышления» во время выполнения. Это позволяет разработчикам устанавливать максимальный предел количества токенов, которые модель может использовать для внутреннего мышления, прежде чем она должна дать ответ.
Этот механизм предназначен для балансирования точности и задержки ответа, что имеет решающее значение для таких приложений, как чат-боты для поддержки клиентов или автономные агенты.
Бенчмарки показывают высокую производительность
Результаты оценки демонстрируют конкурентоспособную точность по сравнению с другими ведущими небольшими открытыми моделями. При тестировании с включенным рассуждением с использованием набора NeMo-Skills, Nemotron-Nano-9B-v2 достиг результатов 72,1% по AIME25, 97,8% по MATH500, 64,0% по GPQA и 71,1% по LiveCodeBench.
Результаты тестов на следование инструкциям и длинный контекст также высоки: 90,3% по IFEval и 78,9% по тесту RULER 128K, с дополнительными измеримыми улучшениями по BFCL v3 и тесту HLE.

В ходе нескольких оценок Nano-9B-v2 постоянно демонстрирует более высокую точность, чем обычная точка сравнения, модель Qwen3-8B.

Nvidia представляет эти результаты с помощью кривых «точность против бюджета», которые иллюстрируют, как производительность улучшается по мере увеличения количества токенов, выделенных для рассуждений. Компания отмечает, что тщательный контроль бюджета позволяет разработчикам оптимизировать как качество, так и скорость в производственных средах.
Обучение на синтетических наборах данных
Как модель Nano, так и более широкая семья Nemotron-H обучены на смеси тщательно отобранных веб-данных, проприетарных источников и синтетических обучающих данных.
Корпус обучения включает общий текст, код, математику, научную литературу, юридические и финансовые документы, а также наборы данных с вопросами и ответами, ориентированные на согласование.
Nvidia подтверждает использование синтетических следов рассуждений, сгенерированных другими крупными моделями, для повышения производительности при выполнении сложных тестовых задач.
Лицензирование и коммерческое использование
Модель Nano-9B-v2 выпускается в соответствии с лицензионным соглашением Nvidia Open Model License Agreement, которое в последний раз обновлялось в июне 2025 года.
Эта лицензия разработана с учетом требований разрешительности и удобства для предприятий. Nvidia прямо заявляет, что модели готовы к коммерческому использованию и что разработчики могут свободно создавать и распространять производные работы.
Важно отметить, что Nvidia не претендует на право собственности на любые результаты, сгенерированные моделью, оставляя все права и обязанности за разработчиком или организацией, использующей ее.
Для корпоративных разработчиков это означает, что модель может быть немедленно внедрена в производство без необходимости заключения отдельного коммерческого лицензионного соглашения или уплаты сборов в зависимости от объема использования, выручки или количества пользователей. В отличие от некоторых многоуровневых открытых лицензий других поставщиков, в соглашении нет положений, которые вступают в силу при достижении компанией определенного масштаба.
Тем не менее, соглашение содержит несколько важных условий, которые должны соблюдаться предприятиями:
- Ограждения: пользователи не могут обходить или отключать встроенные механизмы безопасности (называемые «ограждениями») без внедрения подходящих, эквивалентных заменителей для их конкретного развертывания.
- Перераспределение: любое перераспределение модели или ее производных должно включать полный текст лицензии Nvidia Open Model License и надлежащую атрибуцию («Лицензировано Nvidia Corporation в соответствии с лицензией Nvidia Open Model License»).
- Соблюдение: пользователи должны соблюдать все применимые торговые правила и ограничения, такие как законы США об экспортном контроле.
- Условия надежного ИИ: Использование должно соответствовать руководящим принципам Nvidia по надежному ИИ, которые охватывают принципы ответственного развертывания и этические соображения.
- Положение о судебных разбирательствах: лицензия автоматически прекращает свое действие, если пользователь инициирует судебное разбирательство по поводу авторских прав или патентов против другой стороны, утверждая, что имело место нарушение, связанное с моделью.
Эти условия направлены на обеспечение соблюдения законодательства и ответственного использования, а не на ограничение коммерческого масштаба. Предприятиям не нужно запрашивать дополнительное разрешение или платить роялти Nvidia за создание продуктов, монетизацию услуг или расширение базы пользователей. Вместо этого они должны обеспечить, чтобы их практики развертывания соответствовали требованиям безопасности, обеспечивали надлежащее указание авторства и соответствовали всем обязательствам по соблюдению законодательства.
Позиционирование на рынке
С Nemotron-Nano-9B-v2 Nvidia нацелена на разработчиков, которым необходимо сбалансировать возможности рассуждения и эффективность развертывания в меньших масштабах.
Функции контроля бюджета времени выполнения и переключения рассуждений призваны дать системным разработчикам большую гибкость в управлении компромиссом между точностью и скоростью отклика.
Их доступность в Hugging Face и каталоге моделей Nvidia сигнализирует о намерении обеспечить широкую доступность, поощряя эксперименты и интеграцию.
Выпуск Nvidia Nemotron-Nano-9B-v2 подчеркивает постоянное внимание компании к эффективности и контролируемому рассуждению в языковых моделях.
Объединяя гибридные архитектуры с передовыми технологиями сжатия и обучения, Nvidia стремится предоставить разработчикам инструменты, которые сохраняют высокую точность и одновременно снижают операционные затраты и задержки.
Вариант OpenClaw от Nvidia может решить самую серьезную проблему: безопасность
Генеральный директор Nvidia Дженсен Хуанг считает, что каждой компании нужна стратегия OpenClaw — и Nvidia готова ее предоставить.Во время своего выступления на конференции GTC в понедельник Хуанг объ
Пентагон заключил соглашения с Nvidia, Microsoft и AWS о внедрении технологий искусственного интеллекта в секретные сети.
После предыдущих соглашений с Google, SpaceX и OpenAI, Министерство обороны США в пятницу объявило о подписании договоров с Nvidia, Microsoft, Amazon Web Services и Reflection AI о использовании их технологий и моделей искусственного интеллекта в сек
На конференции Nvidia GTC представлены NemoClaw, робот Олаф и ставка на 1 триллион долларов
Загрузка плеера…Генеральный директор Дженсен Хуанг вышел на сцену на конференции Nvidia GTC на этой неделе в своей фирменной кожаной куртке, чтобы выступить с двухчасовой речью, в которой он прогнозир











