Nvidia dévoile le modèle d'IA open-source Nemotron-Nano-9B-v2, doté d'une fonction de raisonnement à double sens

Maison

Nouvelles

28 décembre 2025

DanielPerez

# Nvidia # nemotron # nlp

Les petits modèles linguistiques font des vagues. Après le lancement du modèle de vision de la taille d'une montre connectée par Liquid AI, une spin-off du MIT, et de l'offre de Google pour smartphones, Nvidia fait désormais son entrée sur le marché avec son propre concurrent allégé : Nemotron-Nano-9B-V2. Ce nouveau modèle est en tête de sa catégorie sur les principaux benchmarks et introduit une fonctionnalité unique qui permet aux utilisateurs d'activer ou de désactiver le « raisonnement » de l'IA, qui consiste essentiellement en un processus d'autocontrôle avant de fournir une réponse finale.

Bien que 9 milliards de paramètres dépassent l'échelle des micro-modèles à plusieurs millions de paramètres dont nous avons récemment fait état, Nvidia souligne qu'il s'agit d'une optimisation significative par rapport à ses 12 milliards de paramètres d'origine. La taille révisée est spécialement conçue pour fonctionner sur un seul GPU Nvidia A10 largement disponible.

Comme l'a expliqué Oleksii Kuchiaev, directeur de l'entraînement post-formation des modèles d'IA chez Nvidia, en réponse à une question sur X : « Nous avons réduit le modèle 12B à 9B afin qu'il s'adapte parfaitement à l'A10, un GPU de déploiement très populaire. Il s'agit également d'une architecture hybride, qui lui permet de traiter des lots plus importants et d'atteindre des vitesses jusqu'à six fois plus rapides que les modèles de transformateurs traditionnels de taille similaire. »

Pour mettre les choses en perspective, de nombreux modèles linguistiques de grande taille fonctionnent dans une fourchette de plus de 70 milliards de paramètres. Les paramètres sont les paramètres internes qui définissent le comportement d'un modèle, où un nombre plus élevé indique généralement une plus grande capacité, mais exige également une puissance de calcul nettement supérieure.

Le modèle prend en charge plusieurs langues, notamment l'anglais, l'allemand, l'espagnol, le français, l'italien et le japonais. Ses capacités étendues couvrent également le coréen, le portugais, le russe et le chinois. Il est parfaitement adapté à des tâches allant du suivi d'instructions à la génération de code.

Nemotron-Nano-9B-V2 et ses ensembles de données de pré-entraînement sont actuellement disponibles sur Hugging Face et via le catalogue de modèles de Nvidia.

Une fusion des architectures Transformer et Mamba

Le modèle est basé sur Nemotron-H, une famille de modèles hybrides Mamba-Transformer qui servent de base aux dernières offres d'IA de Nvidia.

Alors que les LLM dominants s'appuient généralement uniquement sur l'architecture Transformer et ses mécanismes d'attention, ceux-ci peuvent devenir prohibitifs en termes de mémoire et de calcul à mesure que la longueur des séquences d'entrée augmente.

Les modèles Nemotron-H et d'autres utilisant l'architecture Mamba, mise au point par des chercheurs de l'université Carnegie Mellon et de Princeton, intègrent des modèles d'espace d'état sélectifs (SSM). Ces SSM gèrent efficacement des séquences extrêmement longues en maintenant un état interne.

Ces couches évoluent de manière linéaire avec la longueur de la séquence, ce qui leur permet de traiter des contextes beaucoup plus longs que l'auto-attention standard sans la même charge de calcul.

Une conception hybride Mamba-Transformer réduit les coûts en remplaçant la plupart des couches d'attention par des couches d'espace d'état à temps linéaire. Cela peut permettre d'obtenir un débit jusqu'à 2 à 3 fois supérieur pour les tâches à contexte long, tout en conservant une précision comparable.

Nvidia n'est pas la seule à adopter cette approche ; d'autres laboratoires de recherche en IA, tels que AI2, ont également publié des modèles basés sur l'architecture Mamba.

Activer ou désactiver le raisonnement à l'aide de commandes simples

Nemotron-Nano-9B-v2 est conçu comme un modèle unifié, uniquement textuel, capable à la fois d'interactions conversationnelles et de raisonnements complexes, entièrement formé à partir de zéro.

Par défaut, le système génère une trace de raisonnement détaillée avant de produire sa réponse finale. Les utilisateurs peuvent contrôler ce comportement à l'aide de simples jetons de commande tels que /think ou /no_think.

Le modèle introduit également la gestion du « budget de réflexion » pendant l'exécution. Cela permet aux développeurs de fixer une limite maximale au nombre de jetons que le modèle peut utiliser pour le raisonnement interne avant de devoir fournir une réponse.

Ce mécanisme vise à équilibrer la précision et la latence de réponse, ce qui est crucial pour des applications telles que les chatbots d'assistance à la clientèle ou les agents autonomes.

Les benchmarks montrent de solides performances

Les résultats de l'évaluation démontrent une précision compétitive par rapport à d'autres modèles ouverts à petite échelle de premier plan. Lorsqu'il a été testé avec le raisonnement activé à l'aide de la suite NeMo-Skills, Nemotron-Nano-9B-v2 a obtenu des scores de 72,1 % sur AIME25, 97,8 % sur MATH500, 64,0 % sur GPQA et 71,1 % sur LiveCodeBench.

Les scores obtenus dans les benchmarks de suivi d'instructions et de contexte long sont également excellents : 90,3 % sur IFEval et 78,9 % sur le test RULER 128K, avec des gains supplémentaires mesurables sur BFCL v3 et le benchmark HLE.

Au cours de multiples évaluations, Nano-9B-v2 affiche systématiquement une précision supérieure à celle d'un point de comparaison courant, le modèle Qwen3-8B.

Nvidia présente ces résultats sous forme de courbes de précision par rapport au budget qui illustrent l'amélioration des performances à mesure que l'allocation de jetons pour le raisonnement augmente. La société note qu'un contrôle budgétaire rigoureux permet aux développeurs d'optimiser à la fois la qualité et la vitesse dans les environnements de production.

Formé sur des ensembles de données synthétiques

Le modèle Nano et la famille Nemotron-H au sens large sont tous deux entraînés à partir d'un mélange de données web soigneusement sélectionnées, de sources propriétaires et de données d'entraînement synthétiques.

Les corpus d'entraînement comprennent des textes généraux, du code, des mathématiques, de la littérature scientifique, des documents juridiques et financiers, ainsi que des ensembles de données de questions-réponses axés sur l'alignement.

Nvidia confirme l'utilisation de traces de raisonnement synthétiques générées par d'autres grands modèles afin d'améliorer les performances sur des tâches de benchmark complexes.

Licence et utilisation commerciale

Le modèle Nano-9B-v2 est publié sous le contrat de licence Nvidia Open Model License Agreement, dont la dernière mise à jour date de juin 2025.

Cette licence est conçue pour être permissive et adaptée aux entreprises. Nvidia déclare explicitement que les modèles sont commercialement utilisables dès leur sortie de l'emballage et que les développeurs sont libres de créer et de distribuer des œuvres dérivées.

Il est important de noter que Nvidia ne revendique la propriété d'aucun résultat généré par le modèle, laissant tous les droits et responsabilités à l'entreprise ou à l'organisation qui l'utilise.

Pour les développeurs d'entreprise, cela signifie que le modèle peut être déployé immédiatement en production sans avoir à négocier une licence commerciale distincte ou à payer des frais basés sur le volume d'utilisation, les revenus ou le nombre d'utilisateurs. Contrairement à certaines licences ouvertes à plusieurs niveaux proposées par d'autres fournisseurs, il n'existe aucune clause imposant l'achat d'une licence payante dès qu'une entreprise atteint une certaine taille.

Cela dit, l'accord comprend plusieurs conditions importantes que les entreprises doivent respecter :

Gardes-fous : les utilisateurs ne peuvent pas contourner ou désactiver les mécanismes de sécurité intégrés (appelés « gardes-fous ») sans mettre en œuvre des remplacements appropriés et équivalents pour leur déploiement spécifique.
Redistribution : toute redistribution du modèle ou de ses dérivés doit inclure le texte intégral de la licence Nvidia Open Model License et la mention appropriée (« Licence accordée par Nvidia Corporation sous la licence Nvidia Open Model License »).
Conformité : les utilisateurs doivent se conformer à toutes les réglementations et restrictions commerciales applicables, telles que les lois américaines sur le contrôle des exportations.
Conditions d'utilisation de l'IA fiable : l'utilisation doit être conforme aux directives de Nvidia en matière d'IA fiable, qui couvrent les principes de déploiement responsable et les considérations éthiques.
Clause de litige : la licence prend automatiquement fin si un utilisateur engage une procédure judiciaire pour violation de droits d'auteur ou de brevet à l'encontre d'une autre partie, alléguant une infraction liée au modèle.

Ces conditions visent à garantir la conformité juridique et une utilisation responsable, plutôt qu'à restreindre l'échelle commerciale. Les entreprises n'ont pas besoin de demander une autorisation supplémentaire ou de payer des redevances à Nvidia pour créer des produits, monétiser des services ou élargir leur base d'utilisateurs. Elles doivent en revanche s'assurer que leurs pratiques de déploiement respectent la sécurité, fournissent une attribution appropriée et satisfont à toutes les obligations de conformité.

Positionnement sur le marché

Avec Nemotron-Nano-9B-v2, Nvidia cible les développeurs qui ont besoin d'équilibrer la capacité de raisonnement et l'efficacité du déploiement à plus petite échelle.

Les fonctionnalités de contrôle du budget d'exécution et de basculement du raisonnement sont conçues pour offrir aux constructeurs de systèmes une plus grande flexibilité dans la gestion du compromis entre précision et vitesse de réponse.

Leur disponibilité sur Hugging Face et le catalogue de modèles de Nvidia témoigne d'une volonté d'accessibilité à grande échelle, encourageant l'expérimentation et l'intégration.

La sortie de Nemotron-Nano-9B-v2 par Nvidia souligne l'attention constante que porte l'entreprise à l'efficacité et au raisonnement contrôlable dans les modèles linguistiques.

En fusionnant des architectures hybrides avec des techniques avancées de compression et d'entraînement, Nvidia vise à fournir aux développeurs des outils qui maintiennent une grande précision tout en réduisant les coûts opérationnels et la latence.

Article connexe

La variante OpenClaw de Nvidia pourrait résoudre son plus grand défi : la sécurité Jensen Huang, PDG de Nvidia, estime que chaque entreprise a besoin d'une stratégie OpenClaw — et Nvidia est prête à la fournir.Lors de son discours d'ouverture de la GTC lundi, M. Huang a an

Le Pentagone signe des accords avec Nvidia, Microsoft et AWS pour déployer l’intelligence artificielle sur les réseaux classés. Après avoir précédemment conclu des accords avec Google, SpaceX et OpenAI, le Département de la Défense américain a annoncé vendredi qu’il avait signé des contrats avec Nvidia, Microsoft, Amazon Web Services et Reflection AI pour mettre en œuvre leur

La conférence GTC de Nvidia dévoile NemoClaw, le robot Olaf et un pari d'un billion de dollars Chargement du lecteur…Le PDG Jensen Huang est monté sur scène cette semaine lors de la conférence GTC de Nvidia, vêtu de sa veste en cuir emblématique, pour prononcer un discours de deux heures et dem

Recommandations de sujets spéciaux liés

Création de bande dessinée

Les meilleurs générateurs IA pour les mangas shonen : créez des séquences d'action survoltées et des effets d'énergie

Découvrez les meilleurs générateurs IA de mangas shonen de 2026 sur XIX.AI. Notre sélection triée sur le volet comprend des outils performants pour créer des séquences d'action à couper le souffle et des effets d'énergie dynamiques. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez votre potentiel créatif et commencez dès aujourd'hui à créer des mangas épiques !

15 outils

xix.ai

Entreprise

Les meilleurs outils de suivi des dépenses basés sur l'IA : numérisez vos reçus et classez automatiquement les dépenses de l'entreprise

Les meilleurs outils de gestion des dépenses basés sur l'IA en 2026 : les outils les mieux notés pour numériser vos reçus et classer automatiquement les dépenses de votre entreprise. Découvrez des solutions puissantes et révolutionnaires pour une gestion des dépenses sans effort, un suivi financier précis et une conformité simplifiée. Notre comparatif, mis à jour chaque semaine, qui oppose les options gratuites aux options payantes, vous aide à trouver la solution qui vous convient le mieux. Tirez pleinement parti de l'IA grâce aux recommandations d'experts de XIX.AI.

10 outils

xix.ai

Entreprise

Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats

Découvrez les meilleurs outils de recrutement basés sur l'IA de 2026 sur XIX.AI. Notre sélection propose des solutions performantes et révolutionnaires pour l'analyse des CV et l'automatisation de la planification des entretiens avec les candidats. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez l'assistant de recrutement idéal et optimisez votre processus de recrutement dès aujourd'hui !

10 outils

xix.ai

Productivité

Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale

Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.

10 outils

xix.ai

chatbot

Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes

Découvrez les meilleurs chatbots romantiques basés sur l'IA de 2026, sélectionnés pour vous aider à nouer des relations authentiques et durables. Notre sélection comprend des personnalités fortes et cohérentes, des comparaisons entre versions gratuites et payantes, ainsi que des tests en conditions réelles. Trouvez le compagnon idéal et commencez dès aujourd'hui sur XIX.AI.

10 outils

xix.ai

Éducation et apprentissage

Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique

Découvrez les meilleurs mentors en sciences des données et en intelligence artificielle pour 2026 afin de maîtriser SQL, Pandas et les workflows d'apprentissage automatique. Explorez notre sélection soigneusement élaborée sur XIX.AI pour bénéficier d'une guidance puissante et révolutionnaire. Comparez les options gratuites et payantes en tenant compte de perspectives pratiques. Développez rapidement vos compétences en sciences des données.

10 outils

xix.ai

commentaires (1)

0/500

Veuillez vous connecter d'abord

DanielThomas

14 janvier 2026 05:30:34 UTC+01:00

이 작은 언어 모델 경쟁이 정말 흥미롭네요! Nvidia가 추론 기능을 끄고 켤 수 있는 옵션을 넣은 건 실용적이면서도 재미있는 접근법인 것 같아요. 개인적으로는 이런 경량화 모델들이 스마트워치나 스마트폰 같은 엣지 디바이스에서 어떻게 활용될지 궁금해요. 🤔 AI가 점점 더 일상 속으로 스며들고 있는 느낌이에요.

Top nouvelles

AI Builder et Power Automate Révolutionnent la Synthèse de Documents Podcast Hosts Of NoteBookLM maintenant disponible pour les interviews La Chine dévoile ses normes nationales relatives aux robots humanoïdes et à l'intelligence incarnée L'adoption de l'IA par les entreprises plafonne, selon les données de Ramp Tutoriel Créateur d'Images Bing : Guide de Génération d'Art IA Apprenez à créer de la musique AI en utilisant votre voix: un tutoriel Suno étape par étape iMyFone MagicMic : Revue et tutoriel sur le changeur de voix AI en temps réel Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives DeepSeek V4 s'impose comme une technologie multimodale révolutionnaire dans le domaine de l'IA Embodied Intelligence dévoile la première norme sectorielle visant à freiner la croissance anarchique

Plus

En vedette