Nvidia presenta el modelo de IA de código abierto Nemotron-Nano-9B-v2 con razonamiento conmutable

Hogar

Noticias

28 de diciembre de 2025

DanielPerez

# Nvidia # nemotron # nlp

Los modelos de lenguaje pequeños están causando sensación. Tras el debut del modelo de visión del tamaño de un reloj inteligente de Liquid AI, una empresa derivada del MIT, y la oferta de Google para teléfonos inteligentes, Nvidia entra ahora en escena con su propio competidor reducido: Nemotron-Nano-9B-V2. Este nuevo modelo lidera su clase en pruebas de rendimiento clave e introduce una característica única que permite a los usuarios habilitar o deshabilitar el «razonamiento» de la IA, que es básicamente un proceso de autocomprobación antes de dar una respuesta definitiva.

Aunque los 9000 millones de parámetros superan la escala de los micromodelos de varios millones de parámetros sobre los que hemos informado recientemente, Nvidia destaca esto como una optimización significativa con respecto a sus 12 000 millones de parámetros originales. El tamaño revisado está diseñado específicamente para funcionar en una sola GPU Nvidia A10, ampliamente disponible.

Como explicó Oleksii Kuchiaev, director de postentrenamiento de modelos de IA de Nvidia, en respuesta a una pregunta en X: «Hemos recortado el modelo de 12 000 millones a 9000 millones para que se adapte perfectamente a la A10, una GPU de implementación muy popular. También es una arquitectura híbrida, lo que le permite manejar lotes de mayor tamaño y alcanzar velocidades hasta seis veces más rápidas que los modelos transformadores tradicionales de tamaño similar».

Para ponerlo en perspectiva, muchos de los principales modelos de lenguaje grandes operan en el rango de más de 70 000 millones de parámetros. Los parámetros son los ajustes internos que definen el comportamiento de un modelo, donde un número mayor suele indicar una mayor capacidad, pero también exige una potencia computacional significativamente mayor.

El modelo admite varios idiomas, entre ellos inglés, alemán, español, francés, italiano y japonés. Las capacidades ampliadas también cubren coreano, portugués, ruso y chino. Es muy adecuado para tareas que van desde seguir instrucciones hasta generar código.

Nemotron-Nano-9B-V2 y sus conjuntos de datos de preentrenamiento están disponibles actualmente en Hugging Face y a través del catálogo de modelos de Nvidia.

Una fusión de las arquitecturas Transformer y Mamba

El modelo se basa en Nemotron-H, una familia de modelos híbridos Mamba-Transformer que sirven de base para las últimas ofertas de IA de Nvidia.

Mientras que los LLM dominantes suelen basarse únicamente en la arquitectura Transformer y sus mecanismos de atención, estos pueden resultar prohibitivamente caros en términos de memoria y computación a medida que aumenta la longitud de las secuencias de entrada.

Los modelos Nemotron-H y otros que utilizan la arquitectura Mamba, desarrollada por investigadores de la Universidad Carnegie Mellon y Princeton, incorporan modelos de espacio de estado selectivo (SSM). Estos SSM gestionan de forma eficiente secuencias extremadamente largas manteniendo un estado interno.

Estas capas se escalan linealmente con la longitud de la secuencia, lo que les permite procesar contextos mucho más largos que la autoatención estándar sin la misma sobrecarga computacional.

Un diseño híbrido Mamba-Transformer reduce los costes al sustituir la mayoría de las capas de atención por capas de espacio de estado de tiempo lineal. Esto puede producir un rendimiento hasta 2-3 veces mayor en tareas de contexto largo, manteniendo una precisión comparable.

Nvidia no es la única que sigue este enfoque; otros laboratorios de investigación en IA, como AI2, también han lanzado modelos basados en la arquitectura Mamba.

Activar o desactivar el razonamiento con comandos sencillos

Nemotron-Nano-9B-v2 está diseñado como un modelo unificado, solo de texto, capaz tanto de interacción conversacional como de razonamiento complejo, entrenado completamente desde cero.

Por defecto, el sistema genera un rastro de razonamiento detallado antes de producir su respuesta final. Los usuarios pueden controlar este comportamiento utilizando tokens de comando simples como /think o /no_think.

El modelo también introduce la gestión del «presupuesto de pensamiento» en tiempo de ejecución. Esto permite a los desarrolladores establecer un límite máximo en el número de tokens que el modelo puede utilizar para el razonamiento interno antes de que deba dar una respuesta.

Este mecanismo tiene por objeto equilibrar la precisión con la latencia de la respuesta, lo cual es crucial para aplicaciones como los chatbots de atención al cliente o los agentes autónomos.

Las pruebas de rendimiento muestran un gran rendimiento

Los resultados de la evaluación demuestran una precisión competitiva frente a otros modelos abiertos de pequeña escala líderes. Cuando se probó con el razonamiento habilitado utilizando el conjunto NeMo-Skills, Nemotron-Nano-9B-v2 obtuvo puntuaciones del 72,1 % en AIME25, del 97,8 % en MATH500, del 64,0 % en GPQA y del 71,1 % en LiveCodeBench.

Las puntuaciones en las pruebas de seguimiento de instrucciones y contexto largo también son sólidas: 90,3 % en IFEval y 78,9 % en la prueba RULER 128K, con ganancias adicionales medibles en BFCL v3 y la prueba HLE.

En múltiples evaluaciones, Nano-9B-v2 muestra sistemáticamente una mayor precisión que un punto de comparación común, el modelo Qwen3-8B.

Nvidia presenta estos resultados con curvas de precisión frente a presupuesto que ilustran cómo mejora el rendimiento a medida que aumenta la asignación de tokens para el razonamiento. La empresa señala que un control cuidadoso del presupuesto permite a los desarrolladores optimizar tanto la calidad como la velocidad en los entornos de producción.

Entrenado con conjuntos de datos sintéticos

Tanto el modelo Nano como la familia Nemotron-H más amplia se entrenan con una mezcla de datos web cuidadosamente seleccionados, fuentes propias y datos de entrenamiento sintéticos.

Los corpus de entrenamiento incluyen texto general, código, matemáticas, literatura científica, documentos legales y financieros, así como conjuntos de datos de preguntas y respuestas centrados en la alineación.

Nvidia confirma el uso de trazas de razonamiento sintéticas generadas por otros modelos de gran tamaño para mejorar el rendimiento en tareas de referencia complejas.

Licencia y uso comercial

El modelo Nano-9B-v2 se publica bajo el Acuerdo de licencia de modelo abierto de Nvidia, que se actualizó por última vez en junio de 2025.

Esta licencia está diseñada para ser permisiva y favorable a las empresas. Nvidia afirma explícitamente que los modelos son comercialmente utilizables desde el primer momento y que los desarrolladores son libres de crear y distribuir obras derivadas.

Es importante destacar que Nvidia no reclama la propiedad de ningún resultado generado por el modelo, dejando todos los derechos y responsabilidades en manos del desarrollador o la organización que lo utilice.

Para los desarrolladores empresariales, esto significa que el modelo puede implementarse en producción de inmediato sin necesidad de negociar una licencia comercial independiente ni pagar cuotas basadas en el volumen de uso, los ingresos o el número de usuarios. A diferencia de algunas licencias abiertas por niveles de otros proveedores, no hay cláusulas que activen un requisito de licencia de pago una vez que la empresa alcanza una determinada escala.

No obstante, el acuerdo incluye varias condiciones importantes que deben cumplir las empresas:

Barreras de seguridad: los usuarios no pueden eludir o desactivar los mecanismos de seguridad integrados (denominados «barreras de seguridad») sin implementar sustitutos adecuados y equivalentes para su implementación específica.
Redistribución: cualquier redistribución del modelo o sus derivados debe incluir el texto completo de la licencia de modelo abierto de Nvidia y la atribución adecuada («Licenciado por Nvidia Corporation bajo la licencia de modelo abierto de Nvidia»).
Cumplimiento: los usuarios deben cumplir todas las normativas y restricciones comerciales aplicables, como las leyes de control de exportaciones de EE. UU.
Términos de IA fiable: El uso debe ajustarse a las directrices de IA fiable de Nvidia, que abarcan los principios para una implementación responsable y las consideraciones éticas.
Cláusula de litigio: La licencia se rescinde automáticamente si un usuario inicia un litigio por derechos de autor o patentes contra otra parte, alegando una infracción relacionada con el modelo.

Estas condiciones se centran en garantizar el cumplimiento legal y el uso responsable, en lugar de restringir la escala comercial. Las empresas no necesitan solicitar permisos adicionales ni pagar regalías a Nvidia para crear productos, monetizar servicios o ampliar su base de usuarios. En cambio, deben asegurarse de que sus prácticas de implementación respeten la seguridad, proporcionen la atribución adecuada y cumplan con todas las obligaciones de cumplimiento.

Posicionamiento en el mercado

Con Nemotron-Nano-9B-v2, Nvidia se dirige a los desarrolladores que necesitan equilibrar la capacidad de razonamiento con la eficiencia de implementación a menor escala.

Las funciones de control del presupuesto de tiempo de ejecución y de alternancia del razonamiento están diseñadas para ofrecer a los creadores de sistemas una mayor flexibilidad a la hora de gestionar el equilibrio entre la precisión y la velocidad de respuesta.

Su disponibilidad en Hugging Face y en el catálogo de modelos de Nvidia indica una intención de amplia accesibilidad, lo que fomenta la experimentación y la integración.

El lanzamiento de Nemotron-Nano-9B-v2 por parte de Nvidia subraya el enfoque continuo de la empresa en la eficiencia y el razonamiento controlable en los modelos de lenguaje.

Al fusionar arquitecturas híbridas con técnicas avanzadas de compresión y entrenamiento, Nvidia pretende proporcionar a los desarrolladores herramientas que mantengan una alta precisión y, al mismo tiempo, reduzcan los costes operativos y la latencia.

Artículo relacionado

La variante OpenClaw de Nvidia podría resolver su mayor reto: la seguridad El director ejecutivo de Nvidia, Jensen Huang, cree que todas las empresas necesitan una estrategia OpenClaw, y Nvidia está preparada para ofrecerla.Durante su discurso inaugural en la GTC el lunes, H

El Pentágono firma acuerdos con Nvidia, Microsoft y AWS para implementar inteligencia artificial en redes clasificadas. Después de haber alcanzado acuerdos previamente con Google, SpaceX y OpenAI, el Departamento de Defensa de los Estados Unidos anunció el viernes que ha firmado contratos con Nvidia, Microsoft, Amazon Web Services y Reflection AI para utilizar sus tec

La GTC de Nvidia presenta NemoClaw, el robot Olaf y una apuesta de un billón de dólares Cargando el reproductor…El director ejecutivo Jensen Huang subió al escenario en la conferencia GTC de Nvidia celebrada esta semana con su característica chaqueta de cuero para pronunciar un discurso

Recomendaciones de temas especiales relacionados

Creación de cómics

Los mejores generadores de IA para manga shonen: crea secuencias de acción trepidantes y efectos de energía

Descubre los mejores generadores de IA para manga shonen de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas para crear secuencias de acción trepidantes y efectos energéticos dinámicos. Compara las opciones gratuitas con las de pago mediante pruebas reales. ¡Libera tu potencial creativo y empieza a crear manga épico hoy mismo!

15 herramientas

xix.ai

Negocio

Los mejores gestores de gastos con IA: escanea recibos y clasifica automáticamente los gastos de la empresa

Los mejores gestores de gastos con IA de 2026: las herramientas mejor valoradas para escanear recibos y clasificar automáticamente los gastos de la empresa. Descubre soluciones potentes y revolucionarias para una gestión de gastos sin esfuerzo, un seguimiento financiero preciso y un cumplimiento normativo optimizado. Nuestra comparativa, seleccionada y actualizada semanalmente, entre opciones gratuitas y de pago te ayuda a encontrar la que mejor se adapta a tus necesidades. Aprovecha al máximo las ventajas de la IA con las recomendaciones de los expertos de XIX.AI.

10 herramientas

xix.ai

Negocio

Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas

xix.ai

Productividad

Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas

xix.ai

chatbot

Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes

Descubre los mejores chatbots románticos con IA de 2026 para establecer relaciones auténticas y duraderas. Nuestra lista seleccionada incluye personalidades sólidas y coherentes, comparativas entre versiones gratuitas y de pago, y pruebas en situaciones reales. Encuentra a tu compañero ideal y empieza a construir tu relación hoy mismo en XIX.AI.

10 herramientas

xix.ai

Educación y aprendizaje

Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.

Descubra a los mejores mentores en ciencia de datos y AI de 2026 para dominar SQL, Pandas y flujos de trabajo de aprendizaje automático. Explore nuestra selección cuidadosamente seleccionada y altamente valorada en XIX.AI para obtener orientación poderosa que cambie completamente la situación. Compare las opciones gratuitas con las pagadas y obtenga información basada en casos reales. Desbloquee su dominio de la ciencia de datos hoy mismo.

10 herramientas

xix.ai

comentario (1)

0/500

Inicie sesión primero

DanielThomas

14 de enero de 2026 05:30:34 GMT+01:00

이 작은 언어 모델 경쟁이 정말 흥미롭네요! Nvidia가 추론 기능을 끄고 켤 수 있는 옵션을 넣은 건 실용적이면서도 재미있는 접근법인 것 같아요. 개인적으로는 이런 경량화 모델들이 스마트워치나 스마트폰 같은 엣지 디바이스에서 어떻게 활용될지 궁금해요. 🤔 AI가 점점 더 일상 속으로 스며들고 있는 느낌이에요.

Noticias principales

AI Builder y Power Automate Revolucionan la Sumarización de Documentos Los anfitriones de AI del podcast Notebooklm ahora están disponibles para entrevistas China presenta su robot humanoide nacional y sus estándares de inteligencia incorporada Los datos de Ramp revelan un estancamiento en la adopción de la IA por parte de las empresas Guía de creación de arte con el creador de imágenes de Bing Aprende a crear música de IA usando tu voz: un tutorial de Suno paso a paso iMyFone MagicMic: Revisión y Tutorial de Cambio de Voz AI en Tiempo Real Generadores de Video AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como un revolucionario sistema de IA multimodal Embodied Intelligence presenta la primera norma del sector para frenar el crecimiento descontrolado

Más

Presentado