DeepSeek presenta un modelo de IA que rivaliza con los sistemas de vanguardia

El laboratorio chino de IA DeepSeek ha lanzado dos versiones preliminares de su último modelo de lenguaje a gran escala, DeepSeek V4, una actualización muy esperada del modelo V3.2 del año pasado y del modelo de razonamiento R1 que lo acompañaba, los cuales causaron un gran impacto en la comunidad de la IA.
La empresa afirma que tanto DeepSeek V4 Flash como V4 Pro son modelos de «mezcla de expertos», cada uno con una ventana de contexto de 1 millón de tokens, suficiente para procesar extensas bases de código o documentos dentro de las indicaciones. Este método de «mezcla de expertos» activa solo un subconjunto específico de parámetros por tarea para reducir los costes de inferencia.
El modelo Pro cuenta con un total de 1,6 billones de parámetros (con 49 000 millones activos), lo que lo posiciona como el modelo de peso abierto más grande disponible. Supera a competidores como el Kimi K 2.6 de Moonshot AI (1,1 billones), el M1 de MiniMax (456 000 millones) y duplica con creces el tamaño de DeepSeek V3.2 (671 000 millones). El modelo V4 Flash, más pequeño, contiene 284 000 millones de parámetros (13 000 millones activos).
DeepSeek afirma que las mejoras arquitectónicas hacen que ambos nuevos modelos sean más eficientes y tengan un mayor rendimiento que DeepSeek V3.2, «cerrando casi la brecha» con los modelos líderes actuales, tanto de código abierto como cerrado, en pruebas de razonamiento.
El laboratorio informa de que su nuevo modelo V4-Pro-Max supera a sus homólogos de código abierto en las pruebas de razonamiento y supera el rendimiento de GPT-5.2 y Gemini 3.0 Pro de OpenAI en determinadas tareas. En las pruebas de competición de programación, DeepSeek afirma que el rendimiento de ambos modelos V4 es «comparable al de GPT-5.4».
Sin embargo, los modelos parecen quedarse ligeramente por detrás de los modelos de vanguardia en las evaluaciones basadas en el conocimiento, concretamente en comparación con el GPT-5.4 de OpenAI y el último Google Gemini 3.1 Pro. Esta brecha indica una «trayectoria de desarrollo que va por detrás de los modelos de vanguardia de última generación en aproximadamente entre 3 y 6 meses», según el laboratorio.
A diferencia de muchos modelos de código cerrado que admiten la generación de audio, vídeo e imágenes, tanto V4 Flash como V4 Pro son modelos de solo texto.
Una ventaja clave es que DeepSeek V4 es significativamente más rentable que los modelos de vanguardia actuales. El modelo más pequeño, V4 Flash, tiene un precio de 0,14 dólares por millón de tokens de entrada y 0,28 dólares por millón de tokens de salida, lo que lo sitúa por debajo de GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini y Claude Haiku 4.5. El modelo V4 Pro, de mayor tamaño, cuesta 0,145 dólares por millón de tokens de entrada y 3,48 dólares por millón de tokens de salida, ofreciendo también tarifas más bajas que Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 y GPT-5.4.
Este lanzamiento se produce un día después de que Estados Unidos acusara a China de llevar a cabo un robo de propiedad intelectual a escala industrial de los laboratorios de IA estadounidenses utilizando miles de cuentas proxy. La propia DeepSeek se ha enfrentado a acusaciones de Anthropic y OpenAI de «destilar», o básicamente copiar, sus modelos de IA.
Artículo relacionado
El modelo de IA DeepSeek V3.2 ofrece un rendimiento de primer nivel con un coste computacional mínimo.
Mientras que las principales empresas tecnológicas invierten miles de millones en potencia computacional para desarrollar modelos de IA de vanguardia, la empresa china DeepSeek ha logrado resultados s
Los jefes de seguridad instan a una rápida regulación de la IA, citando los riesgos de herramientas como DeepSeek
La preocupación está aumentando en los centros de operaciones de seguridad, especialmente entre los responsables de seguridad de la información (CISO), con especial atención al gigante chino de la int
La actualización R1 del modelo de IA de DeepSeek introduce una moderación de contenidos más estricta, según revelan las pruebas
El último modelo de razonamiento de la startup china de IA DeepSeek, una iteración mejorada de su sistema R1, ofrece un rendimiento excepcional en pruebas de codificación, matemáticas y conocimientos
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

El laboratorio chino de IA DeepSeek ha lanzado dos versiones preliminares de su último modelo de lenguaje a gran escala, DeepSeek V4, una actualización muy esperada del modelo V3.2 del año pasado y del modelo de razonamiento R1 que lo acompañaba, los cuales causaron un gran impacto en la comunidad de la IA.
La empresa afirma que tanto DeepSeek V4 Flash como V4 Pro son modelos de «mezcla de expertos», cada uno con una ventana de contexto de 1 millón de tokens, suficiente para procesar extensas bases de código o documentos dentro de las indicaciones. Este método de «mezcla de expertos» activa solo un subconjunto específico de parámetros por tarea para reducir los costes de inferencia.
El modelo Pro cuenta con un total de 1,6 billones de parámetros (con 49 000 millones activos), lo que lo posiciona como el modelo de peso abierto más grande disponible. Supera a competidores como el Kimi K 2.6 de Moonshot AI (1,1 billones), el M1 de MiniMax (456 000 millones) y duplica con creces el tamaño de DeepSeek V3.2 (671 000 millones). El modelo V4 Flash, más pequeño, contiene 284 000 millones de parámetros (13 000 millones activos).
DeepSeek afirma que las mejoras arquitectónicas hacen que ambos nuevos modelos sean más eficientes y tengan un mayor rendimiento que DeepSeek V3.2, «cerrando casi la brecha» con los modelos líderes actuales, tanto de código abierto como cerrado, en pruebas de razonamiento.
El laboratorio informa de que su nuevo modelo V4-Pro-Max supera a sus homólogos de código abierto en las pruebas de razonamiento y supera el rendimiento de GPT-5.2 y Gemini 3.0 Pro de OpenAI en determinadas tareas. En las pruebas de competición de programación, DeepSeek afirma que el rendimiento de ambos modelos V4 es «comparable al de GPT-5.4».
Sin embargo, los modelos parecen quedarse ligeramente por detrás de los modelos de vanguardia en las evaluaciones basadas en el conocimiento, concretamente en comparación con el GPT-5.4 de OpenAI y el último Google Gemini 3.1 Pro. Esta brecha indica una «trayectoria de desarrollo que va por detrás de los modelos de vanguardia de última generación en aproximadamente entre 3 y 6 meses», según el laboratorio.
A diferencia de muchos modelos de código cerrado que admiten la generación de audio, vídeo e imágenes, tanto V4 Flash como V4 Pro son modelos de solo texto.
Una ventaja clave es que DeepSeek V4 es significativamente más rentable que los modelos de vanguardia actuales. El modelo más pequeño, V4 Flash, tiene un precio de 0,14 dólares por millón de tokens de entrada y 0,28 dólares por millón de tokens de salida, lo que lo sitúa por debajo de GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini y Claude Haiku 4.5. El modelo V4 Pro, de mayor tamaño, cuesta 0,145 dólares por millón de tokens de entrada y 3,48 dólares por millón de tokens de salida, ofreciendo también tarifas más bajas que Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 y GPT-5.4.
Este lanzamiento se produce un día después de que Estados Unidos acusara a China de llevar a cabo un robo de propiedad intelectual a escala industrial de los laboratorios de IA estadounidenses utilizando miles de cuentas proxy. La propia DeepSeek se ha enfrentado a acusaciones de Anthropic y OpenAI de «destilar», o básicamente copiar, sus modelos de IA.
El modelo de IA DeepSeek V3.2 ofrece un rendimiento de primer nivel con un coste computacional mínimo.
Mientras que las principales empresas tecnológicas invierten miles de millones en potencia computacional para desarrollar modelos de IA de vanguardia, la empresa china DeepSeek ha logrado resultados s
Los jefes de seguridad instan a una rápida regulación de la IA, citando los riesgos de herramientas como DeepSeek
La preocupación está aumentando en los centros de operaciones de seguridad, especialmente entre los responsables de seguridad de la información (CISO), con especial atención al gigante chino de la int
La actualización R1 del modelo de IA de DeepSeek introduce una moderación de contenidos más estricta, según revelan las pruebas
El último modelo de razonamiento de la startup china de IA DeepSeek, una iteración mejorada de su sistema R1, ofrece un rendimiento excepcional en pruebas de codificación, matemáticas y conocimientos





Hogar






