Hogar
Las habilidades de programación de DeepSeek V4 desatan el revuelo en Internet y debates sobre tendencias de estilo.
El 11 de febrero, DeepSeek comenzó a implementar una actualización gradual en sus plataformas web y de aplicaciones móviles. El 14 de febrero, la empresa anunció oficialmente que se trataba de una prueba de su nueva arquitectura de modelo de texto largo. Las interfaces web y de aplicaciones actualizadas ahora manejan contextos ultralargos de hasta 1 millón de tokens, y la base de conocimientos se ha actualizado para incluir información hasta mayo de 2025. Sin embargo, el servicio API sigue estando en la versión V3.2, que solo admite 128 000 contextos. Los expertos del sector consideran esta actualización como un calentamiento técnico y una prueba de resistencia antes del lanzamiento de su modelo V4 de próxima generación. En consecuencia, la expectación online está creciendo en plataformas como Weibo ante el próximo lanzamiento de la V4.

Tras la actualización, el estilo de interacción de DeepSeek cambió notablemente, lo que provocó comentarios de los usuarios que afirmaban que «se había vuelto menos agradable». Este tema se situó rápidamente en lo más alto de la lista de tendencias de Weibo, acumulando más de 68,535 millones de visitas. Entre los cambios específicos se incluye que el modelo ya no utiliza apodos personalizados para los usuarios, sino que se dirige a todos de forma uniforme como «usuario». En el modo de pensamiento profundo, las respuestas se han vuelto más breves y directas, adoptando un tono sencillo y conciso. Algunas respuestas incluso se percibieron como «ambiguas en su tono» o «sarcásticas», lo que provocó que los usuarios acostumbrados a su anterior estilo empático sintieran una sensación de rechazo. Las reacciones de los internautas estuvieron divididas: los fans más emocionales echaban de menos las cálidas interacciones anteriores, mientras que los usuarios más preocupados por la eficiencia elogiaron la comunicación racional y optimizada, considerándola el sello distintivo de una verdadera herramienta de productividad. Cabe destacar que el modelo actualizado superó con éxito la «prueba de Turing del túnel de lavado», un reto que a menudo hace tropezar a los principales modelos de IA.
En cuanto al cambio de estilo, la declaración oficial de DeepSeek aclaró que no se trataba de un cambio intencionado, sino de una consecuencia de dar prioridad a la eficiencia y refinar los límites de respuesta. Las expresiones excesivas y el contenido de relleno podían diluir la densidad de la información en consultas complejas, y la actualización también satisfacía a los usuarios que prefieren respuestas claras sin lo que consideran «IA que finge preocuparse». Este desarrollo ha avivado aún más el entusiasmo en línea por DeepSeek V4. Los informes sugieren que el modelo está previsto que se lance alrededor del Festival de Primavera, a mediados de febrero de 2026, posiblemente el 17 de febrero o cerca de esa fecha, según fuentes de Weibo.
Como modelo insignia con billones de parámetros, V4 pone un gran énfasis en las mejoras de programación. Las primeras pruebas internas indican que V4 ya ha superado a modelos líderes como Claude y GPT en tareas de programación, lo que lo posiciona para remodelar potencialmente el panorama de la programación de IA. Además, el V4 introduce varios avances tecnológicos clave, lo que le permite procesar e interpretar comandos de código extremadamente largos y comprender contextos de código base grandes en una sola pasada, lo que supone una ventaja significativa para el desarrollo a nivel empresarial. Los algoritmos de entrenamiento mejorados aumentan su capacidad para reconocer patrones de datos y reducir la degradación del rendimiento. El razonamiento del modelo es más riguroso y fiable, lo que permite alcanzar un rendimiento estable sin regresión, al tiempo que se logra un mejor equilibrio entre las distintas capacidades.
Al mismo tiempo, el modelo mantendrá su ventaja de contexto de un millón de tokens, con unos costes de inferencia significativamente inferiores a los de sus competidores occidentales. También está previsto que sea de código abierto bajo la licencia Apache 2.0.
Artículo relacionado
Snowflake invierte más de 600 millones de dólares en chips personalizados de AWS para impulsar la IA empresarial
Snowflake, el gigante de los datos en la nube, ha anunciado sus planes de invertir más de 600 millones de dólares en los próximos seis años para adquirir procesadores de la serie Graviton y acelerador
China Telecom invierte en Mianbi Intelligence y aumenta su capital a 713 000 yuanes para modelos de lenguaje a gran escala (LLM) e infraestructura de datos
El «equipo nacional» y la figura destacada de la Universidad de Tsinghua en el ámbito de los modelos a gran escala están profundizando en su alineación estratégica. El 1 de marzo de 2026, según los úl
El Grupo Taotian acelera su reestructuración centrada en la IA y concede a los becarios cuotas de tokens gratuitas
El Grupo TaoTian ha presentado recientemente el «Plan de Productividad con IA», diseñado para acelerar la integración de la tecnología de IA en las operaciones de comercio electrónico y los flujos de
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
El 11 de febrero, DeepSeek comenzó a implementar una actualización gradual en sus plataformas web y de aplicaciones móviles. El 14 de febrero, la empresa anunció oficialmente que se trataba de una prueba de su nueva arquitectura de modelo de texto largo. Las interfaces web y de aplicaciones actualizadas ahora manejan contextos ultralargos de hasta 1 millón de tokens, y la base de conocimientos se ha actualizado para incluir información hasta mayo de 2025. Sin embargo, el servicio API sigue estando en la versión V3.2, que solo admite 128 000 contextos. Los expertos del sector consideran esta actualización como un calentamiento técnico y una prueba de resistencia antes del lanzamiento de su modelo V4 de próxima generación. En consecuencia, la expectación online está creciendo en plataformas como Weibo ante el próximo lanzamiento de la V4.

Tras la actualización, el estilo de interacción de DeepSeek cambió notablemente, lo que provocó comentarios de los usuarios que afirmaban que «se había vuelto menos agradable». Este tema se situó rápidamente en lo más alto de la lista de tendencias de Weibo, acumulando más de 68,535 millones de visitas. Entre los cambios específicos se incluye que el modelo ya no utiliza apodos personalizados para los usuarios, sino que se dirige a todos de forma uniforme como «usuario». En el modo de pensamiento profundo, las respuestas se han vuelto más breves y directas, adoptando un tono sencillo y conciso. Algunas respuestas incluso se percibieron como «ambiguas en su tono» o «sarcásticas», lo que provocó que los usuarios acostumbrados a su anterior estilo empático sintieran una sensación de rechazo. Las reacciones de los internautas estuvieron divididas: los fans más emocionales echaban de menos las cálidas interacciones anteriores, mientras que los usuarios más preocupados por la eficiencia elogiaron la comunicación racional y optimizada, considerándola el sello distintivo de una verdadera herramienta de productividad. Cabe destacar que el modelo actualizado superó con éxito la «prueba de Turing del túnel de lavado», un reto que a menudo hace tropezar a los principales modelos de IA.
En cuanto al cambio de estilo, la declaración oficial de DeepSeek aclaró que no se trataba de un cambio intencionado, sino de una consecuencia de dar prioridad a la eficiencia y refinar los límites de respuesta. Las expresiones excesivas y el contenido de relleno podían diluir la densidad de la información en consultas complejas, y la actualización también satisfacía a los usuarios que prefieren respuestas claras sin lo que consideran «IA que finge preocuparse». Este desarrollo ha avivado aún más el entusiasmo en línea por DeepSeek V4. Los informes sugieren que el modelo está previsto que se lance alrededor del Festival de Primavera, a mediados de febrero de 2026, posiblemente el 17 de febrero o cerca de esa fecha, según fuentes de Weibo.
Como modelo insignia con billones de parámetros, V4 pone un gran énfasis en las mejoras de programación. Las primeras pruebas internas indican que V4 ya ha superado a modelos líderes como Claude y GPT en tareas de programación, lo que lo posiciona para remodelar potencialmente el panorama de la programación de IA. Además, el V4 introduce varios avances tecnológicos clave, lo que le permite procesar e interpretar comandos de código extremadamente largos y comprender contextos de código base grandes en una sola pasada, lo que supone una ventaja significativa para el desarrollo a nivel empresarial. Los algoritmos de entrenamiento mejorados aumentan su capacidad para reconocer patrones de datos y reducir la degradación del rendimiento. El razonamiento del modelo es más riguroso y fiable, lo que permite alcanzar un rendimiento estable sin regresión, al tiempo que se logra un mejor equilibrio entre las distintas capacidades.
Al mismo tiempo, el modelo mantendrá su ventaja de contexto de un millón de tokens, con unos costes de inferencia significativamente inferiores a los de sus competidores occidentales. También está previsto que sea de código abierto bajo la licencia Apache 2.0.
Snowflake invierte más de 600 millones de dólares en chips personalizados de AWS para impulsar la IA empresarial
Snowflake, el gigante de los datos en la nube, ha anunciado sus planes de invertir más de 600 millones de dólares en los próximos seis años para adquirir procesadores de la serie Graviton y acelerador
China Telecom invierte en Mianbi Intelligence y aumenta su capital a 713 000 yuanes para modelos de lenguaje a gran escala (LLM) e infraestructura de datos
El «equipo nacional» y la figura destacada de la Universidad de Tsinghua en el ámbito de los modelos a gran escala están profundizando en su alineación estratégica. El 1 de marzo de 2026, según los úl
El Grupo Taotian acelera su reestructuración centrada en la IA y concede a los becarios cuotas de tokens gratuitas
El Grupo TaoTian ha presentado recientemente el «Plan de Productividad con IA», diseñado para acelerar la integración de la tecnología de IA en las operaciones de comercio electrónico y los flujos de











