Las habilidades de codificación R1 y V3 de Deepseek probadas: aún no estamos condenados
Presentando DeepSeek: Un nuevo actor en el escenario de la IA
DeepSeek irrumpió en escena durante el fin de semana, captando la atención mundial por tres razones convincentes:
- Es un chatbot de IA procedente de China, una notable diferencia con las ofertas habituales basadas en EE. UU.
- Es de código abierto, lo cual es un gran acontecimiento en la comunidad tecnológica.
- Funciona con significativamente menos infraestructura que sus contrapartes de peso pesado, lo que lo convierte en una opción intrigante para muchos.
Mientras el escrutinio del gobierno de EE. UU. sobre TikTok y la posible participación del gobierno chino en su código ha generado preocupación, la aparición de DeepSeek desde China naturalmente atrae atención similar. Sin embargo, aquí evitamos la política. En cambio, exploremos cómo DeepSeek V3 y DeepSeek R1 se comparan con otros modelos de IA en tareas de programación.
Según la propia guía de DeepSeek:
- Elige V3 para tareas que requieran profundidad y precisión, como resolver problemas matemáticos complejos o generar código intrincado.
- Opta por R1 cuando necesites aplicaciones rápidas y de gran volumen, como automatización de soporte al cliente o procesamiento básico de texto.
Puedes alternar entre R1 y V3 usando un pequeño botón en la interfaz de chat. Si es azul, estás usando R1.

Captura de pantalla por David Gewirtz/ZDNET Entonces, ¿cómo les fue? Ambos modelos mostraron promesa pero no fueron impecables. Exploremos los resultados.
Prueba 1: Creando un complemento de WordPress
Mi primera prueba, inspirada en la necesidad de mi esposa de un complemento de WordPress para gestionar un dispositivo de participación para su grupo en línea, es un clásico. El complemento debía aceptar una lista de nombres, ordenarlos y asegurar que los duplicados no estuvieran juntos. He lanzado este desafío a numerosos AIs, y es uno difícil.

Captura de pantalla por David Gewirtz/ZDNET DeepSeek V3 lo logró, creando una interfaz de usuario y lógica de programa que cumplió perfectamente con el requerimiento. R1 tomó un enfoque diferente, ofreciendo un análisis de 4502 palabras antes de compartir el código. La interfaz fue más amplia, pero tanto la interfaz como la lógica funcionaron, por lo que R1 también pasó.

Captura de pantalla por David Gewirtz/ZDNET 
Captura de pantalla por David Gewirtz/ZDNET Hasta ahora, tanto V3 como R1 han pasado una de cuatro pruebas.
Prueba 2: Reescribiendo una función de cadena
Un usuario tuvo problemas para ingresar dólares y centavos en un campo de donación, lo que mi código original no permitía. La tarea era modificar la rutina para aceptar ambos. DeepSeek generó código funcional, pero hay margen para mejorar.
El código de V3 fue excesivamente largo y repetitivo, mientras que el razonamiento de R1 antes de generar el código también fue extenso. Ambos modelos validaron hasta dos decimales, pero no manejaron bien números muy grandes. El uso de R1 de la conversión de Number en JavaScript sin verificar casos extremos podría causar fallos.
Curiosamente, R1 proporcionó una buena lista de casos de prueba:

Captura de pantalla por David Gewirtz/ZDNET Doy el punto a V3 porque su código no fallaría y produciría los resultados esperados. R1 falla por posibles fallos con entradas no válidas. Eso son dos victorias de cuatro para V3 y una para R1.
Prueba 3: Rastreando un error molesto
Esta prueba surgió de un error que me costó encontrar. El desafío era que la respuesta obvia basada en el mensaje de error era incorrecta, lo que a menudo engaña a las IAs. Resolverlo requiere entender las llamadas a la API de WordPress, ver más allá del mensaje de error y localizar el error.
Ambos, V3 y R1, pasaron esta prueba con respuestas casi idénticas, llevando a V3 a tres de cuatro victorias y a R1 a dos de cuatro. DeepSeek ya está superando a Gemini, Copilot, Claude y Meta.
Prueba 4: Creando un script
Esta prueba es difícil porque involucra tres entornos: AppleScript, el modelo de objetos de Chrome y Keyboard Maestro. ChatGPT la superó, pero DeepSeek V3 y R1 se quedaron cortos. Ningún modelo entendió la necesidad de dividir tareas entre Keyboard Maestro y Chrome, y su conocimiento de AppleScript fue débil.
R1 hizo suposiciones incorrectas, como asumir que siempre existe una ventana frontal y que el programa en ejecución siempre sería Chrome. Esto dejó a V3 con tres pruebas correctas y una fallida, y a R1 con dos pruebas correctas y dos fallidas.
Pensamientos finales
La insistencia de DeepSeek en usar un correo de nube pública como Gmail en lugar de mi dominio corporativo fue frustrante. También hubo algunos problemas de respuesta que hicieron que las pruebas tomaran más tiempo de lo esperado.
Inicialmente tuve problemas para registrarme debido a este error:
Los servicios en línea de DeepSeek han enfrentado recientemente ataques maliciosos a gran escala. Para garantizar el servicio continuo, el registro está temporalmente limitado a números de teléfono +86. Los usuarios existentes pueden iniciar sesión como de costumbre. Gracias por su comprensión y apoyo.
Una vez dentro, pude realizar las pruebas. DeepSeek tiende a ser verboso con su código. El AppleScript en la Prueba 4 fue incorrecto y excesivamente largo. La expresión regular en la Prueba 2 podría haber sido más mantenible, aunque V3 lo hizo bien.
Estoy impresionado de que V3 superara a Gemini, Copilot y Meta, pero aún está al nivel de GPT-3.5, lo que sugiere que hay espacio para crecer. El rendimiento de R1 fue decepcionante. Si tuviera que elegir, me quedaría con ChatGPT para ayuda con la programación.
Dicho esto, para una nueva herramienta que funciona con mucha menos infraestructura, DeepSeek es definitivamente una para seguir de cerca.
¿Qué opinas? ¿Has probado DeepSeek? ¿Usas alguna IA para soporte de programación? Déjanos saber en los comentarios a continuación.
Sigue mis actualizaciones diarias de proyectos en redes sociales, suscríbete a mi boletín semanal y conéctate conmigo en Twitter/X en @DavidGewirtz, Facebook en Facebook.com/DavidGewirtz, Instagram en Instagram.com/DavidGewirtz, Bluesky en @DavidGewirtz.com y YouTube en YouTube.com/DavidGewirtzTV.
Artículo relacionado
Topaz DeNoise AI: Mejor herramienta de reducción de ruido en 2025 - Guía completa
En el competitivo mundo de la fotografía digital, la claridad de imagen sigue siendo primordial. Fotógrafos de todos los niveles se enfrentan al ruido digital que compromete tomas que de otro modo ser
Maestro Esmeralda Kaizo Nuzlocke: Guía definitiva de supervivencia y estrategia
Kaizo Esmeralda se erige como uno de los hacks de ROMs de Pokémon más formidables jamás concebidos. Aunque intentar una ejecución Nuzlocke aumenta exponencialmente el desafío, la victoria sigue siendo
Cartas de presentación con IA: Guía de expertos para la presentación de trabajos a revistas
En el competitivo entorno actual de las publicaciones académicas, la elaboración de una carta de presentación eficaz puede marcar la diferencia decisiva en la aceptación de su manuscrito. Descubra cóm
comentario (13)
0/200
CarlCarter
5 de septiembre de 2025 22:30:30 GMT+02:00
DeepSeek这波操作有点东西啊!中国本土AI终于不再只擅长写诗和做饭了,居然在代码能力上也能和国外大模型掰手腕👏 不过开源这事...希望别过两天就变成'部分开源'吧😂
0
BruceGonzalez
25 de agosto de 2025 09:01:02 GMT+02:00
DeepSeek's open-source approach is a game-changer! I'm stoked to see a Chinese AI shaking things up. The coding skills are solid, but I wonder how it’ll stack against giants like GPT in the long run. Exciting times! 🚀
0
JoseGonzalez
7 de agosto de 2025 08:33:00 GMT+02:00
DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄
0
ArthurSanchez
23 de abril de 2025 10:48:34 GMT+02:00
DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏
0
NicholasAdams
23 de abril de 2025 08:36:41 GMT+02:00
DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね!DeepSeek、改善を続けてください!👏
0
StephenGonzalez
21 de abril de 2025 06:47:37 GMT+02:00
DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀
0
Presentando DeepSeek: Un nuevo actor en el escenario de la IA
DeepSeek irrumpió en escena durante el fin de semana, captando la atención mundial por tres razones convincentes:
- Es un chatbot de IA procedente de China, una notable diferencia con las ofertas habituales basadas en EE. UU.
- Es de código abierto, lo cual es un gran acontecimiento en la comunidad tecnológica.
- Funciona con significativamente menos infraestructura que sus contrapartes de peso pesado, lo que lo convierte en una opción intrigante para muchos.
Mientras el escrutinio del gobierno de EE. UU. sobre TikTok y la posible participación del gobierno chino en su código ha generado preocupación, la aparición de DeepSeek desde China naturalmente atrae atención similar. Sin embargo, aquí evitamos la política. En cambio, exploremos cómo DeepSeek V3 y DeepSeek R1 se comparan con otros modelos de IA en tareas de programación.
Según la propia guía de DeepSeek:
- Elige V3 para tareas que requieran profundidad y precisión, como resolver problemas matemáticos complejos o generar código intrincado.
- Opta por R1 cuando necesites aplicaciones rápidas y de gran volumen, como automatización de soporte al cliente o procesamiento básico de texto.
Puedes alternar entre R1 y V3 usando un pequeño botón en la interfaz de chat. Si es azul, estás usando R1.
Entonces, ¿cómo les fue? Ambos modelos mostraron promesa pero no fueron impecables. Exploremos los resultados.
Prueba 1: Creando un complemento de WordPress
Mi primera prueba, inspirada en la necesidad de mi esposa de un complemento de WordPress para gestionar un dispositivo de participación para su grupo en línea, es un clásico. El complemento debía aceptar una lista de nombres, ordenarlos y asegurar que los duplicados no estuvieran juntos. He lanzado este desafío a numerosos AIs, y es uno difícil.
DeepSeek V3 lo logró, creando una interfaz de usuario y lógica de programa que cumplió perfectamente con el requerimiento. R1 tomó un enfoque diferente, ofreciendo un análisis de 4502 palabras antes de compartir el código. La interfaz fue más amplia, pero tanto la interfaz como la lógica funcionaron, por lo que R1 también pasó.
Hasta ahora, tanto V3 como R1 han pasado una de cuatro pruebas.
Prueba 2: Reescribiendo una función de cadena
Un usuario tuvo problemas para ingresar dólares y centavos en un campo de donación, lo que mi código original no permitía. La tarea era modificar la rutina para aceptar ambos. DeepSeek generó código funcional, pero hay margen para mejorar.
El código de V3 fue excesivamente largo y repetitivo, mientras que el razonamiento de R1 antes de generar el código también fue extenso. Ambos modelos validaron hasta dos decimales, pero no manejaron bien números muy grandes. El uso de R1 de la conversión de Number en JavaScript sin verificar casos extremos podría causar fallos.
Curiosamente, R1 proporcionó una buena lista de casos de prueba:
Doy el punto a V3 porque su código no fallaría y produciría los resultados esperados. R1 falla por posibles fallos con entradas no válidas. Eso son dos victorias de cuatro para V3 y una para R1.
Prueba 3: Rastreando un error molesto
Esta prueba surgió de un error que me costó encontrar. El desafío era que la respuesta obvia basada en el mensaje de error era incorrecta, lo que a menudo engaña a las IAs. Resolverlo requiere entender las llamadas a la API de WordPress, ver más allá del mensaje de error y localizar el error.
Ambos, V3 y R1, pasaron esta prueba con respuestas casi idénticas, llevando a V3 a tres de cuatro victorias y a R1 a dos de cuatro. DeepSeek ya está superando a Gemini, Copilot, Claude y Meta.
Prueba 4: Creando un script
Esta prueba es difícil porque involucra tres entornos: AppleScript, el modelo de objetos de Chrome y Keyboard Maestro. ChatGPT la superó, pero DeepSeek V3 y R1 se quedaron cortos. Ningún modelo entendió la necesidad de dividir tareas entre Keyboard Maestro y Chrome, y su conocimiento de AppleScript fue débil.
R1 hizo suposiciones incorrectas, como asumir que siempre existe una ventana frontal y que el programa en ejecución siempre sería Chrome. Esto dejó a V3 con tres pruebas correctas y una fallida, y a R1 con dos pruebas correctas y dos fallidas.
Pensamientos finales
La insistencia de DeepSeek en usar un correo de nube pública como Gmail en lugar de mi dominio corporativo fue frustrante. También hubo algunos problemas de respuesta que hicieron que las pruebas tomaran más tiempo de lo esperado.
Inicialmente tuve problemas para registrarme debido a este error:
Los servicios en línea de DeepSeek han enfrentado recientemente ataques maliciosos a gran escala. Para garantizar el servicio continuo, el registro está temporalmente limitado a números de teléfono +86. Los usuarios existentes pueden iniciar sesión como de costumbre. Gracias por su comprensión y apoyo.
Una vez dentro, pude realizar las pruebas. DeepSeek tiende a ser verboso con su código. El AppleScript en la Prueba 4 fue incorrecto y excesivamente largo. La expresión regular en la Prueba 2 podría haber sido más mantenible, aunque V3 lo hizo bien.
Estoy impresionado de que V3 superara a Gemini, Copilot y Meta, pero aún está al nivel de GPT-3.5, lo que sugiere que hay espacio para crecer. El rendimiento de R1 fue decepcionante. Si tuviera que elegir, me quedaría con ChatGPT para ayuda con la programación.
Dicho esto, para una nueva herramienta que funciona con mucha menos infraestructura, DeepSeek es definitivamente una para seguir de cerca.
¿Qué opinas? ¿Has probado DeepSeek? ¿Usas alguna IA para soporte de programación? Déjanos saber en los comentarios a continuación.
Sigue mis actualizaciones diarias de proyectos en redes sociales, suscríbete a mi boletín semanal y conéctate conmigo en Twitter/X en @DavidGewirtz, Facebook en Facebook.com/DavidGewirtz, Instagram en Instagram.com/DavidGewirtz, Bluesky en @DavidGewirtz.com y YouTube en YouTube.com/DavidGewirtzTV.




DeepSeek这波操作有点东西啊!中国本土AI终于不再只擅长写诗和做饭了,居然在代码能力上也能和国外大模型掰手腕👏 不过开源这事...希望别过两天就变成'部分开源'吧😂




DeepSeek's open-source approach is a game-changer! I'm stoked to see a Chinese AI shaking things up. The coding skills are solid, but I wonder how it’ll stack against giants like GPT in the long run. Exciting times! 🚀




DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄




DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏




DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね!DeepSeek、改善を続けてください!👏




DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀












