Las habilidades de codificación R1 y V3 de Deepseek probadas: aún no estamos condenados

Hogar

Noticias

17 de abril de 2025

MarkSmith

117

Presentando DeepSeek: Un nuevo actor en el escenario de la IA

DeepSeek irrumpió en escena durante el fin de semana, captando la atención mundial por tres razones convincentes:

Es un chatbot de IA procedente de China, una notable diferencia con las ofertas habituales basadas en EE. UU.
Es de código abierto, lo cual es un gran acontecimiento en la comunidad tecnológica.
Funciona con significativamente menos infraestructura que sus contrapartes de peso pesado, lo que lo convierte en una opción intrigante para muchos.

Mientras el escrutinio del gobierno de EE. UU. sobre TikTok y la posible participación del gobierno chino en su código ha generado preocupación, la aparición de DeepSeek desde China naturalmente atrae atención similar. Sin embargo, aquí evitamos la política. En cambio, exploremos cómo DeepSeek V3 y DeepSeek R1 se comparan con otros modelos de IA en tareas de programación.

Según la propia guía de DeepSeek:

Elige V3 para tareas que requieran profundidad y precisión, como resolver problemas matemáticos complejos o generar código intrincado.
Opta por R1 cuando necesites aplicaciones rápidas y de gran volumen, como automatización de soporte al cliente o procesamiento básico de texto.

Puedes alternar entre R1 y V3 usando un pequeño botón en la interfaz de chat. Si es azul, estás usando R1.

Captura de pantalla por David Gewirtz/ZDNET

Entonces, ¿cómo les fue? Ambos modelos mostraron promesa pero no fueron impecables. Exploremos los resultados.

Prueba 1: Creando un complemento de WordPress

Mi primera prueba, inspirada en la necesidad de mi esposa de un complemento de WordPress para gestionar un dispositivo de participación para su grupo en línea, es un clásico. El complemento debía aceptar una lista de nombres, ordenarlos y asegurar que los duplicados no estuvieran juntos. He lanzado este desafío a numerosos AIs, y es uno difícil.

Captura de pantalla por David Gewirtz/ZDNET

DeepSeek V3 lo logró, creando una interfaz de usuario y lógica de programa que cumplió perfectamente con el requerimiento. R1 tomó un enfoque diferente, ofreciendo un análisis de 4502 palabras antes de compartir el código. La interfaz fue más amplia, pero tanto la interfaz como la lógica funcionaron, por lo que R1 también pasó.

Captura de pantalla por David Gewirtz/ZDNET

Hasta ahora, tanto V3 como R1 han pasado una de cuatro pruebas.

Prueba 2: Reescribiendo una función de cadena

Un usuario tuvo problemas para ingresar dólares y centavos en un campo de donación, lo que mi código original no permitía. La tarea era modificar la rutina para aceptar ambos. DeepSeek generó código funcional, pero hay margen para mejorar.

El código de V3 fue excesivamente largo y repetitivo, mientras que el razonamiento de R1 antes de generar el código también fue extenso. Ambos modelos validaron hasta dos decimales, pero no manejaron bien números muy grandes. El uso de R1 de la conversión de Number en JavaScript sin verificar casos extremos podría causar fallos.

Curiosamente, R1 proporcionó una buena lista de casos de prueba:

Captura de pantalla por David Gewirtz/ZDNET

Doy el punto a V3 porque su código no fallaría y produciría los resultados esperados. R1 falla por posibles fallos con entradas no válidas. Eso son dos victorias de cuatro para V3 y una para R1.

Prueba 3: Rastreando un error molesto

Esta prueba surgió de un error que me costó encontrar. El desafío era que la respuesta obvia basada en el mensaje de error era incorrecta, lo que a menudo engaña a las IAs. Resolverlo requiere entender las llamadas a la API de WordPress, ver más allá del mensaje de error y localizar el error.

Ambos, V3 y R1, pasaron esta prueba con respuestas casi idénticas, llevando a V3 a tres de cuatro victorias y a R1 a dos de cuatro. DeepSeek ya está superando a Gemini, Copilot, Claude y Meta.

Prueba 4: Creando un script

Esta prueba es difícil porque involucra tres entornos: AppleScript, el modelo de objetos de Chrome y Keyboard Maestro. ChatGPT la superó, pero DeepSeek V3 y R1 se quedaron cortos. Ningún modelo entendió la necesidad de dividir tareas entre Keyboard Maestro y Chrome, y su conocimiento de AppleScript fue débil.

R1 hizo suposiciones incorrectas, como asumir que siempre existe una ventana frontal y que el programa en ejecución siempre sería Chrome. Esto dejó a V3 con tres pruebas correctas y una fallida, y a R1 con dos pruebas correctas y dos fallidas.

Pensamientos finales

La insistencia de DeepSeek en usar un correo de nube pública como Gmail en lugar de mi dominio corporativo fue frustrante. También hubo algunos problemas de respuesta que hicieron que las pruebas tomaran más tiempo de lo esperado.

Inicialmente tuve problemas para registrarme debido a este error:

Los servicios en línea de DeepSeek han enfrentado recientemente ataques maliciosos a gran escala. Para garantizar el servicio continuo, el registro está temporalmente limitado a números de teléfono +86. Los usuarios existentes pueden iniciar sesión como de costumbre. Gracias por su comprensión y apoyo.

Una vez dentro, pude realizar las pruebas. DeepSeek tiende a ser verboso con su código. El AppleScript en la Prueba 4 fue incorrecto y excesivamente largo. La expresión regular en la Prueba 2 podría haber sido más mantenible, aunque V3 lo hizo bien.

Estoy impresionado de que V3 superara a Gemini, Copilot y Meta, pero aún está al nivel de GPT-3.5, lo que sugiere que hay espacio para crecer. El rendimiento de R1 fue decepcionante. Si tuviera que elegir, me quedaría con ChatGPT para ayuda con la programación.

Dicho esto, para una nueva herramienta que funciona con mucha menos infraestructura, DeepSeek es definitivamente una para seguir de cerca.

¿Qué opinas? ¿Has probado DeepSeek? ¿Usas alguna IA para soporte de programación? Déjanos saber en los comentarios a continuación.

Sigue mis actualizaciones diarias de proyectos en redes sociales, suscríbete a mi boletín semanal y conéctate conmigo en Twitter/X en @DavidGewirtz, Facebook en Facebook.com/DavidGewirtz, Instagram en Instagram.com/DavidGewirtz, Bluesky en @DavidGewirtz.com y YouTube en YouTube.com/DavidGewirtzTV.

Artículo relacionado

Topaz DeNoise AI: Mejor herramienta de reducción de ruido en 2025 - Guía completa En el competitivo mundo de la fotografía digital, la claridad de imagen sigue siendo primordial. Fotógrafos de todos los niveles se enfrentan al ruido digital que compromete tomas que de otro modo ser

Maestro Esmeralda Kaizo Nuzlocke: Guía definitiva de supervivencia y estrategia Kaizo Esmeralda se erige como uno de los hacks de ROMs de Pokémon más formidables jamás concebidos. Aunque intentar una ejecución Nuzlocke aumenta exponencialmente el desafío, la victoria sigue siendo

Cartas de presentación con IA: Guía de expertos para la presentación de trabajos a revistas En el competitivo entorno actual de las publicaciones académicas, la elaboración de una carta de presentación eficaz puede marcar la diferencia decisiva en la aceptación de su manuscrito. Descubra cóm

comentario (13)

0/200

Entregar

CarlCarter

5 de septiembre de 2025 22:30:30 GMT+02:00

DeepSeek这波操作有点东西啊！中国本土AI终于不再只擅长写诗和做饭了，居然在代码能力上也能和国外大模型掰手腕👏 不过开源这事...希望别过两天就变成'部分开源'吧😂

BruceGonzalez

25 de agosto de 2025 09:01:02 GMT+02:00

DeepSeek's open-source approach is a game-changer! I'm stoked to see a Chinese AI shaking things up. The coding skills are solid, but I wonder how it’ll stack against giants like GPT in the long run. Exciting times! 🚀

JoseGonzalez

7 de agosto de 2025 08:33:00 GMT+02:00

DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄

ArthurSanchez

23 de abril de 2025 10:48:34 GMT+02:00

DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏

NicholasAdams

23 de abril de 2025 08:36:41 GMT+02:00

DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね！DeepSeek、改善を続けてください！👏

StephenGonzalez

21 de abril de 2025 06:47:37 GMT+02:00

DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀

Noticias principales

Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Doblaje AI: Guía Definitiva para la Creación de Voz Realista La IA de Cambium transforma la madera de los desechos en madera AI Builder y Power Automate Revolucionan la Sumarización de Documentos Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia Google utiliza IA para suspender más de 39 millones de cuentas publicitarias por sospecha de fraude

Más

Presentado