Meta AI no compite con Llama, Gemini y Chatgpt en la prueba de codificación

Hogar

Noticias

3 de junio de 2025

GeorgeNelson

¿Cómo de bien escriben código las herramientas de IA?

Durante el último año, he probado varios modelos de lenguaje grandes para evaluar su eficacia en desafíos de programación básicos. La idea es simple: si no pueden con lo básico, es poco probable que ayuden en tareas complejas. Pero si lo hacen bien en estos desafíos fundamentales, podrían ser aliados valiosos para desarrolladores que buscan ahorrar tiempo.

Para establecer una base, he usado cuatro pruebas distintas. Estas van desde tareas de codificación simples hasta ejercicios de depuración que requieren un conocimiento más profundo de frameworks como WordPress. Analicemos cada prueba y comparemos cómo se desempeña la nueva herramienta de IA de Meta frente a otras.

Prueba 1: Escribir un plugin de WordPress

Crear un plugin de WordPress implica desarrollo web con PHP dentro del ecosistema de WordPress. También requiere diseño de UI. Si un chatbot de IA logra esto, podría ser un asistente útil para desarrolladores web.

Resultados:

Meta AI: Interfaz adecuada pero funcionalidad fallida.
Meta Code Llama: Fracaso total.
Google Gemini Advanced: Buena interfaz, funcionalidad fallida.
ChatGPT: Interfaz limpia y salida funcional.

Aquí está una comparación visual: Prueba de UI (Nota: Reemplaza "/path-to-image/" con la ruta real al archivo de imagen.)

ChatGPT ofreció una interfaz más ordenada y colocó el botón "Randomize" de forma más lógica. Sin embargo, al ejecutar el plugin, Meta AI colapsó, mostrando la temida "Pantalla Blanca de la Muerte".

Prueba 2: Reescribir una función de cadena

Esta prueba evalúa la capacidad de una IA para mejorar funciones de utilidad. El éxito aquí sugiere asistencia potencial para desarrolladores, mientras que el fracaso implica margen de mejora.

Resultados:

Meta AI: Falló por correcciones de valores incorrectas, mal manejo de números con múltiples decimales y problemas de formato.
Meta Code Llama: Éxito.
Google Gemini Advanced: Falló.
ChatGPT: Éxito.

Mientras Meta AI tropezó en esta tarea aparentemente simple, Meta Code Llama destacó, mostrando su capacidad. ChatGPT también tuvo un desempeño admirable.

Prueba 3: Encontrar un error molesto

Esto no se trata de escribir código, sino de diagnosticar problemas. El éxito requiere un conocimiento profundo de las APIs de WordPress y las interacciones entre diferentes partes del código.

Resultados:

Meta AI: Aprobó con gran éxito, identificando el problema y sugiriendo un ajuste para mejorar la eficiencia.
Meta Code Llama: Falló.
Google Gemini Advanced: Falló.
ChatGPT: Aprobó.

Sorprendentemente, a pesar de sus dificultades previas, Meta AI destacó aquí, demostrando su potencial pero también evidenciando inconsistencias en sus respuestas.

Prueba 4: Escribir un script

Esta prueba evalúa el conocimiento de herramientas especializadas como Keyboard Maestro y AppleScript. Ambas son relativamente de nicho, pero representan un espectro más amplio de habilidades de programación.

Resultados:

Meta AI: Falló al recuperar datos de Keyboard Maestro.
Meta Code Llama: Mismo fallo.
Google Gemini Advanced: Éxito.
ChatGPT: Éxito.

Gemini y ChatGPT demostraron competencia con estas herramientas, mientras que las ofertas de Meta se quedaron cortas.

Resultados generales

Modelo	Tasa de éxito
Meta AI	1/4
Meta Code Llama	1/4
Google Gemini	1/4
ChatGPT	4/4

Basado en mi experiencia de seis meses usando ChatGPT para proyectos de codificación, sigo confiando en su fiabilidad. Otros modelos aún no igualan su consistencia y efectividad. Aunque Meta AI mostró destellos de brillantez, su desempeño general deja mucho que desear.

¿Has experimentado con estas herramientas? ¡Comparte tus opiniones en los comentarios abajo!

Artículo relacionado

Topaz DeNoise AI: Mejor herramienta de reducción de ruido en 2025 - Guía completa En el competitivo mundo de la fotografía digital, la claridad de imagen sigue siendo primordial. Fotógrafos de todos los niveles se enfrentan al ruido digital que compromete tomas que de otro modo ser

Maestro Esmeralda Kaizo Nuzlocke: Guía definitiva de supervivencia y estrategia Kaizo Esmeralda se erige como uno de los hacks de ROMs de Pokémon más formidables jamás concebidos. Aunque intentar una ejecución Nuzlocke aumenta exponencialmente el desafío, la victoria sigue siendo

Cartas de presentación con IA: Guía de expertos para la presentación de trabajos a revistas En el competitivo entorno actual de las publicaciones académicas, la elaboración de una carta de presentación eficaz puede marcar la diferencia decisiva en la aceptación de su manuscrito. Descubra cóm

comentario (5)

0/200

Entregar

BillyWilson

30 de septiembre de 2025 10:30:37 GMT+02:00

Meta AI 코딩 테스트 결과는 참 실망스럽네요 😅 다른 경쟁사들보다 확실히 뒤처지는 모습인데... 그래도 아직 초기 단계니까 차차 나아지지 않을까요? 물론 빠르게 따라잡아야 하지만 말이죠!

ChristopherTaylor

12 de agosto de 2025 17:00:59 GMT+02:00

¡Qué decepción con Meta AI! No me esperaba que fallara tan estrepitosamente en las pruebas de programación. Si no puede con lo básico, ¿cómo va a competir con los grandes como Gemini o ChatGPT? 🤔

PaulHarris

1 de agosto de 2025 15:47:34 GMT+02:00

Meta AI's coding skills are lagging behind? Ouch, that’s a rough one! 😅 Llama and Gemini are eating its lunch. Maybe it’s time for Meta to rethink their AI game plan.

MarkGonzalez

28 de julio de 2025 03:20:02 GMT+02:00

Meta AI's coding skills seem underwhelming compared to Llama and others. 😕 I was hoping for a stronger contender in the AI coding space, but it looks like they’ve got some catching up to do. Anyone else tried using it for coding yet?

TerryRoberts

22 de julio de 2025 03:25:03 GMT+02:00

This article's take on Meta AI flopping in coding tests is wild! 😅 I mean, with all the hype around AI, you'd think they'd at least nail the basics. Makes me wonder if we're overhyping these models or if Meta's just lagging behind. Anyone else skeptical about AI coding tools now?

Noticias principales

Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Doblaje AI: Guía Definitiva para la Creación de Voz Realista La IA de Cambium transforma la madera de los desechos en madera AI Builder y Power Automate Revolucionan la Sumarización de Documentos Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia Google utiliza IA para suspender más de 39 millones de cuentas publicitarias por sospecha de fraude

Más

Presentado