A IA do Github Copilot testada: sucesso de codificação mista me deixa confuso

Lar

Notícias

21 de Abril de 2025

GregoryAllen

195

Explorando as Inconsistências em Ferramentas de Codificação de IA

É realmente intrigante como ferramentas de IA, todas construídas sobre o mesmo modelo de linguagem de grande escala, podem produzir resultados tão variados. Por exemplo, ChatGPT, Perplexity e GitHub Copilot utilizam o modelo GPT-4 da OpenAI. No entanto, meus testes recentes mostraram diferenças gritantes no desempenho: enquanto os planos profissionais do ChatGPT e do Perplexity se destacaram, o GitHub Copilot teve uma taxa de sucesso de 50%.

Realizei esses testes usando o GitHub Copilot integrado a um ambiente VS Code. Compartilharei um guia detalhado sobre como configurar isso em um artigo futuro. Por enquanto, vamos mergulhar nos detalhes dos testes que realizei.

Se você está curioso sobre minha metodologia de teste e os prompts utilizados, pode conferir meu guia detalhado sobre como avaliar as capacidades de codificação de um chatbot de IA.

TL;DR: O GitHub Copilot conseguiu passar em dois dos quatro testes que realizei.

Teste 1: Escrevendo um Plugin para WordPress

Este teste foi uma completa decepção. Foi meu experimento inicial, deixando-me inseguro se o GitHub Copilot tem dificuldades com codificação ou se as limitações de interação dentro do VS Code prejudicam suas capacidades.

Aqui está o contexto: pedi à IA que desenvolvesse um plugin para WordPress totalmente funcional, que incluísse uma interface administrativa e lógica operacional. A tarefa do plugin era aceitar uma lista de nomes, ordená-los e separar quaisquer duplicatas para evitar adjacência.

Essa tarefa surgiu de uma necessidade real do negócio de comércio eletrônico de bens digitais da minha esposa, onde ela gerencia um grupo ativo no Facebook.

Enquanto cinco dos dez modelos de IA testados passaram neste teste completamente, três passaram parcialmente e dois, incluindo o Microsoft Copilot, falharam completamente. O GitHub Copilot, apesar de receber o mesmo prompt, produziu apenas código PHP. Embora o problema pudesse ser resolvido apenas com PHP, o GitHub Copilot tentou referenciar JavaScript sem realmente gerá-lo.

Captura de tela por David Gewirtz/ZDNET

Quando tentei solicitar ao GitHub Copilot, a partir de um arquivo JavaScript, para completar a tarefa, ele respondeu bizarramente com mais código PHP, ainda referenciando um arquivo JavaScript inexistente.

Captura de tela por David Gewirtz/ZDNET

Teste 2: Reescrevendo uma Função de String

Este teste foi relativamente simples: forneci uma função destinada a validar dólares e centavos, mas que verificava apenas dólares inteiros. O desafio era que a IA corrigisse a função.

O GitHub Copilot modificou o código, mas o resultado foi problemático. Ele presumiu que qualquer string de entrada era válida, o que causaria erros se a string estivesse vazia. Além disso, a expressão regular atualizada não conseguia lidar com vários casos extremos, como entradas como "3.", ".3" ou "00.30". Para uma função destinada a validar moeda, tais descuidos são inaceitáveis, marcando outra falha para o GitHub Copilot.

Teste 3: Encontrando um Bug Irritante

Aqui, o GitHub Copilot brilhou. Este teste foi baseado em um desafio de codificação real que enfrentei, onde a mensagem de erro não apontava diretamente para o problema real. É um pouco como um enigma de codificação, exigindo uma compreensão profunda das chamadas de API do WordPress para resolver.

Enquanto o Microsoft Copilot, Gemini e Meta Code Llama tropeçaram neste teste, o GitHub Copilot acertou em cheio, demonstrando sua capacidade de enfrentar problemas complexos do mundo real.

Teste 4: Escrevendo um Script

O GitHub Copilot também teve sucesso neste teste, onde o Microsoft Copilot ficou aquém. A tarefa envolvia criar um script que precisava integrar AppleScript, o modelo de objeto do Chrome e um utilitário específico para Mac chamado Keyboard Maestro.

Para passar, a IA precisava reconhecer e abordar as nuances de todos os três ambientes, e o GitHub Copilot fez exatamente isso.

Considerações Finais

É desanimador ver o GitHub Copilot, que usa o avançado modelo GPT-4, falhar em metade dos testes. Dado o status do GitHub como uma plataforma líder de gerenciamento de código-fonte, seria de esperar que seu suporte à codificação com IA fosse mais confiável.

No entanto, o mundo da IA está em constante evolução, e estou otimista de que o desempenho do GitHub Copilot melhorará com o tempo. Revisitaremos isso em alguns meses para ver como ele progrediu.

Você depende de IA para assistência em codificação? Qual ferramenta de IA é a sua preferida? Já experimentou o GitHub Copilot? Compartilhe suas experiências nos comentários abaixo.

Fique atualizado com o progresso diário do meu projeto nas redes sociais. Não se esqueça de se inscrever na minha newsletter semanal e me seguir no Twitter/X em @DavidGewirtz, no Facebook em Facebook.com/DavidGewirtz, no Instagram em Instagram.com/DavidGewirtz, no Bluesky em @DavidGewirtz.com e no YouTube em YouTube.com/DavidGewirtzTV.

Artigo relacionado

Topaz DeNoise AI: a melhor ferramenta de redução de ruído em 2025 - Guia completo No competitivo mundo da fotografia digital, a nitidez da imagem continua sendo fundamental. Fotógrafos de todos os níveis de habilidade enfrentam o ruído digital que compromete fotos que, de outra for

Master Emerald Kaizo Nuzlocke: Guia definitivo de sobrevivência e estratégia O Emerald Kaizo é um dos mais formidáveis hacks de ROM de Pokémon já concebidos. Embora a tentativa de executar um Nuzlocke aumente exponencialmente o desafio, a vitória continua sendo possível por me

Cartas de apresentação com tecnologia de IA: Guia especializado para submissão de artigos em periódicos No competitivo ambiente de publicação acadêmica de hoje, a elaboração de uma carta de apresentação eficaz pode fazer a diferença crucial na aceitação do seu manuscrito. Descubra como as ferramentas co

Comentários (24)

0/200

Enviar

StephenRoberts

13 de Agosto de 2025 à1 20:01:01 WEST

GitHub Copilot's AI is such a mixed bag! Sometimes it spits out perfect code, other times it’s like it’s drunk—random errors everywhere. Makes me wonder if the same GPT-4 is just mood-swinging or if the training data’s got some serious split personality. 😅 Anyone else getting whiplash from these AI tools?

WalterWilliams

5 de Agosto de 2025 à0 14:01:00 WEST

It's wild how GitHub Copilot can be a coding wizard one minute and totally miss the mark the next! 🤯 I tried it for a Python script, and it spat out half-baked code that left me scratching my head. Maybe it’s like a moody artist—brilliant but inconsistent? Anyone else getting these mixed vibes?

WillieLee

29 de Julho de 2025 à16 13:25:16 WEST

GitHub Copilot's AI is such a wild card! Sometimes it nails the code, other times it’s like it’s writing poetry instead of Python. 😅 I’m curious, does anyone else feel like they’re rolling dice with these AI tools?

JerryGonzalez

28 de Julho de 2025 à4 02:19:04 WEST

GitHub Copilot’s AI is such a mixed bag! Sometimes it’s like having a genius pair-programmer, other times it’s just spitting out buggy code that makes me scratch my head. 😕 Still, it’s wild to think how far AI coding has come, even if it’s not perfect yet.

JuanLewis

24 de Abril de 2025 à39 00:53:39 WEST

GitHub Copilot's AI is a mixed bag. Sometimes it nails the code, other times it's like it's guessing. It's baffling how inconsistent it can be. I guess it's still learning, but it's frustrating when you're on a deadline. 🤔

HenryJackson

23 de Abril de 2025 à43 15:51:43 WEST

GitHub CopilotのAIは一長一短ですね。時にはコードを完璧に書いてくれるのに、時にはまるで推測しているかのようです。なぜこんなに一貫性がないのか不思議です。まだ学習中なんでしょうが、締め切りがあるときはイライラしますね。🤔

Principais notícias

Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro agora ilimitado e mais barato que Claude, GPT-4o Dublagem AI: Guia Definitivo para Criação de Voz Realista A IA de Cambium transforma a madeira desperdiçada em madeira serrada AI Builder e Power Automate Revolucionam a Sumarização de Documentos O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Como garantir que seus dados sejam confiáveis para a integração de IA Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia O Google utiliza a IA para suspender mais de 39 milhões de contas de anúncios por suspeita de fraude

Mais

Apresentou