opção
Lar
Notícias
A IA do Github Copilot testada: sucesso de codificação mista me deixa confuso

A IA do Github Copilot testada: sucesso de codificação mista me deixa confuso

21 de Abril de 2025
195

Explorando as Inconsistências em Ferramentas de Codificação de IA

É realmente intrigante como ferramentas de IA, todas construídas sobre o mesmo modelo de linguagem de grande escala, podem produzir resultados tão variados. Por exemplo, ChatGPT, Perplexity e GitHub Copilot utilizam o modelo GPT-4 da OpenAI. No entanto, meus testes recentes mostraram diferenças gritantes no desempenho: enquanto os planos profissionais do ChatGPT e do Perplexity se destacaram, o GitHub Copilot teve uma taxa de sucesso de 50%.

Realizei esses testes usando o GitHub Copilot integrado a um ambiente VS Code. Compartilharei um guia detalhado sobre como configurar isso em um artigo futuro. Por enquanto, vamos mergulhar nos detalhes dos testes que realizei.

Se você está curioso sobre minha metodologia de teste e os prompts utilizados, pode conferir meu guia detalhado sobre como avaliar as capacidades de codificação de um chatbot de IA.

TL;DR: O GitHub Copilot conseguiu passar em dois dos quatro testes que realizei.

Teste 1: Escrevendo um Plugin para WordPress

Este teste foi uma completa decepção. Foi meu experimento inicial, deixando-me inseguro se o GitHub Copilot tem dificuldades com codificação ou se as limitações de interação dentro do VS Code prejudicam suas capacidades.

Aqui está o contexto: pedi à IA que desenvolvesse um plugin para WordPress totalmente funcional, que incluísse uma interface administrativa e lógica operacional. A tarefa do plugin era aceitar uma lista de nomes, ordená-los e separar quaisquer duplicatas para evitar adjacência.

Essa tarefa surgiu de uma necessidade real do negócio de comércio eletrônico de bens digitais da minha esposa, onde ela gerencia um grupo ativo no Facebook.

Enquanto cinco dos dez modelos de IA testados passaram neste teste completamente, três passaram parcialmente e dois, incluindo o Microsoft Copilot, falharam completamente. O GitHub Copilot, apesar de receber o mesmo prompt, produziu apenas código PHP. Embora o problema pudesse ser resolvido apenas com PHP, o GitHub Copilot tentou referenciar JavaScript sem realmente gerá-lo.

Captura de tela por David Gewirtz/ZDNET

Captura de tela por David Gewirtz/ZDNET

Quando tentei solicitar ao GitHub Copilot, a partir de um arquivo JavaScript, para completar a tarefa, ele respondeu bizarramente com mais código PHP, ainda referenciando um arquivo JavaScript inexistente.

Captura de tela por David Gewirtz/ZDNET

Captura de tela por David Gewirtz/ZDNET

Teste 2: Reescrevendo uma Função de String

Este teste foi relativamente simples: forneci uma função destinada a validar dólares e centavos, mas que verificava apenas dólares inteiros. O desafio era que a IA corrigisse a função.

O GitHub Copilot modificou o código, mas o resultado foi problemático. Ele presumiu que qualquer string de entrada era válida, o que causaria erros se a string estivesse vazia. Além disso, a expressão regular atualizada não conseguia lidar com vários casos extremos, como entradas como "3.", ".3" ou "00.30". Para uma função destinada a validar moeda, tais descuidos são inaceitáveis, marcando outra falha para o GitHub Copilot.

Teste 3: Encontrando um Bug Irritante

Aqui, o GitHub Copilot brilhou. Este teste foi baseado em um desafio de codificação real que enfrentei, onde a mensagem de erro não apontava diretamente para o problema real. É um pouco como um enigma de codificação, exigindo uma compreensão profunda das chamadas de API do WordPress para resolver.

Enquanto o Microsoft Copilot, Gemini e Meta Code Llama tropeçaram neste teste, o GitHub Copilot acertou em cheio, demonstrando sua capacidade de enfrentar problemas complexos do mundo real.

Teste 4: Escrevendo um Script

O GitHub Copilot também teve sucesso neste teste, onde o Microsoft Copilot ficou aquém. A tarefa envolvia criar um script que precisava integrar AppleScript, o modelo de objeto do Chrome e um utilitário específico para Mac chamado Keyboard Maestro.

Para passar, a IA precisava reconhecer e abordar as nuances de todos os três ambientes, e o GitHub Copilot fez exatamente isso.

Considerações Finais

É desanimador ver o GitHub Copilot, que usa o avançado modelo GPT-4, falhar em metade dos testes. Dado o status do GitHub como uma plataforma líder de gerenciamento de código-fonte, seria de esperar que seu suporte à codificação com IA fosse mais confiável.

No entanto, o mundo da IA está em constante evolução, e estou otimista de que o desempenho do GitHub Copilot melhorará com o tempo. Revisitaremos isso em alguns meses para ver como ele progrediu.

Você depende de IA para assistência em codificação? Qual ferramenta de IA é a sua preferida? Já experimentou o GitHub Copilot? Compartilhe suas experiências nos comentários abaixo.

Fique atualizado com o progresso diário do meu projeto nas redes sociais. Não se esqueça de se inscrever na minha newsletter semanal e me seguir no Twitter/X em @DavidGewirtz, no Facebook em Facebook.com/DavidGewirtz, no Instagram em Instagram.com/DavidGewirtz, no Bluesky em @DavidGewirtz.com e no YouTube em YouTube.com/DavidGewirtzTV.

Artigo relacionado
Eleve Suas Imagens com o HitPaw AI Photo Enhancer: Um Guia Completo Eleve Suas Imagens com o HitPaw AI Photo Enhancer: Um Guia Completo Quer transformar sua experiência de edição de fotos? Graças à inteligência artificial de ponta, melhorar suas imagens agora é fácil. Este guia detalhado explora o HitPaw AI Photo Enhancer, uma ferrame
Criação Musical Alimentada por IA: Crie Músicas e Vídeos sem Esforço Criação Musical Alimentada por IA: Crie Músicas e Vídeos sem Esforço A criação musical pode ser complexa, exigindo tempo, recursos e expertise. A inteligência artificial transformou esse processo, tornando-o simples e acessível. Este guia destaca como a IA permite que
Criando Livros de Colorir Alimentados por IA: Um Guia Completo Criando Livros de Colorir Alimentados por IA: Um Guia Completo Projetar livros de colorir é uma busca recompensadora, combinando expressão artística com experiências calmantes para os usuários. No entanto, o processo pode ser trabalhoso. Felizmente, ferramentas d
Comentários (24)
0/200
StephenRoberts
StephenRoberts 13 de Agosto de 2025 à1 20:01:01 WEST

GitHub Copilot's AI is such a mixed bag! Sometimes it spits out perfect code, other times it’s like it’s drunk—random errors everywhere. Makes me wonder if the same GPT-4 is just mood-swinging or if the training data’s got some serious split personality. 😅 Anyone else getting whiplash from these AI tools?

WalterWilliams
WalterWilliams 5 de Agosto de 2025 à0 14:01:00 WEST

It's wild how GitHub Copilot can be a coding wizard one minute and totally miss the mark the next! 🤯 I tried it for a Python script, and it spat out half-baked code that left me scratching my head. Maybe it’s like a moody artist—brilliant but inconsistent? Anyone else getting these mixed vibes?

WillieLee
WillieLee 29 de Julho de 2025 à16 13:25:16 WEST

GitHub Copilot's AI is such a wild card! Sometimes it nails the code, other times it’s like it’s writing poetry instead of Python. 😅 I’m curious, does anyone else feel like they’re rolling dice with these AI tools?

JerryGonzalez
JerryGonzalez 28 de Julho de 2025 à4 02:19:04 WEST

GitHub Copilot’s AI is such a mixed bag! Sometimes it’s like having a genius pair-programmer, other times it’s just spitting out buggy code that makes me scratch my head. 😕 Still, it’s wild to think how far AI coding has come, even if it’s not perfect yet.

JuanLewis
JuanLewis 24 de Abril de 2025 à39 00:53:39 WEST

GitHub Copilot's AI is a mixed bag. Sometimes it nails the code, other times it's like it's guessing. It's baffling how inconsistent it can be. I guess it's still learning, but it's frustrating when you're on a deadline. 🤔

HenryJackson
HenryJackson 23 de Abril de 2025 à43 15:51:43 WEST

GitHub CopilotのAIは一長一短ですね。時にはコードを完璧に書いてくれるのに、時にはまるで推測しているかのようです。なぜこんなに一貫性がないのか不思議です。まだ学習中なんでしょうが、締め切りがあるときはイライラしますね。🤔

De volta ao topo
OR