opção
Lar
Notícias
Gemini Pro 2.5: Um poderoso assistente de codificação que representa uma grande ameaça para o chatgpt

Gemini Pro 2.5: Um poderoso assistente de codificação que representa uma grande ameaça para o chatgpt

19 de Abril de 2025
142

Quando se trata de avaliar IA para assistência em codificação, desenvolvi um conjunto de quatro testes padronizados. Esses testes são cruciais para avaliar o quão bem uma IA pode apoiar seus esforços de programação. Afinal, a última coisa que você precisa é de uma IA que adiciona mais bugs ao seu código, certo?

Há algum tempo, um leitor questionou minha abordagem, sugerindo que as IAs poderiam ter melhor desempenho com desafios diferentes. É um ponto válido, mas eu mantenho esses testes porque são diretos. Uso PHP e JavaScript, que não são as linguagens mais difíceis por aí, e executo algumas consultas de script através das IAs. Essa consistência nos permite comparar o desempenho diretamente.

Os testes incluem escrever um plugin simples para WordPress, reescrever uma função de string, encontrar um bug com o qual já lutei e usar ferramentas de programação para extrair dados do Chrome. É como ensinar alguém a dirigir — você não os deixaria soltos em uma rodovia se eles não conseguem nem sair da garagem.

Até hoje, apenas o LLM GPT-4 (e superior) do ChatGPT passou em todos esses testes. Curiosamente, o Perplexity Pro também teve sucesso, mas isso porque ele roda na série de LLMs GPT-4. Por outro lado, o Microsoft Copilot, apesar de usar o mesmo LLM, falhou em todos os testes.

O Gemini do Google não teve um desempenho muito melhor. Inicialmente, o Bard (o nome inicial do Gemini) falhou na maioria dos testes, e até o Gemini Advanced, que custa $20 por mês, falhou em três dos quatro testes no último ano.

Mas agora, o Google lançou o Gemini Pro 2.5, e ele é gratuito para todos, embora com limites de taxa. Eu atingi esses limites após apenas dois prompts durante meus testes, o que é um pouco restritivo. É possível que a limitação de taxa seja baseada na complexidade das tarefas, em vez do número de prompts. Meus dois primeiros pedidos foram para escrever um plugin completo para WordPress e corrigir um código, o que pode ter consumido meu limite mais rápido do que consultas mais simples.

Apesar da espera, os resultados foram surpreendentes e valeram a pena.

Teste 1: Escrever um plugin simples para WordPress

Desta vez, o Gemini Pro 2.5 arrasou. O desafio era criar um plugin para WordPress que fornecesse uma interface de usuário para randomizar linhas de entrada e distribuir duplicatas para que não ficassem adjacentes.

Anteriormente, o Gemini Advanced não criou um painel de administração, mas exigiu um shortcode no texto de uma página pública. Ele criou uma interface básica, mas clicar no botão não fazia nada. Não importava como eu ajustasse os prompts, ele ainda falhava.

Mas o Gemini Pro 2.5 entregou uma interface sólida, e o código funcionou como esperado. O que realmente me impressionou foi a escolha do ícone para o plugin. A maioria das IAs ignora esse detalhe, mas o Gemini Pro 2.5 escolheu um ícone relevante do conjunto de Dashicons do WordPress sem qualquer solicitação minha. O código estava bem documentado, com cada segmento principal explicado claramente.

randomizer-ui

Captura de tela por David Gewirtz/ZDNET

icon

Captura de tela por David Gewirtz/ZDNET

Teste 2: Reescrever uma função de string

No segundo teste, pedi ao Gemini Pro 2.5 para modificar um código de processamento de strings para lidar com dólares e centavos, não apenas inteiros. O ChatGPT acertou isso, enquanto o Bard acabou conseguindo após falhas iniciais.

Da última vez, o Gemini Advanced falhou de maneira sutil, mas perigosa. Ele não permitia entradas não decimais e limitava incorretamente os números a dois dígitos antes do ponto decimal, entendendo mal o conceito de dólares e centavos. Esse tipo de erro poderia levar a uma enxurrada de relatórios de bugs se não fosse detectado.

O Gemini Pro 2.5, no entanto, acertou em cheio. Ele verificou corretamente os tipos de entrada, removeu espaços em branco, corrigiu a expressão regular para lidar com zeros à esquerda e entradas apenas decimais, e rejeitou entradas negativas. O código estava bem comentado, com um conjunto completo de exemplos de teste. Embora não permitisse vírgulas de agrupamento ou símbolos de moeda à frente, esses foram erros controlados, não falhas, então considero que passou.

Teste 3: Encontrar um bug

Uma vez, lutei com um bug no meu código que deveria funcionar, mas não funcionava. O problema era complicado, e enquanto eu estava focado no número de parâmetros sendo passados, o ChatGPT apontou que eu precisava mudar algo em um hook.

Tanto o Bard quanto o Meta erraram o alvo, seguindo o mesmo caminho inútil que eu. O Gemini Advanced, em fevereiro de 2024, sugeriu olhar "provavelmente em algum outro lugar no plugin ou no WordPress", o que não ajudou.

Com o Gemini Pro 2.5, atingi o limite de taxa após os dois primeiros testes, então tive que esperar até o dia seguinte. Quando finalmente executei o teste, o Gemini Pro 2.5 não só encontrou o bug, mas também me mostrou exatamente onde corrigi-lo, completo com um diagrama útil.

limit

Captura de tela por David Gewirtz/ZDNET

map

Captura de tela por David Gewirtz/ZDNET

Teste 4: Escrever um script

O teste final envolve entender o modelo de objeto interno do Chrome, AppleScript e Keyboard Maestro, uma ferramenta de construção de macros. Trata-se de abrir abas do Chrome e definir a aba ativa com base em um parâmetro.

A maioria das IAs lida bem com as partes do Chrome e AppleScript, mas muitas vezes tem dificuldade com o Keyboard Maestro. O Gemini Pro 2.5, no entanto, acertou. Ele escreveu o código necessário para passar variáveis corretamente, adicionou verificação de erros e notificações ao usuário, e até forneceu passos para configurar o Keyboard Maestro.

maestro

Captura de tela por David Gewirtz/ZDNET

Com todos os quatro testes aprovados, o Gemini Pro 2.5 se junta ao grupo de elite de ferramentas de IA que podem realmente ajudar com tarefas de programação.

Era apenas uma questão de tempo até que a IA do Google alcançasse as ofertas da OpenAI. O artigo de 2017 do Google, "Attention is all you need", deu início ao boom da IA generativa, então não é surpresa que eles tenham chegado a esse ponto. O Gemini Pro 2.5 é mais lento que o ChatGPT Plus, levando entre 15 segundos e um minuto para responder, mas a precisão é mais importante que a velocidade.

O Google também tornou o Google Code Assist gratuito com limites generosos, mas só é valioso se o código gerado for de alta qualidade. Com o Gemini Pro 2.5, essa qualidade agora é evidente. Embora atualmente marcado como "experimental", espero que o Google refine isso em breve, potencialmente oferecendo uma versão paga com menos limites de taxa.

Fica claro que o Gemini Pro 2.5 está pronto para desafiar o ChatGPT no campo da assistência em codificação. Estarei acompanhando de perto esse desenvolvimento e compartilhando mais atualizações em breve.

Artigo relacionado
Programa Agent Pay da Mastercard Melhora a Pesquisa por IA com Transações Fluidas Programa Agent Pay da Mastercard Melhora a Pesquisa por IA com Transações Fluidas As plataformas de pesquisa tradicionais e agentes de IA frequentemente exigem que os usuários troquem de janela para completar compras após encontrar produtos ou serviços.A Mastercard está revoluciona
OpenAI Compromete-se com Correções Após Respostas Excessivamente Concordantes do ChatGPT OpenAI Compromete-se com Correções Após Respostas Excessivamente Concordantes do ChatGPT A OpenAI planeja revisar seu processo de atualização do modelo de IA para o ChatGPT após uma atualização causar respostas excessivamente bajuladoras, gerando amplo feedback dos usuários.No último fim
OpenAI Revela Modelos Avançados de Raciocínio de IA, o3 e o4-mini OpenAI Revela Modelos Avançados de Raciocínio de IA, o3 e o4-mini OpenAI apresentou o3 e o4-mini na quarta-feira, novos modelos de IA projetados para pausar e analisar perguntas antes de responder.OpenAI destaca o3 como seu modelo de raciocínio mais sofisticado até
Comentários (22)
0/200
JoseGonzalez
JoseGonzalez 31 de Julho de 2025 à5 02:42:05 WEST

Just read about Gemini Pro 2.5 and wow, those coding tests sound intense! 😅 Curious if it’ll really outshine ChatGPT or just hype. Anyone tried it yet?

WalterLewis
WalterLewis 28 de Julho de 2025 à30 02:19:30 WEST

This AI coding battle is heating up! Gemini Pro 2.5 sounds like a beast, but I’m curious if it’s really outpacing ChatGPT or just hype. 🤔 Anyone tried it on real projects yet?

ScottKing
ScottKing 25 de Abril de 2025 à57 19:14:57 WEST

Gemini Pro 2.5は本当に強力!コーディングの助けにはChatGPTよりずっと優れてる。私のテストに通してみたら、完璧に合格したよ。唯一の欠点はちょっと高価なこと。でも、コーディングに本気なら、その価値はあるよ!💻

StevenGreen
StevenGreen 25 de Abril de 2025 à1 04:28:01 WEST

Gemini Pro 2.5 es una bestia. Es mucho mejor que ChatGPT para ayudar en la programación. Lo probé con mis tests y aprobó con honores. El único problema es que es un poco caro. Pero si te tomas en serio la programación, vale cada centavo! 💻

AlbertWalker
AlbertWalker 24 de Abril de 2025 à6 23:10:06 WEST

Gemini Pro 2.5 is a beast! It's way better than ChatGPT for coding help. I ran it through my tests and it passed with flying colors. Only downside? It's a bit pricey. But if you're serious about coding, it's worth every penny! 💻

WillGarcía
WillGarcía 21 de Abril de 2025 à31 13:06:31 WEST

ジェミニプロ2.5、コーディングの強力な助っ人だね!でも、バグ増やすAIは勘弁😅 テスト結果が気になる!

De volta ao topo
OR