Gemini Pro 2.5: Um poderoso assistente de codificação que representa uma grande ameaça para o chatgpt
Quando se trata de avaliar IA para assistência em codificação, desenvolvi um conjunto de quatro testes padronizados. Esses testes são cruciais para avaliar o quão bem uma IA pode apoiar seus esforços de programação. Afinal, a última coisa que você precisa é de uma IA que adiciona mais bugs ao seu código, certo?
Há algum tempo, um leitor questionou minha abordagem, sugerindo que as IAs poderiam ter melhor desempenho com desafios diferentes. É um ponto válido, mas eu mantenho esses testes porque são diretos. Uso PHP e JavaScript, que não são as linguagens mais difíceis por aí, e executo algumas consultas de script através das IAs. Essa consistência nos permite comparar o desempenho diretamente.
Os testes incluem escrever um plugin simples para WordPress, reescrever uma função de string, encontrar um bug com o qual já lutei e usar ferramentas de programação para extrair dados do Chrome. É como ensinar alguém a dirigir — você não os deixaria soltos em uma rodovia se eles não conseguem nem sair da garagem.
Até hoje, apenas o LLM GPT-4 (e superior) do ChatGPT passou em todos esses testes. Curiosamente, o Perplexity Pro também teve sucesso, mas isso porque ele roda na série de LLMs GPT-4. Por outro lado, o Microsoft Copilot, apesar de usar o mesmo LLM, falhou em todos os testes.
O Gemini do Google não teve um desempenho muito melhor. Inicialmente, o Bard (o nome inicial do Gemini) falhou na maioria dos testes, e até o Gemini Advanced, que custa $20 por mês, falhou em três dos quatro testes no último ano.
Mas agora, o Google lançou o Gemini Pro 2.5, e ele é gratuito para todos, embora com limites de taxa. Eu atingi esses limites após apenas dois prompts durante meus testes, o que é um pouco restritivo. É possível que a limitação de taxa seja baseada na complexidade das tarefas, em vez do número de prompts. Meus dois primeiros pedidos foram para escrever um plugin completo para WordPress e corrigir um código, o que pode ter consumido meu limite mais rápido do que consultas mais simples.
Apesar da espera, os resultados foram surpreendentes e valeram a pena.
Teste 1: Escrever um plugin simples para WordPress
Desta vez, o Gemini Pro 2.5 arrasou. O desafio era criar um plugin para WordPress que fornecesse uma interface de usuário para randomizar linhas de entrada e distribuir duplicatas para que não ficassem adjacentes.
Anteriormente, o Gemini Advanced não criou um painel de administração, mas exigiu um shortcode no texto de uma página pública. Ele criou uma interface básica, mas clicar no botão não fazia nada. Não importava como eu ajustasse os prompts, ele ainda falhava.
Mas o Gemini Pro 2.5 entregou uma interface sólida, e o código funcionou como esperado. O que realmente me impressionou foi a escolha do ícone para o plugin. A maioria das IAs ignora esse detalhe, mas o Gemini Pro 2.5 escolheu um ícone relevante do conjunto de Dashicons do WordPress sem qualquer solicitação minha. O código estava bem documentado, com cada segmento principal explicado claramente.

Captura de tela por David Gewirtz/ZDNET 
Captura de tela por David Gewirtz/ZDNET Teste 2: Reescrever uma função de string
No segundo teste, pedi ao Gemini Pro 2.5 para modificar um código de processamento de strings para lidar com dólares e centavos, não apenas inteiros. O ChatGPT acertou isso, enquanto o Bard acabou conseguindo após falhas iniciais.
Da última vez, o Gemini Advanced falhou de maneira sutil, mas perigosa. Ele não permitia entradas não decimais e limitava incorretamente os números a dois dígitos antes do ponto decimal, entendendo mal o conceito de dólares e centavos. Esse tipo de erro poderia levar a uma enxurrada de relatórios de bugs se não fosse detectado.
O Gemini Pro 2.5, no entanto, acertou em cheio. Ele verificou corretamente os tipos de entrada, removeu espaços em branco, corrigiu a expressão regular para lidar com zeros à esquerda e entradas apenas decimais, e rejeitou entradas negativas. O código estava bem comentado, com um conjunto completo de exemplos de teste. Embora não permitisse vírgulas de agrupamento ou símbolos de moeda à frente, esses foram erros controlados, não falhas, então considero que passou.
Teste 3: Encontrar um bug
Uma vez, lutei com um bug no meu código que deveria funcionar, mas não funcionava. O problema era complicado, e enquanto eu estava focado no número de parâmetros sendo passados, o ChatGPT apontou que eu precisava mudar algo em um hook.
Tanto o Bard quanto o Meta erraram o alvo, seguindo o mesmo caminho inútil que eu. O Gemini Advanced, em fevereiro de 2024, sugeriu olhar "provavelmente em algum outro lugar no plugin ou no WordPress", o que não ajudou.
Com o Gemini Pro 2.5, atingi o limite de taxa após os dois primeiros testes, então tive que esperar até o dia seguinte. Quando finalmente executei o teste, o Gemini Pro 2.5 não só encontrou o bug, mas também me mostrou exatamente onde corrigi-lo, completo com um diagrama útil.

Captura de tela por David Gewirtz/ZDNET 
Captura de tela por David Gewirtz/ZDNET Teste 4: Escrever um script
O teste final envolve entender o modelo de objeto interno do Chrome, AppleScript e Keyboard Maestro, uma ferramenta de construção de macros. Trata-se de abrir abas do Chrome e definir a aba ativa com base em um parâmetro.
A maioria das IAs lida bem com as partes do Chrome e AppleScript, mas muitas vezes tem dificuldade com o Keyboard Maestro. O Gemini Pro 2.5, no entanto, acertou. Ele escreveu o código necessário para passar variáveis corretamente, adicionou verificação de erros e notificações ao usuário, e até forneceu passos para configurar o Keyboard Maestro.

Captura de tela por David Gewirtz/ZDNET Com todos os quatro testes aprovados, o Gemini Pro 2.5 se junta ao grupo de elite de ferramentas de IA que podem realmente ajudar com tarefas de programação.
Era apenas uma questão de tempo até que a IA do Google alcançasse as ofertas da OpenAI. O artigo de 2017 do Google, "Attention is all you need", deu início ao boom da IA generativa, então não é surpresa que eles tenham chegado a esse ponto. O Gemini Pro 2.5 é mais lento que o ChatGPT Plus, levando entre 15 segundos e um minuto para responder, mas a precisão é mais importante que a velocidade.
O Google também tornou o Google Code Assist gratuito com limites generosos, mas só é valioso se o código gerado for de alta qualidade. Com o Gemini Pro 2.5, essa qualidade agora é evidente. Embora atualmente marcado como "experimental", espero que o Google refine isso em breve, potencialmente oferecendo uma versão paga com menos limites de taxa.
Fica claro que o Gemini Pro 2.5 está pronto para desafiar o ChatGPT no campo da assistência em codificação. Estarei acompanhando de perto esse desenvolvimento e compartilhando mais atualizações em breve.
Artigo relacionado
Programa Agent Pay da Mastercard Melhora a Pesquisa por IA com Transações Fluidas
As plataformas de pesquisa tradicionais e agentes de IA frequentemente exigem que os usuários troquem de janela para completar compras após encontrar produtos ou serviços.A Mastercard está revoluciona
OpenAI Compromete-se com Correções Após Respostas Excessivamente Concordantes do ChatGPT
A OpenAI planeja revisar seu processo de atualização do modelo de IA para o ChatGPT após uma atualização causar respostas excessivamente bajuladoras, gerando amplo feedback dos usuários.No último fim
OpenAI Revela Modelos Avançados de Raciocínio de IA, o3 e o4-mini
OpenAI apresentou o3 e o4-mini na quarta-feira, novos modelos de IA projetados para pausar e analisar perguntas antes de responder.OpenAI destaca o3 como seu modelo de raciocínio mais sofisticado até
Comentários (22)
0/200
JoseGonzalez
31 de Julho de 2025 à5 02:42:05 WEST
Just read about Gemini Pro 2.5 and wow, those coding tests sound intense! 😅 Curious if it’ll really outshine ChatGPT or just hype. Anyone tried it yet?
0
WalterLewis
28 de Julho de 2025 à30 02:19:30 WEST
This AI coding battle is heating up! Gemini Pro 2.5 sounds like a beast, but I’m curious if it’s really outpacing ChatGPT or just hype. 🤔 Anyone tried it on real projects yet?
0
ScottKing
25 de Abril de 2025 à57 19:14:57 WEST
Gemini Pro 2.5は本当に強力!コーディングの助けにはChatGPTよりずっと優れてる。私のテストに通してみたら、完璧に合格したよ。唯一の欠点はちょっと高価なこと。でも、コーディングに本気なら、その価値はあるよ!💻
0
StevenGreen
25 de Abril de 2025 à1 04:28:01 WEST
Gemini Pro 2.5 es una bestia. Es mucho mejor que ChatGPT para ayudar en la programación. Lo probé con mis tests y aprobó con honores. El único problema es que es un poco caro. Pero si te tomas en serio la programación, vale cada centavo! 💻
0
AlbertWalker
24 de Abril de 2025 à6 23:10:06 WEST
Gemini Pro 2.5 is a beast! It's way better than ChatGPT for coding help. I ran it through my tests and it passed with flying colors. Only downside? It's a bit pricey. But if you're serious about coding, it's worth every penny! 💻
0
WillGarcía
21 de Abril de 2025 à31 13:06:31 WEST
ジェミニプロ2.5、コーディングの強力な助っ人だね!でも、バグ増やすAIは勘弁😅 テスト結果が気になる!
0
Quando se trata de avaliar IA para assistência em codificação, desenvolvi um conjunto de quatro testes padronizados. Esses testes são cruciais para avaliar o quão bem uma IA pode apoiar seus esforços de programação. Afinal, a última coisa que você precisa é de uma IA que adiciona mais bugs ao seu código, certo?
Há algum tempo, um leitor questionou minha abordagem, sugerindo que as IAs poderiam ter melhor desempenho com desafios diferentes. É um ponto válido, mas eu mantenho esses testes porque são diretos. Uso PHP e JavaScript, que não são as linguagens mais difíceis por aí, e executo algumas consultas de script através das IAs. Essa consistência nos permite comparar o desempenho diretamente.
Os testes incluem escrever um plugin simples para WordPress, reescrever uma função de string, encontrar um bug com o qual já lutei e usar ferramentas de programação para extrair dados do Chrome. É como ensinar alguém a dirigir — você não os deixaria soltos em uma rodovia se eles não conseguem nem sair da garagem.
Até hoje, apenas o LLM GPT-4 (e superior) do ChatGPT passou em todos esses testes. Curiosamente, o Perplexity Pro também teve sucesso, mas isso porque ele roda na série de LLMs GPT-4. Por outro lado, o Microsoft Copilot, apesar de usar o mesmo LLM, falhou em todos os testes.
O Gemini do Google não teve um desempenho muito melhor. Inicialmente, o Bard (o nome inicial do Gemini) falhou na maioria dos testes, e até o Gemini Advanced, que custa $20 por mês, falhou em três dos quatro testes no último ano.
Mas agora, o Google lançou o Gemini Pro 2.5, e ele é gratuito para todos, embora com limites de taxa. Eu atingi esses limites após apenas dois prompts durante meus testes, o que é um pouco restritivo. É possível que a limitação de taxa seja baseada na complexidade das tarefas, em vez do número de prompts. Meus dois primeiros pedidos foram para escrever um plugin completo para WordPress e corrigir um código, o que pode ter consumido meu limite mais rápido do que consultas mais simples.
Apesar da espera, os resultados foram surpreendentes e valeram a pena.
Teste 1: Escrever um plugin simples para WordPress
Desta vez, o Gemini Pro 2.5 arrasou. O desafio era criar um plugin para WordPress que fornecesse uma interface de usuário para randomizar linhas de entrada e distribuir duplicatas para que não ficassem adjacentes.
Anteriormente, o Gemini Advanced não criou um painel de administração, mas exigiu um shortcode no texto de uma página pública. Ele criou uma interface básica, mas clicar no botão não fazia nada. Não importava como eu ajustasse os prompts, ele ainda falhava.
Mas o Gemini Pro 2.5 entregou uma interface sólida, e o código funcionou como esperado. O que realmente me impressionou foi a escolha do ícone para o plugin. A maioria das IAs ignora esse detalhe, mas o Gemini Pro 2.5 escolheu um ícone relevante do conjunto de Dashicons do WordPress sem qualquer solicitação minha. O código estava bem documentado, com cada segmento principal explicado claramente.
Teste 2: Reescrever uma função de string
No segundo teste, pedi ao Gemini Pro 2.5 para modificar um código de processamento de strings para lidar com dólares e centavos, não apenas inteiros. O ChatGPT acertou isso, enquanto o Bard acabou conseguindo após falhas iniciais.
Da última vez, o Gemini Advanced falhou de maneira sutil, mas perigosa. Ele não permitia entradas não decimais e limitava incorretamente os números a dois dígitos antes do ponto decimal, entendendo mal o conceito de dólares e centavos. Esse tipo de erro poderia levar a uma enxurrada de relatórios de bugs se não fosse detectado.
O Gemini Pro 2.5, no entanto, acertou em cheio. Ele verificou corretamente os tipos de entrada, removeu espaços em branco, corrigiu a expressão regular para lidar com zeros à esquerda e entradas apenas decimais, e rejeitou entradas negativas. O código estava bem comentado, com um conjunto completo de exemplos de teste. Embora não permitisse vírgulas de agrupamento ou símbolos de moeda à frente, esses foram erros controlados, não falhas, então considero que passou.
Teste 3: Encontrar um bug
Uma vez, lutei com um bug no meu código que deveria funcionar, mas não funcionava. O problema era complicado, e enquanto eu estava focado no número de parâmetros sendo passados, o ChatGPT apontou que eu precisava mudar algo em um hook.
Tanto o Bard quanto o Meta erraram o alvo, seguindo o mesmo caminho inútil que eu. O Gemini Advanced, em fevereiro de 2024, sugeriu olhar "provavelmente em algum outro lugar no plugin ou no WordPress", o que não ajudou.
Com o Gemini Pro 2.5, atingi o limite de taxa após os dois primeiros testes, então tive que esperar até o dia seguinte. Quando finalmente executei o teste, o Gemini Pro 2.5 não só encontrou o bug, mas também me mostrou exatamente onde corrigi-lo, completo com um diagrama útil.
Teste 4: Escrever um script
O teste final envolve entender o modelo de objeto interno do Chrome, AppleScript e Keyboard Maestro, uma ferramenta de construção de macros. Trata-se de abrir abas do Chrome e definir a aba ativa com base em um parâmetro.
A maioria das IAs lida bem com as partes do Chrome e AppleScript, mas muitas vezes tem dificuldade com o Keyboard Maestro. O Gemini Pro 2.5, no entanto, acertou. Ele escreveu o código necessário para passar variáveis corretamente, adicionou verificação de erros e notificações ao usuário, e até forneceu passos para configurar o Keyboard Maestro.
Com todos os quatro testes aprovados, o Gemini Pro 2.5 se junta ao grupo de elite de ferramentas de IA que podem realmente ajudar com tarefas de programação.
Era apenas uma questão de tempo até que a IA do Google alcançasse as ofertas da OpenAI. O artigo de 2017 do Google, "Attention is all you need", deu início ao boom da IA generativa, então não é surpresa que eles tenham chegado a esse ponto. O Gemini Pro 2.5 é mais lento que o ChatGPT Plus, levando entre 15 segundos e um minuto para responder, mas a precisão é mais importante que a velocidade.
O Google também tornou o Google Code Assist gratuito com limites generosos, mas só é valioso se o código gerado for de alta qualidade. Com o Gemini Pro 2.5, essa qualidade agora é evidente. Embora atualmente marcado como "experimental", espero que o Google refine isso em breve, potencialmente oferecendo uma versão paga com menos limites de taxa.
Fica claro que o Gemini Pro 2.5 está pronto para desafiar o ChatGPT no campo da assistência em codificação. Estarei acompanhando de perto esse desenvolvimento e compartilhando mais atualizações em breve.




Just read about Gemini Pro 2.5 and wow, those coding tests sound intense! 😅 Curious if it’ll really outshine ChatGPT or just hype. Anyone tried it yet?




This AI coding battle is heating up! Gemini Pro 2.5 sounds like a beast, but I’m curious if it’s really outpacing ChatGPT or just hype. 🤔 Anyone tried it on real projects yet?




Gemini Pro 2.5は本当に強力!コーディングの助けにはChatGPTよりずっと優れてる。私のテストに通してみたら、完璧に合格したよ。唯一の欠点はちょっと高価なこと。でも、コーディングに本気なら、その価値はあるよ!💻




Gemini Pro 2.5 es una bestia. Es mucho mejor que ChatGPT para ayudar en la programación. Lo probé con mis tests y aprobó con honores. El único problema es que es un poco caro. Pero si te tomas en serio la programación, vale cada centavo! 💻




Gemini Pro 2.5 is a beast! It's way better than ChatGPT for coding help. I ran it through my tests and it passed with flying colors. Only downside? It's a bit pricey. But if you're serious about coding, it's worth every penny! 💻




ジェミニプロ2.5、コーディングの強力な助っ人だね!でも、バグ増やすAIは勘弁😅 テスト結果が気になる!












