opção
Lar
Notícias
Google afirma que o Gemini 2.5 Pro supera o DeepSeek R1 e o Grok 3 Beta em benchmarks de codificação

Google afirma que o Gemini 2.5 Pro supera o DeepSeek R1 e o Grok 3 Beta em benchmarks de codificação

24 de Outubro de 2025
110

O Google revelou uma prévia atualizada de seu principal modelo Gemini 2.5 Pro, inicialmente apresentado em março e aprimorado em maio. Essa iteração, descrita como a IA "mais inteligente" da empresa até o momento, está atualmente em pré-visualização, com planos de disponibilidade geral dentro de algumas semanas.

Agora, as empresas podem experimentar o desenvolvimento de novos aplicativos ou atualizar as implementações existentes usando a "edição I/O" atualizada do Gemini 2.5 Pro. De acordo com o anúncio oficial do Google, essa versão oferece respostas mais imaginativas e demonstra recursos superiores de programação e raciocínio lógico em comparação com as iterações anteriores.

Nossa última atualização do Gemini 2.5 Pro já está em pré-visualização.

Ela é melhor em codificação, raciocínio, ciências e matemática, apresenta desempenho aprimorado nos principais benchmarks (AIDER Polyglot, GPQA, HLE, para citar alguns) e lidera o @lmarena_ai com um salto de 24 pontos na pontuação Elo desde a versão anterior.

Nós também... pic.twitter.com/SVjdQ2k1tJ

- Sundar Pichai (@sundarpichai) 5 de junho de 2025

Em sua conferência de desenvolvedores em maio, o Google revelou aprimoramentos no Gemini 2.5 Pro que superaram o lançamento silencioso anterior. Demis Hassabis, CEO do Google DeepMind, destacou a edição de I/O como o modelo de codificação mais avançado da empresa até o momento.

Essa nova prévia, denominada Gemini 2.5 Pro Preview 06-05 Thinking, vai além dos recursos da edição de E/S. A próxima versão pública promete desempenho e escalabilidade de nível empresarial.

A edição original de E/S (gemini-2.5-pro-preview-05-06) tornou-se acessível a desenvolvedores e corporações em maio por meio do Google AI Studio e do Vertex AI. O Gemini 2.5 Pro Preview 06-05 Thinking aprimorado está disponível por meio desses mesmos canais.

Métricas de desempenho

Esse Gemini 2.5 Pro atualizado demonstra melhorias mensuráveis em relação ao seu antecessor.

O Google relatou um avanço de 24 pontos no LMArena e um ganho de 35 pontos no WebDevArena, onde ele agora lidera as classificações dos concorrentes. Testes comparativos revelaram um desempenho superior em relação a modelos como o3, o3-mini e o4-mini da OpenAI, Claude 4 Opus da Anthropic, Grok 3 Beta da xAI e DeepSeek R1.

"Também abordamos o feedback de nossas versões anteriores do 2.5 Pro, melhorando seu estilo e estrutura - ele pode ser mais criativo com respostas mais bem formatadas", afirmou o Google em seu anúncio.

O que as empresas podem esperar

Embora os aprimoramentos rápidos do Google Gemini 2.5 Pro possam parecer complexos, a empresa os posiciona como respostas diretas às sugestões dos usuários. A nova versão tem uma estrutura de preços de US$ 1,25 por milhão de tokens de entrada (sem armazenamento em cache) e US$ 10 por milhão de tokens de saída.

Quando o Gemini 2.5 Pro foi lançado em março, os observadores do setor o reconheceram como um modelo avançado subutilizado. Desde então, o Google incorporou a tecnologia em vários aplicativos, incluindo o recurso "Deep Think", que avalia várias hipóteses antes de gerar respostas.

O lançamento do Gemini 2.5 Pro e as atualizações subsequentes reforçaram a posição do Google no competitivo cenário de modelos de linguagem de grande porte, recuperando a atenção dos modelos de raciocínio rivais da DeepSeek e da OpenAI.

Poucas horas após o anúncio, os desenvolvedores começaram a testar o Gemini 2.5 Pro atualizado. As primeiras impressões confirmam as alegações do Google de desempenho acelerado, embora a avaliação abrangente de seus recursos aprimorados ainda esteja em andamento.

Primeira hora com o "Gemini 2.5 Pro Preview 06-05"

Pontos positivos:

- É mais rápido
- Produz mais resultados
- Tem uma melhor reprodução de macro (edições de vários arquivos, melhor visão geral)
- A estrutura de saída é melhor (legível)
- É mais conciso e MENOS APOLOGÉTICO!

Antes: "Você é absolutamente...

- Patrick Bade (@nishffx) 5 de junho de 2025

vocês cozinharam, estou gostando muito do criador de aplicativos.

Fiz um jogo e o testei, estava usando o imagen para criar recursos na hora... e ele está pronto, hospedado e fácil de compartilhar. Realmente o melhor construtor sem experiência e sem código até o momento.

continue construindo o vibe app marketplace, isso poderia...

- bone (@boneGPT) 5 de junho de 2025

O Gemini 2.5 Pro Preview é muito bom... usei-o ontem para uma pesquisa profunda e os resultados são melhores do que alguns dos grandes nomes...

- Janak (@janaks09) 5 de junho de 2025

Artigo relacionado
O Google lança o Gemini no Chrome na Índia O Google lança o Gemini no Chrome na Índia Na quarta-feira, o Google anunciou que está expandindo a integração do Gemini com o Chrome para novas regiões, incluindo Índia, Canadá e Nova Zelândia. Essa implementação permite que os usuários de co
O YouTube amplia a detecção de deepfakes por IA para políticos, autoridades governamentais e jornalistas O YouTube amplia a detecção de deepfakes por IA para políticos, autoridades governamentais e jornalistas Na terça-feira, o YouTube anunciou que está expandindo sua tecnologia de detecção de deepfakes para um grupo seleto de autoridades governamentais, candidatos políticos e jornalistas. A ferramenta iden
YouTube testa recurso de pesquisa baseado em IA com respostas guiadas YouTube testa recurso de pesquisa baseado em IA com respostas guiadas Muitos usuários recorrem ao YouTube quando procuram receitas ou planos de viagem, em busca de vídeos relevantes. Agora, a plataforma está lançando uma ferramenta de pesquisa interativa baseada em IA q
Recomendações de tópicos especiais relacionados
Criação de quadrinhos Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia
Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia

Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!

15 ferramentas
xix.ai
Negócios Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas
Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas
xix.ai
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
Comentários (1)
0/500
JohnYoung
JohnYoung 17 de Maio de 2026 à11 01:00:11 WEST

Interesting to see Google claiming coding benchmark wins, but I'm curious about real-world dev experience. Does it handle messy legacy codebases as well as it does clean competition problems? The 'most intelligent' tag feels a bit marketing-heavy until we see more hands-on results. 🤔

OR