opção
Lar
Notícias
Google afirma que o Gemini 2.5 Pro supera o DeepSeek R1 e o Grok 3 Beta em benchmarks de codificação

Google afirma que o Gemini 2.5 Pro supera o DeepSeek R1 e o Grok 3 Beta em benchmarks de codificação

24 de Outubro de 2025
1

O Google revelou uma prévia atualizada de seu principal modelo Gemini 2.5 Pro, inicialmente apresentado em março e aprimorado em maio. Essa iteração, descrita como a IA "mais inteligente" da empresa até o momento, está atualmente em pré-visualização, com planos de disponibilidade geral dentro de algumas semanas.

Agora, as empresas podem experimentar o desenvolvimento de novos aplicativos ou atualizar as implementações existentes usando a "edição I/O" atualizada do Gemini 2.5 Pro. De acordo com o anúncio oficial do Google, essa versão oferece respostas mais imaginativas e demonstra recursos superiores de programação e raciocínio lógico em comparação com as iterações anteriores.

Nossa última atualização do Gemini 2.5 Pro já está em pré-visualização.

Ela é melhor em codificação, raciocínio, ciências e matemática, apresenta desempenho aprimorado nos principais benchmarks (AIDER Polyglot, GPQA, HLE, para citar alguns) e lidera o @lmarena_ai com um salto de 24 pontos na pontuação Elo desde a versão anterior.

Nós também... pic.twitter.com/SVjdQ2k1tJ

- Sundar Pichai (@sundarpichai) 5 de junho de 2025

Em sua conferência de desenvolvedores em maio, o Google revelou aprimoramentos no Gemini 2.5 Pro que superaram o lançamento silencioso anterior. Demis Hassabis, CEO do Google DeepMind, destacou a edição de I/O como o modelo de codificação mais avançado da empresa até o momento.

Essa nova prévia, denominada Gemini 2.5 Pro Preview 06-05 Thinking, vai além dos recursos da edição de E/S. A próxima versão pública promete desempenho e escalabilidade de nível empresarial.

A edição original de E/S (gemini-2.5-pro-preview-05-06) tornou-se acessível a desenvolvedores e corporações em maio por meio do Google AI Studio e do Vertex AI. O Gemini 2.5 Pro Preview 06-05 Thinking aprimorado está disponível por meio desses mesmos canais.

Métricas de desempenho

Esse Gemini 2.5 Pro atualizado demonstra melhorias mensuráveis em relação ao seu antecessor.

O Google relatou um avanço de 24 pontos no LMArena e um ganho de 35 pontos no WebDevArena, onde ele agora lidera as classificações dos concorrentes. Testes comparativos revelaram um desempenho superior em relação a modelos como o3, o3-mini e o4-mini da OpenAI, Claude 4 Opus da Anthropic, Grok 3 Beta da xAI e DeepSeek R1.

"Também abordamos o feedback de nossas versões anteriores do 2.5 Pro, melhorando seu estilo e estrutura - ele pode ser mais criativo com respostas mais bem formatadas", afirmou o Google em seu anúncio.

O que as empresas podem esperar

Embora os aprimoramentos rápidos do Google Gemini 2.5 Pro possam parecer complexos, a empresa os posiciona como respostas diretas às sugestões dos usuários. A nova versão tem uma estrutura de preços de US$ 1,25 por milhão de tokens de entrada (sem armazenamento em cache) e US$ 10 por milhão de tokens de saída.

Quando o Gemini 2.5 Pro foi lançado em março, os observadores do setor o reconheceram como um modelo avançado subutilizado. Desde então, o Google incorporou a tecnologia em vários aplicativos, incluindo o recurso "Deep Think", que avalia várias hipóteses antes de gerar respostas.

O lançamento do Gemini 2.5 Pro e as atualizações subsequentes reforçaram a posição do Google no competitivo cenário de modelos de linguagem de grande porte, recuperando a atenção dos modelos de raciocínio rivais da DeepSeek e da OpenAI.

Poucas horas após o anúncio, os desenvolvedores começaram a testar o Gemini 2.5 Pro atualizado. As primeiras impressões confirmam as alegações do Google de desempenho acelerado, embora a avaliação abrangente de seus recursos aprimorados ainda esteja em andamento.

Primeira hora com o "Gemini 2.5 Pro Preview 06-05"

Pontos positivos:

- É mais rápido
- Produz mais resultados
- Tem uma melhor reprodução de macro (edições de vários arquivos, melhor visão geral)
- A estrutura de saída é melhor (legível)
- É mais conciso e MENOS APOLOGÉTICO!

Antes: "Você é absolutamente...

- Patrick Bade (@nishffx) 5 de junho de 2025

vocês cozinharam, estou gostando muito do criador de aplicativos.

Fiz um jogo e o testei, estava usando o imagen para criar recursos na hora... e ele está pronto, hospedado e fácil de compartilhar. Realmente o melhor construtor sem experiência e sem código até o momento.

continue construindo o vibe app marketplace, isso poderia...

- bone (@boneGPT) 5 de junho de 2025

O Gemini 2.5 Pro Preview é muito bom... usei-o ontem para uma pesquisa profunda e os resultados são melhores do que alguns dos grandes nomes...

- Janak (@janaks09) 5 de junho de 2025

Artigo relacionado
Google afirma que o Gemini 2.5 Pro supera o DeepSeek R1 e o Grok 3 Beta em benchmarks de codificação Google afirma que o Gemini 2.5 Pro supera o DeepSeek R1 e o Grok 3 Beta em benchmarks de codificação O Google revelou uma prévia atualizada de seu principal modelo Gemini 2.5 Pro, inicialmente apresentado em março e aprimorado em maio. Essa iteração, descrita como a IA "mais inteligente" da empresa a
Google apresenta 9 novos recursos interessantes no lançamento do aplicativo Home Google apresenta 9 novos recursos interessantes no lançamento do aplicativo Home Aplicativo Google Home revela grandes atualizações na visualização de 2025O Google aprimorou significativamente seu aplicativo Home com vários recursos inovadores atualmente disponíveis na visualizaçã
Chatbot do Google Gemini ganha recursos aprimorados de análise de projetos do GitHub Chatbot do Google Gemini ganha recursos aprimorados de análise de projetos do GitHub Gemini Advanced integra conectividade com o GitHubOs assinantes premium do Gemini Advanced do Google (US$ 20/mês) agora podem vincular diretamente os repositórios do GitHub ao assistente de IA a parti
Comentários (0)
0/200
De volta ao topo
OR