O Google revela o modelo eficiente de gêmeos ai

Lar

Notícias

22 de Abril de 2025

JasonKing

111

# Gemini # Google

O Google revela o modelo eficiente de gêmeos ai

O Google está pronto para lançar um novo modelo de IA, Gemini 2.5 Flash, que promete desempenho robusto enquanto prioriza eficiência. Este modelo será integrado ao Vertex AI, a plataforma do Google para desenvolvimento de IA. Segundo o Google, o Gemini 2.5 Flash oferece capacidades computacionais "dinâmicas e controláveis", permitindo que desenvolvedores ajustem os tempos de processamento de acordo com a complexidade de suas consultas.

Em um post de blog compartilhado com o TechCrunch, o Google afirmou, "Você pode ajustar o equilíbrio entre velocidade, precisão e custo para suas necessidades específicas. Essa flexibilidade é essencial para otimizar o desempenho do Flash em aplicações de alto volume e sensíveis a custos." Essa abordagem vem em um momento em que os custos associados a modelos de IA de ponta estão aumentando. Modelos como o Gemini 2.5 Flash, que são mais acessíveis enquanto ainda oferecem desempenho sólido, servem como uma alternativa atraente a opções mais caras, embora com uma pequena troca em precisão.

O Gemini 2.5 Flash é categorizado como um modelo de "raciocínio", semelhante ao o3-mini da OpenAI e ao R1 da DeepSeek. Esses modelos demoram um pouco mais para responder, pois verificam a veracidade de suas respostas, garantindo confiabilidade. O Google destaca que o 2.5 Flash é particularmente adequado para aplicações de "alto volume" e "tempo real", como atendimento ao cliente e análise de documentos.

O Google descreve o 2.5 Flash como um "modelo de trabalho pesado" em seu post de blog, afirmando, "Ele é otimizado especificamente para baixa latência e custo reduzido. É o motor ideal para assistentes virtuais responsivos e ferramentas de resumo em tempo real onde a eficiência em escala é crucial." No entanto, o Google não divulgou um relatório de segurança ou técnico para este modelo, o que torna mais difícil identificar seus pontos fortes e fracos. A empresa havia mencionado anteriormente ao TechCrunch que não emite relatórios para modelos que considera "experimentais."

Na quarta-feira, o Google também revelou planos para estender os modelos Gemini, incluindo o 2.5 Flash, para ambientes locais a partir do terceiro trimestre. Esses modelos estarão disponíveis no Google Distributed Cloud (GDC), a solução local do Google projetada para clientes com necessidades rigorosas de governança de dados. O Google está colaborando com a Nvidia para tornar os modelos Gemini compatíveis com sistemas Nvidia Blackwell conformes com GDC, que os clientes podem comprar diretamente do Google ou por outros canais preferidos.

Artigo relacionado

Google relança o 'Pergunte às fotos' com IA e recursos de velocidade aprimorados Após uma interrupção temporária nos testes, o Google está relançando a funcionalidade de pesquisa "Pergunte às fotos", orientada por IA, no Google Fotos, com melhorias significativas. Desenvolvido pel

Google AI Ultra revelado: Assinatura Premium com preço mensal de US$ 249,99 Google revela assinatura premium do AI UltraNo Google I/O 2025, a gigante da tecnologia anunciou seu novo e abrangente serviço de assinatura de IA - o Google AI Ultra. Com um preço mensal de US$ 249,9

Estudo da Microsoft revela que mais tokens de IA aumentam os erros de raciocínio Insights emergentes sobre a eficiência do raciocínio do LLMUma nova pesquisa da Microsoft demonstra que as técnicas avançadas de raciocínio em modelos de linguagem grandes não produzem melhorias unifo

Comentários (2)

0/200

Enviar

AnthonyMiller

21 de Agosto de 2025 à21 00:01:21 WEST

Google's Gemini 2.5 Flash sounds like a game-changer for efficient AI! Excited to see how it stacks up against other models in real-world apps. 🚀

ChristopherThomas

14 de Agosto de 2025 à7 19:01:07 WEST

Google's Gemini 2.5 Flash sounds like a game-changer for efficient AI! I'm curious how its 'dynamic' computing stacks up against others. Anyone tried it on Vertex AI yet? 🤔

Principais notícias

Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro agora ilimitado e mais barato que Claude, GPT-4o Dublagem AI: Guia Definitivo para Criação de Voz Realista A IA de Cambium transforma a madeira desperdiçada em madeira serrada AI Builder e Power Automate Revolucionam a Sumarização de Documentos O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Como garantir que seus dados sejam confiáveis para a integração de IA Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia O Google utiliza a IA para suspender mais de 39 milhões de contas de anúncios por suspeita de fraude

Mais

Apresentou