opção
Lar
Notícias
Gêmeos revela o modelo aprimorado, contexto estendido, agentes de IA

Gêmeos revela o modelo aprimorado, contexto estendido, agentes de IA

10 de Abril de 2025
149

Em dezembro, lançamos nosso primeiro modelo multimodal nativo, Gemini 1.0, disponível em três tamanhos: Ultra, Pro e Nano. Avançando alguns meses, apresentamos o 1.5 Pro, com desempenho aprimorado e uma janela de contexto longa e inovadora de 1 milhão de tokens.

Desenvolvedores e clientes empresariais têm aproveitado o 1.5 Pro de maneiras incríveis, valorizando sua janela de contexto longa, raciocínio multimodal robusto e desempenho geral excepcional.

O feedback dos usuários destacou a necessidade de modelos com menor latência e custo, o que nos incentivou a continuar inovando. Por isso, estamos empolgados em apresentar o Gemini 1.5 Flash hoje. Este modelo é mais leve que o 1.5 Pro, projetado para ser rápido e eficiente, e perfeito para escalabilidade.

Tanto o 1.5 Pro quanto o 1.5 Flash estão agora em visualização pública, com uma janela de contexto de 1 milhão de tokens, acessível pelo Google AI Studio e Vertex AI. E para aqueles que precisam de ainda mais, o 1.5 Pro agora oferece uma janela de contexto de 2 milhões de tokens, disponível por lista de espera para desenvolvedores usando a API e clientes do Google Cloud.

Não estamos parando por aí. Também estamos lançando atualizações em toda a família Gemini, apresentando nossa próxima geração de modelos abertos, Gemma 2, e avançando no futuro dos assistentes de IA com o Project Astra.

Comprimentos de contexto de modelos de fundação líderes comparados com a capacidade de 2 milhões de tokens do Gemini 1.5

Atualizações da família de modelos Gemini

O novo 1.5 Flash, otimizado para velocidade e eficiência

Apresentando o 1.5 Flash, o membro mais recente e rápido da família Gemini, servido por nossa API. Ele é projetado para tarefas de alto volume e alta frequência, oferecendo escalabilidade econômica enquanto mantém nossa inovação na janela de contexto longa.

Embora mais leve que o 1.5 Pro, o 1.5 Flash não deixa a desejar. Ele se destaca em raciocínio multimodal em grandes conjuntos de dados, oferecendo qualidade impressionante em relação ao seu tamanho.

O novo modelo Gemini 1.5 Flash é otimizado para velocidade e eficiência, é altamente capaz de raciocínio multimodal e apresenta nossa inovadora janela de contexto longa.

O 1.5 Flash brilha em tarefas como resumo, aplicativos de chat e legendagem de imagens e vídeos. Ele também é hábil na extração de dados de documentos longos e tabelas. Essa versatilidade vem de ser treinado pelo 1.5 Pro por meio de "destilação", onde o conhecimento e as habilidades principais de um modelo maior são transferidos para um modelo menor e mais eficiente.

Para mais detalhes sobre o 1.5 Flash, confira nosso relatório técnico atualizado do Gemini 1.5, a página de tecnologia Gemini e saiba mais sobre sua disponibilidade e preços.

Melhorias significativas no 1.5 Pro

Nos últimos meses, fizemos avanços significativos na melhoria do 1.5 Pro, nosso principal desempenho em uma ampla gama de tarefas.

Expandimos sua janela de contexto para 2 milhões de tokens e melhoramos suas capacidades em geração de código, raciocínio lógico, planejamento, conversas de múltiplas rodadas e entendimento de áudio e imagens. Essas melhorias são respaldadas por avanços em dados e algoritmos, mostrando melhorias notáveis em benchmarks públicos e internos.

O 1.5 Pro agora lida com instruções cada vez mais complexas e nuances, incluindo aquelas que definem comportamentos em nível de produto, como papel, formato e estilo. Refinamos o controle sobre as respostas do modelo para casos de uso específicos, como personalizar personas de agentes de chat ou automatizar fluxos de trabalho com várias chamadas de função. Os usuários agora podem direcionar o comportamento do modelo com instruções do sistema.

Também adicionamos entendimento de áudio à API Gemini e ao Google AI Studio, permitindo que o 1.5 Pro processe imagens e áudio de vídeos enviados ao Google AI Studio. Estamos integrando o 1.5 Pro em produtos do Google, como Gemini Advanced e aplicativos do Workspace.

Para mais informações sobre o 1.5 Pro, confira nosso relatório técnico atualizado do Gemini 1.5 e a página de tecnologia Gemini.

Gemini Nano entende entradas multimodais

O Gemini Nano está elevando seu nível, indo além de entradas apenas de texto para incluir imagens. Começando com o Pixel, aplicativos que usam o Gemini Nano com Multimodalidade poderão interpretar o mundo de maneira mais humana, por meio de texto, visuais, som e linguagem falada.

Saiba mais sobre o Gemini 1.0 Nano no Android.

Próxima geração de modelos abertos

Hoje, também estamos atualizando o Gemma, nossa família de modelos abertos, que são construídos com a mesma pesquisa e tecnologia dos modelos Gemini.

Estamos lançando o Gemma 2, nossos modelos abertos de próxima geração para inovação responsável em IA. O Gemma 2 apresenta uma nova arquitetura para desempenho e eficiência superiores, e estará disponível em novos tamanhos.

A família Gemma está crescendo com o PaliGemma, nosso primeiro modelo de visão-linguagem inspirado no PaLI-3. Também atualizamos nosso Kit de Ferramentas de IA Generativa Responsável com o LLM Comparator para avaliar a qualidade das respostas do modelo.

Para mais detalhes, acesse o blog do Desenvolvedor.

Progresso no desenvolvimento de agentes de IA universais

No Google DeepMind, nossa missão é construir IA de forma responsável para beneficiar a humanidade. Sempre buscamos criar agentes de IA universais que possam ajudar na vida cotidiana. Por isso, estamos compartilhando nosso progresso no futuro dos assistentes de IA com o Project Astra (agente responsivo avançado de visão e fala).

Para que um agente de IA seja verdadeiramente útil, ele precisa entender e reagir ao mundo como um humano, absorvendo e lembrando o que vê e ouve para compreender o contexto e agir de acordo. Ele também deve ser proativo, ensinável e pessoal, permitindo conversas naturais e sem atrasos.

Embora tenhamos feito grandes avanços no processamento de informações multimodais, alcançar tempos de resposta conversacional é um desafio de engenharia difícil. Ao longo dos anos, refinamos como nossos modelos percebem, raciocinam e conversam para tornar as interações mais naturais.

Com base no Gemini, desenvolvemos agentes protótipos que processam informações mais rapidamente ao codificar continuamente quadros de vídeo, mesclando entradas de vídeo e fala em uma linha do tempo de eventos e armazenando esses dados em cache para recuperação rápida.

Usando nossos modelos de fala de ponta, também melhoramos o som desses agentes, dando-lhes uma gama mais ampla de entonações. Eles podem entender melhor o contexto em que estão e responder rapidamente em conversas.

Com essa tecnologia, é fácil imaginar um futuro onde todos tenham um assistente de IA especializado ao seu lado, acessível por meio de um telefone ou óculos. Algumas dessas capacidades chegarão aos produtos do Google, como o aplicativo Gemini e a experiência na web, ainda este ano.

Exploração contínua

Avançamos muito com nossa família de modelos Gemini, e estamos comprometidos em ultrapassar os limites ainda mais. Por meio de inovação contínua, estamos explorando novas fronteiras enquanto desbloqueamos novos casos de uso emocionantes para o Gemini.

Para saber mais sobre o Gemini e suas capacidades, confira nossos recursos.

Receba mais histórias do Google na sua caixa de entrada. Receba mais histórias do Google na sua caixa de entrada.

Endereço de e-mail Suas informações serão usadas de acordo com a política de privacidade do Google.

Inscreva-seConcluído. Apenas mais um passo.

Verifique sua caixa de entrada para confirmar sua inscrição.

Você já está inscrito em nossa newsletter.

Você também pode se inscrever com um endereço de e-mail diferente.

Artigo relacionado
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física A Kakao Mobility planeja desenvolver tecnologias de direção autônoma de nível 4 internamente, como parte de sua estratégia de IA física.Na conferência World IT Show 2026, realizada no COEX, em Seul,
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
Recomendações de tópicos especiais relacionados
Negócios Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas
Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas
xix.ai
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
chatbot Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real
Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas
xix.ai
Comentários (26)
0/500
GregoryWilson
GregoryWilson 27 de Abril de 2026 à25 21:00:25 WEST

Geminiの進化がすごいですね!長いコンテキストウィンドウは実用的なAIエージェント開発に革命をもたらしそう。でも、競争激化で倫理的なガイドラインが追いついてるか少し心配。🤔 個人的には、もっと小さなプロジェクトでも使える軽量版が早く出てくると嬉しいな。

LucasWalker
LucasWalker 18 de Abril de 2025 à58 22:37:58 WEST

ジェミニの新しいモデルが100万トークンのコンテキストを持つとは信じられない!🤯 まるで何でも扱える超賢いAIを持っているようです。AIエージェントもゲームチェンジャーです。次に何を出すのか楽しみです!🚀

FrankSmith
FrankSmith 16 de Abril de 2025 à56 01:37:56 WEST

젬니니의 새로운 모델 정말 멋지네요! 100만 토큰의 컨텍스트 윈도우는 정말 놀랍습니다. 마치 모든 대화를 기억하는 똑똑한 친구가 있는 것 같아요! 조금 더 빨랐으면 좋겠지만, 뭐 다 가질 수는 없죠? 🤓

JamesMiller
JamesMiller 15 de Abril de 2025 à33 18:53:33 WEST

O novo modelo do Gemini é bem legal! A janela de contexto de 1 milhão de tokens é louca, é como ter um amigo superinteligente que lembra de tudo o que você já disse! Só queria que fosse um pouco mais rápido, mas, ei, não dá pra ter tudo, né? 🤓

MarkRoberts
MarkRoberts 15 de Abril de 2025 à31 02:25:31 WEST

El nuevo modelo Gemini es impresionante, especialmente la ventana de contexto larga. Es genial para desarrolladores, pero puede ser un poco abrumador para principiantes. Los agentes de IA son geniales, pero desearía que hubiera más documentación sobre cómo usarlos de manera efectiva.

BillyGarcia
BillyGarcia 14 de Abril de 2025 à8 20:20:08 WEST

O novo modelo do Gemini com um contexto de um milhão de tokens é loucura! 🤯 É como ter uma IA super inteligente que pode lidar com qualquer coisa. Os agentes de IA também são um divisor de águas. Mal posso esperar para ver o que eles vão lançar a seguir! 🚀

OR