opção
Lar
Notícias
Google I/O 2024: Avelando inovações para a próxima geração

Google I/O 2024: Avelando inovações para a próxima geração

10 de Abril de 2025
103

Google está totalmente abraçando o que chamamos de era Gemini.

Antes de mergulhar nos detalhes, permita-me refletir por um momento sobre onde estamos. Há mais de uma década, investimos recursos em AI, expandindo os limites em pesquisa, desenvolvimento de produtos e infraestrutura. Hoje, vamos abordar tudo isso e mais.

Ainda estamos no início desta mudança de plataforma de AI, e o potencial é enorme — para criadores, desenvolvedores, startups e todos os outros. É disso que se trata a era Gemini: impulsionar essas oportunidades. Então, vamos direto ao ponto.

A era Gemini

No último ano, no I/O, revelamos nossa visão para o Gemini: um modelo de ponta projetado para ser nativamente multimodal desde o início, capaz de processar texto, imagens, vídeo, código e mais. É um salto significativo em direção à transformação de qualquer entrada em qualquer saída — um "I/O" para a próxima geração.

Desde então, lançamos os primeiros modelos Gemini, que estabeleceram novos padrões em desempenho multimodal. Apenas dois meses depois, apresentamos o Gemini 1.5 Pro, que trouxe um grande avanço no manejo de contextos longos. Ele pode gerenciar 1 milhão de tokens em produção, superando qualquer outro modelo de fundação em grande escala até o momento.

Estamos comprometidos em garantir que todos possam se beneficiar das capacidades do Gemini. Avançamos rapidamente para compartilhar esses avanços com vocês. Hoje, mais de 1,5 milhão de desenvolvedores estão usando modelos Gemini em nossas ferramentas, desde depuração de código até obtenção de novas percepções e construção da próxima onda de aplicações de AI.

Também estamos integrando os poderosos recursos do Gemini em nossos produtos de maneira significativa. Vocês verão exemplos hoje em Search, Photos, Workspace, Android e além.

Progresso dos produtos

Atualmente, todos os nossos produtos com 2 bilhões de usuários são alimentados pelo Gemini.

Também lançamos novas experiências, incluindo um aplicativo móvel onde você pode interagir diretamente com o Gemini, disponível tanto no Android quanto no iOS. E com o Gemini Advanced, você tem acesso aos nossos modelos mais avançados. Mais de 1 milhão de pessoas se inscreveram para experimentá-lo em apenas três meses, e o ímpeto continua crescendo.

Expandindo as Visões Gerais de AI no Search

Um dos desenvolvimentos mais emocionantes com o Gemini foi no Google Search.

No último ano, lidamos com bilhões de consultas por meio de nossa Experiência Gerativa de Busca. Os usuários estão explorando o Search de novas maneiras, fazendo perguntas mais longas e complexas, até usando fotos para buscar, e obtendo os melhores resultados que a web tem a oferecer.

Um dispositivo móvel limpo e moderno mostrando uma nova geração de resultados de busca para uma consulta sobre um sofá, com Visões Gerais de AI fornecendo uma resposta abrangente sobre o tecido e como limpar o sofá.

Testamos essa experiência além do Labs, e estamos entusiasmados em ver não apenas um aumento no uso do Search, mas também uma maior satisfação do usuário.

Estou animado para anunciar que começaremos a lançar essa experiência totalmente renovada, Visões Gerais de AI, para todos nos EUA esta semana, com mais países a seguir em breve.

Graças ao Gemini, estamos expandindo os limites do que é possível no Search, incluindo dentro de nossos próprios produtos.

Apresentando o Ask Photos

Tomemos o Google Photos, por exemplo, que lançamos há quase nove anos. Tornou-se uma referência para organizar as memórias mais preciosas da vida, com mais de 6 bilhões de fotos e vídeos enviados diariamente.

As pessoas adoram usar o Photos para pesquisar em suas vidas. Com o Gemini, estamos tornando isso ainda mais fácil.

Imagine que você está em uma estação de estacionamento e não consegue lembrar sua placa de carro. Antes, você teria que pesquisar no Photos com palavras-chave e rolar por anos de fotos para encontrá-la. Agora, você pode simplesmente perguntar ao Photos. Ele reconhece os carros que você usa frequentemente, descobre qual é o seu e fornece o número da placa.

O Ask Photos também pode ajudar você a mergulhar mais fundo em suas memórias. Digamos que você está relembrando os primeiros marcos de sua filha Lucia. Você pode perguntar ao Photos, "Quando Lucia aprendeu a nadar?"

Você pode então fazer uma pergunta mais complexa, como, "Mostre-me como a natação de Lucia progrediu."

Um dispositivo móvel mostrando uma série de fotos de uma garota, Lucia, em diferentes cenários de natação. A interface tem um prompt perguntando 'Como a natação de Lucia progrediu?' e uma resposta mostrando seu progresso.

Aqui, o Gemini vai além de uma busca simples, entendendo diferentes contextos — de voltas na piscina a mergulhos no oceano até o texto e datas em seus certificados de natação. O Photos então compila tudo em um resumo, permitindo que você reviva essas memórias incríveis. Estamos lançando o Ask Photos neste verão, com mais recursos a caminho.

Desbloqueando mais conhecimento com multimodalidade e contexto longo

A multimodalidade do Gemini é projetada para desbloquear conhecimento em vários formatos. É um modelo que entende e conecta diferentes tipos de entrada.

Essa abordagem expande os tipos de perguntas que podemos fazer e as respostas que recebemos. O contexto longo leva isso adiante, permitindo processar grandes quantidades de informação: centenas de páginas de texto, horas de áudio, uma hora de vídeo, repositórios de código inteiros, ou até 96 cardápios do Cheesecake Factory.

Para esses muitos cardápios, você precisaria de uma janela de contexto de um milhão de tokens, o que agora é possível com o Gemini 1.5 Pro. Os desenvolvedores estão usando isso de maneiras bem legais.

Um player do YouTube mostrando uma demonstração sobre como os desenvolvedores estão usando o Gemini 1.5 Pro com uma janela de contexto de um milhão de tokens.

Estamos lançando o Gemini 1.5 Pro com contexto longo em visualização nos últimos meses, fazendo melhorias de qualidade em tradução, codificação e raciocínio. Essas atualizações agora estão refletidas no modelo.

Estou entusiasmado em anunciar que estamos tornando esta versão aprimorada do Gemini 1.5 Pro disponível para todos os desenvolvedores globalmente. Além disso, o Gemini 1.5 Pro com 1 milhão de contexto agora está diretamente acessível para consumidores no Gemini Advanced, suportando 35 idiomas.

Expandindo para 2 milhões de tokens em visualização privada

Um milhão de tokens abriu novas possibilidades, mas não estamos parando por aí.

Hoje, estamos expandindo a janela de contexto para 2 milhões de tokens, disponível para desenvolvedores em visualização privada.

É incrível ver o quão longe chegamos em apenas alguns meses. Este é mais um passo em direção ao nosso objetivo final de contexto infinito.

Trazendo o Gemini 1.5 Pro para o Workspace

Discutimos dois avanços técnicos importantes: multimodalidade e contexto longo. Cada um é poderoso por si só, mas juntos, eles desbloqueiam capacidades e inteligência ainda mais profundas.

Isso é evidente no Google Workspace.

As pessoas frequentemente pesquisam seus e-mails no Gmail. Com o Gemini, estamos tornando isso muito mais poderoso. Por exemplo, como pai, você quer se manter atualizado sobre as atividades escolares de seu filho. O Gemini pode ajudar a acompanhar.

Você pode pedir ao Gemini para resumir e-mails recentes da escola. Nos bastidores, ele identifica e-mails relevantes e até analisa anexos como PDFs. Você recebe um resumo dos pontos principais e itens de ação. Se você perdeu a reunião do PTA porque estava viajando, e a gravação tem uma hora de duração, o Gemini pode destacar as partes importantes se for do Google Meet. Se houver uma chamada por voluntários e você estiver disponível, o Gemini pode redigir uma resposta para você.

Há inúmeras maneiras de isso simplificar sua vida. O Gemini 1.5 Pro está disponível hoje no Workspace Labs. Aparna compartilhará mais detalhes.

Saídas de áudio no NotebookLM

Vimos exemplos com saídas de texto, mas com um modelo multimodal, podemos fazer muito mais.

Estamos progredindo aqui, com mais por vir. As Visões Gerais de Áudio no NotebookLM demonstram isso. Ele usa o Gemini 1.5 Pro para gerar uma conversa de áudio personalizada e interativa a partir de seus materiais de origem.

Este é o potencial da multimodalidade. Em breve, você poderá misturar e combinar entradas e saídas. É isso que queremos dizer com um "I/O" para uma nova geração. Mas e se pudéssemos ir ainda mais longe?

Uma das oportunidades emocionantes que vemos é com Agentes de AI. Estes são sistemas inteligentes que podem raciocinar, planejar e lembrar. Eles podem pensar vários passos à frente e trabalhar em diferentes softwares e sistemas para realizar tarefas em seu nome, sempre sob sua supervisão.

Ainda estamos nos estágios iniciais, mas deixe-me dar uma ideia dos tipos de casos de uso em que estamos trabalhando.

Tomemos as compras, por exemplo. É divertido comprar sapatos, mas não tão divertido devolvê-los se não servirem.

Imagine se o Gemini pudesse cuidar de todos os passos para você:

  • Procurando o recibo na sua caixa de entrada...
  • Localizando o número do pedido no seu e-mail...
  • Preenchendo um formulário de devolução...
  • Até agendando uma coleta pela UPS.

Isso é muito mais fácil, certo?

Vamos considerar um cenário mais complexo. Digamos que você acabou de se mudar para Chicago. O Gemini e o Chrome podem trabalhar juntos para ajudá-lo a se estabelecer — organizando, raciocinando e sintetizando informações em seu nome.

Você vai querer explorar a cidade e encontrar serviços locais, de lavanderias a passeadores de cães. Você também precisará atualizar seu novo endereço em vários sites.

O Gemini pode gerenciar essas tarefas e pedirá mais informações quando necessário, garantindo que você sempre esteja no controle.

Isso é crucial — à medida que desenvolvemos essas experiências, estamos focados em privacidade, segurança e torná-las acessíveis a todos.

Estes são exemplos simples, mas ilustram os tipos de problemas que pretendemos resolver construindo sistemas inteligentes que pensam à frente, raciocinam e planejam em seu nome.

O que isso significa para nossa missão

O poder do Gemini — com sua multimodalidade, contexto longo e agentes — nos aproxima do nosso objetivo final: tornar a AI útil para todos.

É assim que faremos o maior progresso em direção à nossa missão: organizar as informações do mundo em todas as entradas, torná-las acessíveis por qualquer saída e combinar as informações do mundo com as informações do SEU mundo de uma maneira verdadeiramente útil.

Abrindo novos caminhos

Para realizar plenamente o potencial da AI, precisamos expandir os limites. A equipe do Google DeepMind tem trabalhado arduamente nisso.

Vimos muita empolgação em torno do 1.5 Pro e sua janela de contexto longo. Mas os desenvolvedores também queriam algo mais rápido e econômico. Então, amanhã, estamos apresentando o Gemini 1.5 Flash, um modelo mais leve projetado para escala. Ele é otimizado para tarefas onde baixa latência e custo são cruciais. O 1.5 Flash estará disponível no AI Studio e no Vertex AI na terça-feira.

Olhando para o futuro, sempre quisemos construir um agente universal útil no dia a dia. O Projeto Astra demonstra entendimento multimodal e capacidades conversacionais em tempo real.

Um player do YouTube mostrando uma demonstração de um protótipo de agente de AI suportado por nosso modelo de fundação multimodal, que interage com um testador em tempo real.

Também fizemos avanços em geração de vídeo e imagem com Veo e Imagen 3, e apresentamos o Gemma 2.0, nossa próxima geração de modelos abertos para inovação responsável em AI. Você pode ler mais de Demis Hassabis.

Infraestrutura para a era da AI: Apresentando o Trillium

Treinar modelos de ponta requer muita potência computacional. A demanda por computação de ML cresceu por um fator de 1 milhão nos últimos seis anos, e aumenta dez vezes a cada ano.

O Google foi construído para isso. Por 25 anos, investimos em infraestrutura técnica de classe mundial, do hardware de ponta que alimenta o Search às nossas unidades de processamento de tensores personalizadas que impulsionam nossos avanços em AI.

O Gemini foi treinado e servido inteiramente em nossas TPUs de quarta e quinta geração. Outras empresas líderes em AI, incluindo a Anthropic, também treinaram seus modelos em nossas TPUs.

Hoje, estamos entusiasmados em anunciar nossa 6ª geração de TPUs, chamada Trillium. O Trillium é nosso TPU mais eficiente e de maior desempenho até o momento, entregando uma melhoria de 4,7x no desempenho computacional por chip em relação à geração anterior, TPU v5e.

Disponibilizaremos o Trillium para nossos clientes de Cloud no final de 2024.

Ao lado de nossas TPUs, estamos orgulhosos de oferecer CPUs e GPUs para suportar qualquer carga de trabalho. Isso inclui os novos processadores Axion que anunciamos no último mês, nossa primeira CPU baseada em Arm personalizada que oferece desempenho e eficiência energética líderes na indústria.

Também somos um dos primeiros provedores de Cloud a oferecer as GPUs Blackwell de ponta da Nvidia, disponíveis no início de 2025. Nossa parceria de longa data com a NVIDIA nos permite trazer as capacidades inovadoras do Blackwell para nossos clientes.

Os chips são uma parte fundamental do nosso sistema integrado de ponta a ponta, do hardware otimizado para desempenho e software aberto a modelos de consumo flexíveis. Tudo isso se reúne em nosso AI Hypercomputer, uma arquitetura de supercomputador inovadora.

Empresas e desenvolvedores estão usando-o para enfrentar desafios mais complexos, com mais de duas vezes a eficiência em comparação com apenas comprar o hardware e os chips brutos. Os avanços do nosso AI Hypercomputer são possíveis, em parte, por causa da nossa abordagem de resfriamento líquido em nossos data centers.

Fazemos isso há quase uma década, muito antes de se tornar o estado da arte para a indústria. Hoje, nossa capacidade total de frota implantada para sistemas de resfriamento líquido é de quase 1 gigawatt e está crescendo — isso é cerca de 70 vezes a capacidade de qualquer outra frota.

Subjacente a isso está a escala pura da nossa rede, que conecta nossa infraestrutura globalmente. Nossa rede abrange mais de 2 milhões de milhas de fibra terrestre e submarina: mais de 10 vezes o alcance do próximo provedor de nuvem líder.

Continuaremos fazendo os investimentos necessários para avançar a inovação em AI e entregar capacidades de ponta.

Uma linha do tempo animada mostrando a progressão das TPUs ao longo do tempo, com uma nova geração de TPUs sendo apresentada.

O capítulo mais emocionante do Search até agora

Uma das nossas maiores áreas de investimento e inovação está em nosso produto fundador, o Search. Há 25 anos, criamos o Search para ajudar as pessoas a navegar pelo fluxo de informações que se movem online.

Com cada mudança de plataforma, entregamos avanços para responder melhor às suas perguntas. No celular, desbloqueamos novos tipos de perguntas e respostas — usando melhor contexto, reconhecimento de localização e informações em tempo real. Com avanços no entendimento de linguagem natural e visão computacional, habilitamos novas maneiras de buscar, como usar sua voz ou cantarolar para encontrar sua nova música favorita, ou usar uma imagem daquela flor que você viu na sua caminhada. E agora você pode até Cercar para Buscar aqueles sapatos novos e legais que você pode querer comprar. Vá em frente, você sempre pode devolvê-los!

É claro que o Search na Era Gemini levará isso a um nível totalmente novo, combinando nossas forças de infraestrutura, as últimas capacidades de AI, nossos altos padrões para qualidade de informação e nossas décadas de experiência conectando você à riqueza da web. O resultado é um produto que faz o trabalho por você.

O Google Search é AI generativa na escala da curiosidade humana. E é o nosso capítulo mais emocionante do Search até agora. Leia mais sobre a era Gemini do Search com Liz Reid.

Experiências Gemini mais inteligentes

O Gemini é mais do que apenas um chatbot; ele é projetado para ser seu assistente pessoal útil que pode realizar tarefas complexas e agir em seu nome.

Interagir com o Gemini deve parecer conversacional e intuitivo. Então, estamos anunciando uma nova experiência Gemini chamada Live, que permite que você tenha uma conversa aprofundada com o Gemini usando sua voz. Também traremos 2M tokens para o Gemini Advanced ainda este ano, tornando possível carregar e analisar arquivos super densos como vídeo e código longo. Sissie Hsiao compartilha mais detalhes.

Gemini no Android

Com bilhões de usuários de Android em todo o mundo, estamos entusiasmados em integrar o Gemini mais profundamente na experiência do usuário. Como seu novo assistente de AI, o Gemini está aqui para ajudar você a qualquer hora, em qualquer lugar. Incorporamos modelos Gemini no Android, incluindo nosso último modelo no dispositivo: Gemini Nano com Multimodalidade, que processa texto, imagens, áudio e fala para desbloquear novas experiências enquanto mantém as informações privadas no seu dispositivo. Sameer Samat compartilha as novidades do Android aqui.

Nossa abordagem responsável para AI

Continuamos a abordar a oportunidade de AI com ousadia, com um senso de empolgação. Também estamos garantindo que o façamos de maneira responsável. Estamos desenvolvendo uma técnica de ponta chamada red teaming assistido por AI, que se baseia nos avanços em jogos do Google DeepMind, como o AlphaGo, para melhorar nossos modelos. Além disso, expandimos o SynthID, nossa ferramenta de marca d'água que facilita a identificação de conteúdo gerado por AI, para duas novas modalidades: texto e vídeo. James Manyika compartilha mais.

Criando o futuro juntos

Tudo isso mostra o progresso importante que estamos fazendo ao adotar uma abordagem ousada e responsável para tornar a AI útil para todos.

Somos AI-first em nossa abordagem há muito tempo. Nossas décadas de liderança em pesquisa pioneiraram muitos dos avanços modernos que impulsionam o progresso da AI, para nós e para a indústria. Além disso, temos:

  • Infraestrutura líder mundial construída para a era da AI
  • Inovação de ponta no Search, agora alimentado pelo Gemini
  • Produtos que ajudam em escala extraordinária — incluindo 15 produtos com meio bilhão de usuários
  • E plataformas que permitem que todos — parceiros, clientes, criadores e todos vocês — inventem o futuro.

Esse progresso só é possível por causa da nossa incrível comunidade de desenvolvedores. Vocês estão tornando isso real, por meio das experiências e aplicações que constroem todos os dias. Então, para todos aqui em Shoreline e os milhões a mais assistindo ao redor do mundo, aqui está às possibilidades à frente e a criá-las juntos.

Uma grade preenchida com cores arco-íris, linhas curvas e retângulos, dando um visual moderno e vibrante. Tudo o que anunciamos no Google I/O e mais.

Receba mais histórias do Google na sua caixa de entrada.

Endereço de e-mailSuas informações serão usadas de acordo com a política de privacidade do Google.

Inscrever-seConcluído. Apenas mais um passo.

Verifique sua caixa de entrada para confirmar sua inscrição.

Você já está inscrito em nossa newsletter.

Você também pode se inscrever com um endereço de e-mail diferente.

Artigo relacionado
Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot A Salesforce lançou uma nova estratégia de IA para o local de trabalho, introduzindo “companheiros digitais” especializados integrados às conversas do Slack, revelou a empresa na segunda-feira.A nova
Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas A Oracle planeja investir aproximadamente US$ 40 bilhões em chips Nvidia para alimentar um grande novo centro de dados no Texas, desenvolvido pela OpenAI, conforme relatado pelo Financial Times. Este
Aplicativo Meta AI Introduzirá Nível Premium e Anúncios Aplicativo Meta AI Introduzirá Nível Premium e Anúncios O aplicativo de IA da Meta pode em breve apresentar uma assinatura paga, seguindo o exemplo de concorrentes como OpenAI, Google e Microsoft. Durante uma teleconferência de resultados do primeiro trime
Comentários (27)
0/200
FredGreen
FredGreen 21 de Agosto de 2025 à19 08:01:19 WEST

Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎

TimothyHernández
TimothyHernández 8 de Agosto de 2025 à59 14:00:59 WEST

Wow, Google's AI push at I/O 2024 sounds massive! The Gemini era feels like sci-fi coming to life. Curious how it’ll stack up against competitors. 😎

AlbertRodriguez
AlbertRodriguez 24 de Abril de 2025 à43 23:33:43 WEST

Google I/O 2024 foi incrível! A era Gemini parece ser o futuro que estávamos esperando. Eles têm trabalhado em IA por tanto tempo e finalmente está dando frutos. Mal posso esperar para ver o que vem a seguir! 🚀

StevenNelson
StevenNelson 24 de Abril de 2025 à4 07:18:04 WEST

Google I/O 2024は本当に衝撃的だった!ジェミニ時代は待ち望んでいた未来そのものだね。彼らがAIにどれだけ投資してきたかを見ると、次に何が来るのか楽しみで仕方ないよ!🚀

MatthewGonzalez
MatthewGonzalez 23 de Abril de 2025 à25 17:59:25 WEST

O Google I/O 2024 foi incrível! A era Gemini parece o futuro que estávamos esperando. É legal ver quanto eles investiram em IA ao longo dos anos. Mal posso esperar para ver o que vem por aí! 🚀

ScottWalker
ScottWalker 22 de Abril de 2025 à29 13:54:29 WEST

Google I/O 2024 was mind-blowing! The Gemini era sounds like the future we've been waiting for. They've been working on AI for so long, and it's finally paying off. Can't wait to see what they come up with next! 🚀

De volta ao topo
OR