"8 novos produtos e atualizações de IA testados"

No I/O, não apenas apresentamos uma lista de atualizações como novos modelos Gemini, agentes de IA e ajustes no Android — nós realmente permitimos que desenvolvedores, jornalistas e parceiros mergulhem na ação com demonstrações práticas dos produtos. Este ano, passei o dia no Shoreline Amphitheatre, onde o I/O acontece, e pude conferir várias dessas demonstrações. Aqui está um resumo de algumas delas.
Minha primeira demonstração do dia foi bem legal. Eu vi o Gemini Advanced lidar com um contrato de aluguel de mais de 20 páginas, cheio de jargões jurídicos e cláusulas complicadas. Depois que ele processou o documento, eu podia fazer perguntas sobre ele, como se meu locador permitiria um cachorro de estimação ou se havia taxas extras que eu precisaria pagar. Já estou ansioso para usar esse recurso para entender meu próximo contrato quando meu apartamento estiver para renovação.
Em seguida, a demonstração ficou ainda mais impressionante. Dois Googlers forneceram ao Gemini um PDF de um livro didático de economia enorme — com centenas de páginas. Levaria uma eternidade para eu ler tudo, mas o Gemini produziu um resumo e destacou os tópicos principais para estudar em pouco tempo. Ele até criou um teste de múltipla escolha, com uma resposta correta e três erradas complicadas, para me ajudar a me preparar para um exame hipotético.
Googlers Sid Lall (esquerda) e Adam Kurzrok (direita) demonstram como o Gemini Advanced pode agora resumir um pesado livro didático de economia ou milhares de páginas de documentos.
Ambas as demonstrações utilizaram o Gemini 1.5 Pro, que apresentamos no início deste ano com a maior janela de contexto de qualquer modelo de fundação em grande escala. Estamos agora lançando acesso antecipado ao Gemini 1.5 Pro para assinantes do Gemini Advanced, permitindo que eles carreguem documentos diretamente do Drive. Isso significa que eles podem usar o Gemini para resumir ou analisar documentos de até 1.500 páginas.
O Gemini 1.5 Pro também está chegando ao painel lateral de aplicativos do Workspace, como Gmail, Docs, Sheets, Slides e Drive. Pude ver isso em ação usando o Gemini no Gmail para resumir um e-mail de relatório escolar semanal de amostra, e ele extraiu detalhes específicos, como atividades para alunos do 7º ano e a lista de itens para uma viagem noturna.
O painel lateral do Gemini pode ajudar a responder perguntas importantes sobre seu conteúdo no Gmail, Drive e mais.
A janela de contexto longo aprimorada pode até extrair informações de vários documentos ao responder a um único comando. No Docs, pedi ajuda para escrever uma carta de amostra para um candidato a emprego em potencial, vinculando o documento de descrição do cargo e o portfólio em PDF do candidato no meu Drive. O Gemini imediatamente redigiu um e-mail que levava em conta detalhes de ambos os documentos.
Mas o Gemini 1.5 Pro não é o único novidade no pedaço. Também brinquei com o recém-anunciado Imagen 3, nosso melhor modelo de texto para imagem até agora. Um recurso legal que testei foi sua capacidade de gerar textos e letras decorativas. Pedi um alfabeto estilizado, como letras feitas de geleia em torradas ou balões prateados flutuando no céu. O Imagen 3 produziu um alfabeto completo de letras, que eu poderia usar para criar meus próprios menus (saborosos).
Depois da minha diversão com o Imagen 3, voltei para mais demonstrações do Gemini. Uma demonstração me permitiu abrir a sobreposição do Gemini em um telefone Android e fazer perguntas sobre qualquer coisa na tela. Isso mostrou como não estamos apenas expandindo o que você pode perguntar ao Gemini, mas também tornando-o consciente do contexto para antecipar suas necessidades e oferecer sugestões úteis.
A demonstração usou um manual de forno extenso como exemplo. Em vez de percorrer o documento, abri o Gemini e recebi uma sugestão de "Perguntar sobre este PDF" imediatamente. Fiz perguntas como "como atualizo o relógio" e obtive respostas rápidas e precisas. Funcionou tão bem com vídeos do YouTube. Em vez de assistir a um vídeo de treino de 20 minutos, perguntei como modificar pranchas e obtive uma resposta rapidamente, depois passei para a próxima demonstração.
Esta próxima demonstração apresentou um novo modo de conversa chamado Gemini Live, onde você pode falar com o Gemini no aplicativo sem digitar. Falar com o Gemini foi uma vibe diferente da interface usual de chatbot. Suas respostas eram mais conversacionais, não apenas parágrafos de texto ou listas com marcadores. Na minha demonstração, pedi uma lista de atividades para crianças para as férias de verão e consegui interromper a lista para perguntar mais sobre quais materiais eu precisaria para tingir uma camiseta.
A demonstração do Project Astra levou as coisas a outro nível, mostrando para onde nossos projetos de IA conversacional estão indo.
Nosso AI Sandbox, onde desenvolvedores e participantes experimentaram demonstrações como o Project Astra e outros experimentos criativos de IA, como o modo DJ do MusicFX.
Em vez de apenas trabalhar com o que está na sua tela ou o que você digitou em uma caixa de bate-papo, as capacidades multimodais do Astra podem entender comandos de fala conversacional e feeds de vídeo ao vivo ao mesmo tempo, desbloqueando novos tipos de experiências de IA.
A demonstração de aliteração do Astra começou simples: mostrei à câmera um objeto, como uma banana ou um pedaço de pão, e o Gemini criou uma frase aliterativa. À medida que adicionava mais objetos, o Gemini mantinha a conversa, de "Bananas brilhantes brilham belamente no tabuleiro" com uma única fruta a "Criações culinárias podem chamar a atenção" quando apresentado a um tabuleiro de bufê inteiro.
Astra alitera com bananas, baguetes… e qualquer outra coisa que você possa mostrar.
Outra demonstração do Astra me permitiu jogar Pictionary com o Gemini. Pode parecer simples, mas exigia que o agente entendesse imagens, lembrasse o que foi desenhado a cada rodada e usasse conhecimento geral para adivinhar o que eu estava desenhando. Em uma demonstração, o Astra sabia que um círculo não era suficiente para basear um palpite, mas conforme adicionei linhas abaixo dele, ele rapidamente passou de identificar uma figura de palito para reconhecer que uma pessoa segurando um emoji de caveira era Hamlet.
Astra é imbatível no Pictionary.
Passar pelo AI Sandbox e outras estações de demonstração foi como dar uma espiada no futuro. Também foi um pouco humilhante: o Astra me venceu no Pictionary em várias rodadas!
Artigo relacionado
Meta Aprimora a Segurança de IA com Ferramentas Avançadas do Llama
A Meta lançou novas ferramentas de segurança do Llama para fortalecer o desenvolvimento de IA e proteger contra ameaças emergentes.Essas ferramentas de segurança do modelo de IA Llama atualizadas são
NotebookLM Apresenta Cadernos Curados de Publicações e Especialistas de Destaque
O Google está aprimorando sua ferramenta de pesquisa e anotações baseada em IA, NotebookLM, para servir como um hub de conhecimento abrangente. Na segunda-feira, a empresa lançou uma coleção curada de
Alibaba Revela Wan2.1-VACE: Solução de Vídeo de IA de Código Aberto
Alibaba apresentou o Wan2.1-VACE, um modelo de IA de código aberto pronto para transformar os processos de criação e edição de vídeos.VACE é um componente chave da família de modelos de IA de vídeo Wa
Comentários (36)
0/200
WillWalker
31 de Julho de 2025 à20 02:41:20 WEST
Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎
0
JeffreyThomas
21 de Abril de 2025 à38 02:33:38 WEST
¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓
0
GregoryRodriguez
19 de Abril de 2025 à35 17:24:35 WEST
I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓
0
ThomasYoung
18 de Abril de 2025 à1 12:13:01 WEST
Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓
0
BrianThomas
18 de Abril de 2025 à15 05:37:15 WEST
A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎
0
JackMartin
16 de Abril de 2025 à17 02:18:17 WEST
I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊
0
No I/O, não apenas apresentamos uma lista de atualizações como novos modelos Gemini, agentes de IA e ajustes no Android — nós realmente permitimos que desenvolvedores, jornalistas e parceiros mergulhem na ação com demonstrações práticas dos produtos. Este ano, passei o dia no Shoreline Amphitheatre, onde o I/O acontece, e pude conferir várias dessas demonstrações. Aqui está um resumo de algumas delas.
Minha primeira demonstração do dia foi bem legal. Eu vi o Gemini Advanced lidar com um contrato de aluguel de mais de 20 páginas, cheio de jargões jurídicos e cláusulas complicadas. Depois que ele processou o documento, eu podia fazer perguntas sobre ele, como se meu locador permitiria um cachorro de estimação ou se havia taxas extras que eu precisaria pagar. Já estou ansioso para usar esse recurso para entender meu próximo contrato quando meu apartamento estiver para renovação.
Em seguida, a demonstração ficou ainda mais impressionante. Dois Googlers forneceram ao Gemini um PDF de um livro didático de economia enorme — com centenas de páginas. Levaria uma eternidade para eu ler tudo, mas o Gemini produziu um resumo e destacou os tópicos principais para estudar em pouco tempo. Ele até criou um teste de múltipla escolha, com uma resposta correta e três erradas complicadas, para me ajudar a me preparar para um exame hipotético.
O Gemini 1.5 Pro também está chegando ao painel lateral de aplicativos do Workspace, como Gmail, Docs, Sheets, Slides e Drive. Pude ver isso em ação usando o Gemini no Gmail para resumir um e-mail de relatório escolar semanal de amostra, e ele extraiu detalhes específicos, como atividades para alunos do 7º ano e a lista de itens para uma viagem noturna.
A janela de contexto longo aprimorada pode até extrair informações de vários documentos ao responder a um único comando. No Docs, pedi ajuda para escrever uma carta de amostra para um candidato a emprego em potencial, vinculando o documento de descrição do cargo e o portfólio em PDF do candidato no meu Drive. O Gemini imediatamente redigiu um e-mail que levava em conta detalhes de ambos os documentos.
Mas o Gemini 1.5 Pro não é o único novidade no pedaço. Também brinquei com o recém-anunciado Imagen 3, nosso melhor modelo de texto para imagem até agora. Um recurso legal que testei foi sua capacidade de gerar textos e letras decorativas. Pedi um alfabeto estilizado, como letras feitas de geleia em torradas ou balões prateados flutuando no céu. O Imagen 3 produziu um alfabeto completo de letras, que eu poderia usar para criar meus próprios menus (saborosos).
Depois da minha diversão com o Imagen 3, voltei para mais demonstrações do Gemini. Uma demonstração me permitiu abrir a sobreposição do Gemini em um telefone Android e fazer perguntas sobre qualquer coisa na tela. Isso mostrou como não estamos apenas expandindo o que você pode perguntar ao Gemini, mas também tornando-o consciente do contexto para antecipar suas necessidades e oferecer sugestões úteis.
A demonstração usou um manual de forno extenso como exemplo. Em vez de percorrer o documento, abri o Gemini e recebi uma sugestão de "Perguntar sobre este PDF" imediatamente. Fiz perguntas como "como atualizo o relógio" e obtive respostas rápidas e precisas. Funcionou tão bem com vídeos do YouTube. Em vez de assistir a um vídeo de treino de 20 minutos, perguntei como modificar pranchas e obtive uma resposta rapidamente, depois passei para a próxima demonstração.
Esta próxima demonstração apresentou um novo modo de conversa chamado Gemini Live, onde você pode falar com o Gemini no aplicativo sem digitar. Falar com o Gemini foi uma vibe diferente da interface usual de chatbot. Suas respostas eram mais conversacionais, não apenas parágrafos de texto ou listas com marcadores. Na minha demonstração, pedi uma lista de atividades para crianças para as férias de verão e consegui interromper a lista para perguntar mais sobre quais materiais eu precisaria para tingir uma camiseta.
A demonstração do Project Astra levou as coisas a outro nível, mostrando para onde nossos projetos de IA conversacional estão indo.
A demonstração de aliteração do Astra começou simples: mostrei à câmera um objeto, como uma banana ou um pedaço de pão, e o Gemini criou uma frase aliterativa. À medida que adicionava mais objetos, o Gemini mantinha a conversa, de "Bananas brilhantes brilham belamente no tabuleiro" com uma única fruta a "Criações culinárias podem chamar a atenção" quando apresentado a um tabuleiro de bufê inteiro.


Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎




¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓




I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓




Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓




A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎




I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊












