

Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon
16 de Abril de 2025
WillGarcía
45

O Google Cloud está fazendo grandes movimentos para consolidar seu lugar no mundo ferozmente competitivo da inteligência artificial. Na próxima conferência anual em Las Vegas, eles lançaram um conjunto de novas tecnologias centradas em "Modelos de Pensamento", ecossistemas de agentes e infraestrutura especializada adaptada para implantações maciças de IA.
A estrela do show foi a unidade de processamento de tensores da sétima geração (TPU), apelidada de Ironwood. O Google possui que oferece mais de 42 exaflops de poder de computação por vagem, que é uma 24 vezes mais poderosa que o supercomputador líder, El Capitan.
"A oportunidade com a IA é tão grande quanto ele ganha", exclamou Amin Vahdat, vice-presidente e gerente geral de sistemas de ML e nuvem da ML, durante uma conferência de imprensa antes do evento. "Juntamente com nossos clientes, estamos alimentando uma nova era de ouro da inovação".
O negócio em nuvem do Google está montando uma onda de impulso. Em janeiro, eles relataram uma receita em nuvem de 2024 no trimestre de US $ 12 bilhões, um salto de 30% em relação ao ano anterior. A empresa também observou um aumento de 80% nos usuários ativos no estúdio de IA e na API Gemini no mês passado.
Como as novas TPUs de Ironwood do Google estão transformando a computação de IA com eficiência de energia
O Google está se posicionando como o único grande provedor de nuvem com uma "plataforma totalmente otimizada", projetada desde o início para o que eles chamam de "A Era da Inferência". Essa mudança se concentra no uso de sistemas de IA para enfrentar questões do mundo real, em vez de apenas treinar modelos.
O Ironwood representa uma mudança significativa na filosofia de design de chips. Ao contrário de seus antecessores, que equilibram treinamento e inferência, o Ironwood é projetado especificamente para executar modelos complexos de IA após o treinamento.
"Não se trata mais dos dados colocados no modelo, mas o que o modelo pode fazer com os dados após o treino", explicou Vahdat.
Cada POD de Ironwood embalta mais de 9.000 chips e é duas vezes mais eficiente em termos de energia do que a geração anterior. Isso aborda uma grande preocupação com a IA generativa: seu enorme consumo de energia.
O Google também está abrindo sua vasta infraestrutura de rede global para os clientes corporativos através da Cloud Wan (Wide Area Network). Esse serviço explora a rede de fibras de 2 milhões de quilômetros do Google, a mesma que alimenta serviços de consumidores como o YouTube e o Gmail.
De acordo com o Google, a Cloud Wan pode aumentar o desempenho da rede em até 40% e reduzir o custo total de propriedade na mesma quantidade em comparação com as redes gerenciadas pelo cliente. Esse movimento é incomum para um hiperescalador, transformando essencialmente sua infraestrutura interna em um produto.
Inside Gemini 2.5: Como os 'modelos de pensamento' do Google melhoram os aplicativos corporativos da IA
Na frente do software, o Google está expandindo sua família de modelos Gemini com o Gemini 2.5 Flash, uma versão econômica de seu principal sistema de IA que apresenta "recursos de pensamento".
Diferentemente dos modelos tradicionais de grandes linguagens que geram diretamente respostas, esses "modelos de pensamento" quebram problemas complexos por meio de raciocínio e auto-reflexão em várias etapas. O Gemini 2.5 Pro, lançado há apenas duas semanas, tem como alvo casos de uso de alta complexidade, como descoberta de medicamentos e modelagem financeira. A variante flash recém -anunciada ajusta sua profundidade de raciocínio com base na complexidade imediata para equilibrar o desempenho e o custo.
O Google também está reforçando seus recursos generativos de mídia com atualizações para o Imagen (para geração de imagens), Veo (vídeo), chirp (áudio) e introdução de Lyria, um modelo de texto para música. Durante a conferência de imprensa, Nenshad Bardoliwalla, diretor de gerenciamento de produtos da Vertex AI, mostrou como essas ferramentas podem colaborar para criar um vídeo de concerto promocional, completo com música personalizada e edição sofisticada, como remover elementos indesejados de videoclipes.
"Somente o Vertex AI reúne todos esses modelos, juntamente com modelos de terceiros em uma única plataforma", disse Bardoliwalla.
Além dos sistemas de IA únicos: como o ecossistema multi-agente do Google visa aprimorar os fluxos de trabalho corporativos
Os anúncios mais prospectivos do Google se concentram na criação de um "ecossistema multi-agente", onde vários sistemas de IA podem colaborar em diferentes plataformas e fornecedores.
Eles estão introduzindo um kit de desenvolvimento de agentes (ADK) que permite aos desenvolvedores criar sistemas multi-agentes com menos de 100 linhas de código. Além disso, o Google está propondo um novo protocolo aberto chamado Agent2AGENT (A2A), permitindo que agentes de IA de diferentes fornecedores se comuniquem.
“2025 será um ano de transição em que a IA generativa muda de responder perguntas únicas para a solução de problemas complexos através de sistemas agentes”, previu Vahdat.
Mais de 50 parceiros, incluindo os principais provedores de software corporativo como Salesforce, ServiceNow e SAP, assinaram assinados para apoiar esse protocolo, sugerindo uma mudança potencial da indústria para sistemas de IA interoperáveis.
Para usuários não técnicos, o Google está aprimorando sua plataforma espacial de agentes com recursos como a Galeria de Agentes (fornecendo uma única visão dos agentes disponíveis) e designer de agentes (uma interface sem código para criar agentes personalizados). Durante uma demonstração, o Google mostrou como um gerente de conta bancária poderia usar essas ferramentas para analisar portfólios de clientes, prever problemas de fluxo de caixa e redigir automaticamente as comunicações do cliente - tudo sem escrever nenhum código.
Dos resumos de documentos a ordens drive-thru: como os agentes de IA especializados do Google estão afetando as indústrias
O Google está integrando profundamente a IA em seu conjunto de produtividade da área de trabalho, introduzindo recursos como "Ajude-me a analisar" em folhas, o que identifica automaticamente informações de dados sem fórmulas explícitas ou tabelas dinâmicas e visões gerais de áudio em documentos, que criam versões de áudio do tipo humano de documentos.
A Companhia destacou cinco categorias de agentes especializados que veem adoção significativa: atendimento ao cliente, trabalho criativo, análise de dados, codificação e segurança.
No atendimento ao cliente, o Google apontou para o sistema de drive-through de Wendy, que agora lida com 60.000 pedidos diariamente, e o agente "Magic Apron" da Home Depot, que oferece orientação para melhoria da casa. Para equipes criativas, empresas como o WPP estão usando a IA do Google para conceituar e produzir campanhas de marketing em escala.
A competição em nuvem IA se intensifica: como a abordagem abrangente do Google desafia a Microsoft e a Amazon
Os anúncios do Google vêm em meio à intensificação da concorrência no espaço da AI na nuvem. A Microsoft integrou profundamente a tecnologia da OpenAI em sua plataforma do Azure, enquanto a Amazon está construindo suas próprias ofertas antrópicas e chips especializados.
Thomas Kurian, CEO da Google Cloud, enfatizou o “compromisso da empresa em fornecer infraestrutura, modelos, plataformas e agentes de classe mundial; oferecendo uma plataforma aberta e multi-nuvem que fornece flexibilidade e escolha; e construindo para interoperabilidade”.
Essa abordagem multifacetada parece projetada para diferenciar o Google dos concorrentes que podem se destacar em áreas específicas, mas não têm a pilha completa de chips a aplicativos.
O futuro da AI Enterprise: por que 'modelos de pensamento' do Google e a interoperabilidade são importantes para a tecnologia de negócios
O que torna os anúncios do Google particularmente significativos é a natureza abrangente de sua estratégia de IA, abrangendo silício personalizado, redes globais, desenvolvimento de modelos, estruturas de agentes e integração de aplicativos.
O foco na otimização de inferência, em vez de apenas os recursos de treinamento, reflete um mercado de IA amadurecido. Enquanto o treinamento de modelos cada vez maiores dominou as manchetes, a implantação desses modelos com eficiência em escala está se tornando o desafio mais premente para as empresas.
A ênfase do Google na interoperabilidade - permitindo que sistemas de diferentes fornecedores trabalhem juntos - pode sinalizar uma mudança para longe das abordagens do jardim murado que caracterizaram as fases anteriores da computação em nuvem. Ao propor protocolos abertos como o Agent2AGENT, o Google está se posicionando como o tecido conjuntivo em um ecossistema heterogêneo da IA, em vez de exigir a adoção de tudo ou nada.
Esses anúncios apresentam oportunidades e desafios para os tomadores de decisão técnicos corporativos. Os ganhos de eficiência prometidos por infraestrutura especializada, como Ironwood TPUs e Cloud Wan, podem reduzir significativamente os custos de implantação da IA em escala. No entanto, navegar no cenário em rápida evolução de modelos, agentes e ferramentas exigirá um planejamento estratégico cuidadoso.
À medida que esses sistemas de IA mais sofisticados continuam a se desenvolver, a capacidade de orquestrar vários agentes especializados de IA que trabalham em concerto pode se tornar o principal diferencial para implementações de IA corporativa. Ao construir os componentes e as conexões entre eles, o Google está apostando que o futuro da IA não é apenas sobre máquinas mais inteligentes, mas em máquinas que podem se comunicar efetivamente.
Artigo relacionado
Former DeepSeeker and collaborators release new method for training reliable AI agents: RAGEN
The Year of AI Agents: A Closer Look at 2025's Expectations and Realities2025 was heralded by many experts as the year when AI agents—specialized AI systems powered by advanced large language and multimodal models from companies like OpenAI, Anthropic, Google, and DeepSeek—would finally take center
GAIA Introduces New Benchmark in Quest for True Intelligence Beyond ARC-AGI
Intelligence is everywhere, yet gauging it accurately feels like trying to catch a cloud with your bare hands. We use tests and benchmarks, like college entrance exams, to get a rough idea. Each year, students cram for these tests, sometimes even scoring a perfect 100%. But does that perfect score m
Notion Launches AI-Enhanced Email Client for Gmail
Notion Launches Notion Mail: An AI-Powered Email Client for Gmail
On Tuesday, Notion unveiled Notion Mail, a new AI-powered email client designed specifically for Gmail users. This innovative tool seamlessly integrates with Notion's broader workflow management platform, enhancing productivity by le
Comentários (35)
0/200
MatthewHill
18 de Abril de 2025 à4 01:30:04 GMT
Google Cloud's new AI chips and agent ecosystem are a bold move against Microsoft and Amazon! 🤖💪 The 'thinking models' sound cool, but I'm curious to see how they'll actually perform in real-world scenarios. Hope they don't just stay as conference buzzwords! 🚀
0
GregoryJones
17 de Abril de 2025 à51 14:12:51 GMT
グーグルクラウドの新しいAIチップとエージェントエコシステム、MicrosoftやAmazonに対抗する大胆な動きだね!🤖💪 「思考モデル」も面白そうだけど、実際のシーンでどれだけ機能するのか気になるな。カンファレンスの話題だけで終わらないことを願ってるよ!🚀
0
DanielThomas
18 de Abril de 2025 à23 06:57:23 GMT
구글 클라우드의 새로운 AI 칩과 에이전트 생태계, 마이크로소프트와 아마존에 맞서는 대담한 움직임이야! 🤖💪 '생각 모델'도 재미있어 보이지만, 실제 상황에서 얼마나 기능할지 궁금해. 컨퍼런스 화제로만 끝나지 않길 바래! 🚀
0
JasonMartin
17 de Abril de 2025 à27 10:39:27 GMT
Os novos chips de IA e o ecossistema de agentes do Google Cloud são uma jogada ousada contra a Microsoft e a Amazon! 🤖💪 Os 'modelos de pensamento' parecem legais, mas estou curioso para ver como eles vão se sair em cenários reais. Espero que não fiquem só como palavras de ordem em conferências! 🚀
0
RogerGonzalez
17 de Abril de 2025 à13 06:43:13 GMT
¡Los nuevos chips de IA y el ecosistema de agentes de Google Cloud son un movimiento audaz contra Microsoft y Amazon! 🤖💪 Los 'modelos de pensamiento' suenan geniales, pero tengo curiosidad por ver cómo funcionarán en escenarios del mundo real. ¡Espero que no se queden solo como palabras de moda en conferencias! 🚀
0
FrankMartínez
17 de Abril de 2025 à10 13:24:10 GMT
Google Cloud's new AI chips and agent ecosystem are pretty cool! They're really stepping up their game against Microsoft and Amazon. I'm excited to see how these 'thinking models' will shake things up. The only downside is the learning curve might be steep. Can't wait to dive in and see what I can do with them! 🤓🚀
0






O Google Cloud está fazendo grandes movimentos para consolidar seu lugar no mundo ferozmente competitivo da inteligência artificial. Na próxima conferência anual em Las Vegas, eles lançaram um conjunto de novas tecnologias centradas em "Modelos de Pensamento", ecossistemas de agentes e infraestrutura especializada adaptada para implantações maciças de IA.
A estrela do show foi a unidade de processamento de tensores da sétima geração (TPU), apelidada de Ironwood. O Google possui que oferece mais de 42 exaflops de poder de computação por vagem, que é uma 24 vezes mais poderosa que o supercomputador líder, El Capitan.
"A oportunidade com a IA é tão grande quanto ele ganha", exclamou Amin Vahdat, vice-presidente e gerente geral de sistemas de ML e nuvem da ML, durante uma conferência de imprensa antes do evento. "Juntamente com nossos clientes, estamos alimentando uma nova era de ouro da inovação".
O negócio em nuvem do Google está montando uma onda de impulso. Em janeiro, eles relataram uma receita em nuvem de 2024 no trimestre de US $ 12 bilhões, um salto de 30% em relação ao ano anterior. A empresa também observou um aumento de 80% nos usuários ativos no estúdio de IA e na API Gemini no mês passado.
Como as novas TPUs de Ironwood do Google estão transformando a computação de IA com eficiência de energia
O Google está se posicionando como o único grande provedor de nuvem com uma "plataforma totalmente otimizada", projetada desde o início para o que eles chamam de "A Era da Inferência". Essa mudança se concentra no uso de sistemas de IA para enfrentar questões do mundo real, em vez de apenas treinar modelos.
O Ironwood representa uma mudança significativa na filosofia de design de chips. Ao contrário de seus antecessores, que equilibram treinamento e inferência, o Ironwood é projetado especificamente para executar modelos complexos de IA após o treinamento.
"Não se trata mais dos dados colocados no modelo, mas o que o modelo pode fazer com os dados após o treino", explicou Vahdat.
Cada POD de Ironwood embalta mais de 9.000 chips e é duas vezes mais eficiente em termos de energia do que a geração anterior. Isso aborda uma grande preocupação com a IA generativa: seu enorme consumo de energia.
O Google também está abrindo sua vasta infraestrutura de rede global para os clientes corporativos através da Cloud Wan (Wide Area Network). Esse serviço explora a rede de fibras de 2 milhões de quilômetros do Google, a mesma que alimenta serviços de consumidores como o YouTube e o Gmail.
De acordo com o Google, a Cloud Wan pode aumentar o desempenho da rede em até 40% e reduzir o custo total de propriedade na mesma quantidade em comparação com as redes gerenciadas pelo cliente. Esse movimento é incomum para um hiperescalador, transformando essencialmente sua infraestrutura interna em um produto.
Inside Gemini 2.5: Como os 'modelos de pensamento' do Google melhoram os aplicativos corporativos da IA
Na frente do software, o Google está expandindo sua família de modelos Gemini com o Gemini 2.5 Flash, uma versão econômica de seu principal sistema de IA que apresenta "recursos de pensamento".
Diferentemente dos modelos tradicionais de grandes linguagens que geram diretamente respostas, esses "modelos de pensamento" quebram problemas complexos por meio de raciocínio e auto-reflexão em várias etapas. O Gemini 2.5 Pro, lançado há apenas duas semanas, tem como alvo casos de uso de alta complexidade, como descoberta de medicamentos e modelagem financeira. A variante flash recém -anunciada ajusta sua profundidade de raciocínio com base na complexidade imediata para equilibrar o desempenho e o custo.
O Google também está reforçando seus recursos generativos de mídia com atualizações para o Imagen (para geração de imagens), Veo (vídeo), chirp (áudio) e introdução de Lyria, um modelo de texto para música. Durante a conferência de imprensa, Nenshad Bardoliwalla, diretor de gerenciamento de produtos da Vertex AI, mostrou como essas ferramentas podem colaborar para criar um vídeo de concerto promocional, completo com música personalizada e edição sofisticada, como remover elementos indesejados de videoclipes.
"Somente o Vertex AI reúne todos esses modelos, juntamente com modelos de terceiros em uma única plataforma", disse Bardoliwalla.
Além dos sistemas de IA únicos: como o ecossistema multi-agente do Google visa aprimorar os fluxos de trabalho corporativos
Os anúncios mais prospectivos do Google se concentram na criação de um "ecossistema multi-agente", onde vários sistemas de IA podem colaborar em diferentes plataformas e fornecedores.
Eles estão introduzindo um kit de desenvolvimento de agentes (ADK) que permite aos desenvolvedores criar sistemas multi-agentes com menos de 100 linhas de código. Além disso, o Google está propondo um novo protocolo aberto chamado Agent2AGENT (A2A), permitindo que agentes de IA de diferentes fornecedores se comuniquem.
“2025 será um ano de transição em que a IA generativa muda de responder perguntas únicas para a solução de problemas complexos através de sistemas agentes”, previu Vahdat.
Mais de 50 parceiros, incluindo os principais provedores de software corporativo como Salesforce, ServiceNow e SAP, assinaram assinados para apoiar esse protocolo, sugerindo uma mudança potencial da indústria para sistemas de IA interoperáveis.
Para usuários não técnicos, o Google está aprimorando sua plataforma espacial de agentes com recursos como a Galeria de Agentes (fornecendo uma única visão dos agentes disponíveis) e designer de agentes (uma interface sem código para criar agentes personalizados). Durante uma demonstração, o Google mostrou como um gerente de conta bancária poderia usar essas ferramentas para analisar portfólios de clientes, prever problemas de fluxo de caixa e redigir automaticamente as comunicações do cliente - tudo sem escrever nenhum código.
Dos resumos de documentos a ordens drive-thru: como os agentes de IA especializados do Google estão afetando as indústrias
O Google está integrando profundamente a IA em seu conjunto de produtividade da área de trabalho, introduzindo recursos como "Ajude-me a analisar" em folhas, o que identifica automaticamente informações de dados sem fórmulas explícitas ou tabelas dinâmicas e visões gerais de áudio em documentos, que criam versões de áudio do tipo humano de documentos.
A Companhia destacou cinco categorias de agentes especializados que veem adoção significativa: atendimento ao cliente, trabalho criativo, análise de dados, codificação e segurança.
No atendimento ao cliente, o Google apontou para o sistema de drive-through de Wendy, que agora lida com 60.000 pedidos diariamente, e o agente "Magic Apron" da Home Depot, que oferece orientação para melhoria da casa. Para equipes criativas, empresas como o WPP estão usando a IA do Google para conceituar e produzir campanhas de marketing em escala.
A competição em nuvem IA se intensifica: como a abordagem abrangente do Google desafia a Microsoft e a Amazon
Os anúncios do Google vêm em meio à intensificação da concorrência no espaço da AI na nuvem. A Microsoft integrou profundamente a tecnologia da OpenAI em sua plataforma do Azure, enquanto a Amazon está construindo suas próprias ofertas antrópicas e chips especializados.
Thomas Kurian, CEO da Google Cloud, enfatizou o “compromisso da empresa em fornecer infraestrutura, modelos, plataformas e agentes de classe mundial; oferecendo uma plataforma aberta e multi-nuvem que fornece flexibilidade e escolha; e construindo para interoperabilidade”.
Essa abordagem multifacetada parece projetada para diferenciar o Google dos concorrentes que podem se destacar em áreas específicas, mas não têm a pilha completa de chips a aplicativos.
O futuro da AI Enterprise: por que 'modelos de pensamento' do Google e a interoperabilidade são importantes para a tecnologia de negócios
O que torna os anúncios do Google particularmente significativos é a natureza abrangente de sua estratégia de IA, abrangendo silício personalizado, redes globais, desenvolvimento de modelos, estruturas de agentes e integração de aplicativos.
O foco na otimização de inferência, em vez de apenas os recursos de treinamento, reflete um mercado de IA amadurecido. Enquanto o treinamento de modelos cada vez maiores dominou as manchetes, a implantação desses modelos com eficiência em escala está se tornando o desafio mais premente para as empresas.
A ênfase do Google na interoperabilidade - permitindo que sistemas de diferentes fornecedores trabalhem juntos - pode sinalizar uma mudança para longe das abordagens do jardim murado que caracterizaram as fases anteriores da computação em nuvem. Ao propor protocolos abertos como o Agent2AGENT, o Google está se posicionando como o tecido conjuntivo em um ecossistema heterogêneo da IA, em vez de exigir a adoção de tudo ou nada.
Esses anúncios apresentam oportunidades e desafios para os tomadores de decisão técnicos corporativos. Os ganhos de eficiência prometidos por infraestrutura especializada, como Ironwood TPUs e Cloud Wan, podem reduzir significativamente os custos de implantação da IA em escala. No entanto, navegar no cenário em rápida evolução de modelos, agentes e ferramentas exigirá um planejamento estratégico cuidadoso.
À medida que esses sistemas de IA mais sofisticados continuam a se desenvolver, a capacidade de orquestrar vários agentes especializados de IA que trabalham em concerto pode se tornar o principal diferencial para implementações de IA corporativa. Ao construir os componentes e as conexões entre eles, o Google está apostando que o futuro da IA não é apenas sobre máquinas mais inteligentes, mas em máquinas que podem se comunicar efetivamente.




Google Cloud's new AI chips and agent ecosystem are a bold move against Microsoft and Amazon! 🤖💪 The 'thinking models' sound cool, but I'm curious to see how they'll actually perform in real-world scenarios. Hope they don't just stay as conference buzzwords! 🚀




グーグルクラウドの新しいAIチップとエージェントエコシステム、MicrosoftやAmazonに対抗する大胆な動きだね!🤖💪 「思考モデル」も面白そうだけど、実際のシーンでどれだけ機能するのか気になるな。カンファレンスの話題だけで終わらないことを願ってるよ!🚀




구글 클라우드의 새로운 AI 칩과 에이전트 생태계, 마이크로소프트와 아마존에 맞서는 대담한 움직임이야! 🤖💪 '생각 모델'도 재미있어 보이지만, 실제 상황에서 얼마나 기능할지 궁금해. 컨퍼런스 화제로만 끝나지 않길 바래! 🚀




Os novos chips de IA e o ecossistema de agentes do Google Cloud são uma jogada ousada contra a Microsoft e a Amazon! 🤖💪 Os 'modelos de pensamento' parecem legais, mas estou curioso para ver como eles vão se sair em cenários reais. Espero que não fiquem só como palavras de ordem em conferências! 🚀




¡Los nuevos chips de IA y el ecosistema de agentes de Google Cloud son un movimiento audaz contra Microsoft y Amazon! 🤖💪 Los 'modelos de pensamiento' suenan geniales, pero tengo curiosidad por ver cómo funcionarán en escenarios del mundo real. ¡Espero que no se queden solo como palabras de moda en conferencias! 🚀




Google Cloud's new AI chips and agent ecosystem are pretty cool! They're really stepping up their game against Microsoft and Amazon. I'm excited to see how these 'thinking models' will shake things up. The only downside is the learning curve might be steep. Can't wait to dive in and see what I can do with them! 🤓🚀












