Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon

Lar

Notícias

17 de Abril de 2025

WillGarcía

# Google # nlp # ai-agent # ironwood # tpu # tpus

Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon

O Google Cloud está fazendo grandes movimentos para consolidar sua posição no mundo ferozmente competitivo da inteligência artificial. Na conferência anual Cloud Next em Las Vegas, eles revelaram um conjunto de novas tecnologias centradas em "modelos pensantes", ecossistemas de agentes e infraestrutura especializada adaptada para implantações massivas de IA.

A estrela do evento foi a Unidade de Processamento Tensor (TPU) de sétima geração, apelidada de Ironwood. O Google afirma que ela oferece mais de 42 exaflops de poder computacional por pod, o que é impressionantes 24 vezes mais poderoso do que o supercomputador líder, El Capitan.

“A oportunidade com a IA é tão grande quanto possível”, exclamou Amin Vahdat, vice-presidente e gerente geral de sistemas de ML e IA na nuvem do Google, durante uma coletiva de imprensa pré-evento. “Junto com nossos clientes, estamos impulsionando uma nova era dourada de inovação.”

O negócio de nuvem do Google está surfando uma onda de impulso. Em janeiro, eles relataram uma receita de nuvem no quarto trimestre de 2024 de US$ 12 bilhões, um salto de 30% em relação ao ano anterior. A empresa também observou um aumento de 80% em usuários ativos no AI Studio e na API Gemini no último mês.

Como os novos TPUs Ironwood do Google estão transformando a computação de IA com eficiência energética

O Google está se posicionando como o único grande provedor de nuvem com uma "plataforma totalmente otimizada para IA", projetada do zero para o que eles chamam de "era da inferência". Essa mudança foca em usar sistemas de IA para enfrentar problemas do mundo real, em vez de apenas treinar modelos.

O Ironwood representa uma mudança significativa na filosofia de design de chips. Diferentemente de seus predecessores, que equilibravam treinamento e inferência, o Ironwood é especificamente projetado para executar modelos de IA complexos após o treinamento.

“Não se trata mais dos dados inseridos no modelo, mas do que o modelo pode fazer com os dados após ser treinado”, explicou Vahdat.

Cada pod Ironwood contém mais de 9.000 chips e é duas vezes mais eficiente em termos de energia do que a geração anterior. Isso aborda uma grande preocupação com a IA generativa: seu enorme consumo de energia.

O Google também está abrindo sua vasta infraestrutura de rede global para clientes empresariais por meio do Cloud WAN (Rede de Área Ampla). Este serviço utiliza a rede de fibra de 2 milhões de milhas do Google, a mesma que alimenta serviços ao consumidor como YouTube e Gmail.

De acordo com o Google, o Cloud WAN pode aumentar o desempenho da rede em até 40% e reduzir o custo total de propriedade na mesma proporção em comparação com redes gerenciadas por clientes. Esse movimento é incomum para um hyperscaler, essencialmente transformando sua infraestrutura interna em um produto.

Por dentro do Gemini 2.5: Como os 'modelos pensantes' do Google melhoram as aplicações de IA empresarial

No lado do software, o Google está expandindo sua família de modelos Gemini com o Gemini 2.5 Flash, uma versão econômica de seu sistema de IA principal que introduz "capacidades de pensamento".

Diferentemente dos modelos de linguagem grandes tradicionais que geram respostas diretamente, esses "modelos pensantes" dividem problemas complexos por meio de raciocínio em várias etapas e autorreflexão. O Gemini 2.5 Pro, lançado há apenas duas semanas, visa casos de uso de alta complexidade, como descoberta de medicamentos e modelagem financeira. A variante Flash recém-anunciada ajusta sua profundidade de raciocínio com base na complexidade do prompt para equilibrar desempenho e custo.

O Google também está fortalecendo suas capacidades de mídia generativa com atualizações para Imagen (para geração de imagens), Veo (vídeo), Chirp (áudio) e introduzindo Lyria, um modelo de texto para música. Durante a coletiva de imprensa, Nenshad Bardoliwalla, Diretor de Gerenciamento de Produtos para Vertex AI, demonstrou como essas ferramentas podem colaborar para criar um vídeo promocional de concerto, completo com música personalizada e edição sofisticada, como a remoção de elementos indesejados de clipes de vídeo.

“Somente o Vertex AI reúne todos esses modelos, junto com modelos de terceiros, em uma única plataforma”, disse Bardoliwalla.

Além de sistemas de IA únicos: Como o ecossistema multiagente do Google visa aprimorar fluxos de trabalho empresariais

Os anúncios mais visionários do Google focam na criação de um "ecossistema multiagente", onde vários sistemas de IA podem colaborar entre diferentes plataformas e fornecedores.

Eles estão introduzindo um Kit de Desenvolvimento de Agentes (ADK) que permite aos desenvolvedores construir sistemas multiagentes com menos de 100 linhas de código. Além disso, o Google está propondo um novo protocolo aberto chamado Agent2Agent (A2A), permitindo que agentes de IA de diferentes fornecedores se comuniquem.

“2025 será um ano de transição onde a IA generativa mudará de responder perguntas únicas para resolver problemas complexos por meio de sistemas com agentes”, previu Vahdat.

Mais de 50 parceiros, incluindo grandes fornecedores de software empresarial como Salesforce, ServiceNow e SAP, aderiram para apoiar esse protocolo, sugerindo uma potencial mudança na indústria para sistemas de IA interoperáveis.

Para usuários não técnicos, o Google está aprimorando sua plataforma Agent Space com recursos como Agent Gallery (fornecendo uma visão única dos agentes disponíveis) e Agent Designer (uma interface sem código para criar agentes personalizados). Durante uma demonstração, o Google mostrou como um gerente de contas bancárias poderia usar essas ferramentas para analisar portfólios de clientes, prever problemas de fluxo de caixa e redigir comunicações com clientes automaticamente — tudo sem escrever nenhum código.

De resumos de documentos a pedidos em drive-thru: Como os agentes de IA especializados do Google estão afetando indústrias

O Google está integrando profundamente a IA em sua suíte de produtividade Workspace, introduzindo recursos como "Ajude-me a Analisar" no Sheets, que identifica automaticamente insights a partir de dados sem fórmulas explícitas ou tabelas dinâmicas, e Resumos de Áudio no Docs, que criam versões em áudio com voz humana de documentos.

A empresa destacou cinco categorias de agentes especializados com adoção significativa: atendimento ao cliente, trabalho criativo, análise de dados, codificação e segurança.

No atendimento ao cliente, o Google apontou para o sistema de drive-thru de IA da Wendy’s, que agora processa 60.000 pedidos diários, e o agente “Magic Apron” da The Home Depot, que oferece orientação para melhorias domésticas. Para equipes criativas, empresas como a WPP estão usando a IA do Google para conceituar e produzir campanhas de marketing em escala.

A competição em IA na nuvem se intensifica: Como a abordagem abrangente do Google desafia Microsoft e Amazon

Os anúncios do Google vêm em meio a uma competição crescente no espaço de IA na nuvem. A Microsoft integrou profundamente a tecnologia da OpenAI em sua plataforma Azure, enquanto a Amazon tem construído suas próprias ofertas alimentadas por Anthropic e chips especializados.

Thomas Kurian, CEO do Google Cloud, enfatizou o “compromisso da empresa em entregar infraestrutura, modelos, plataformas e agentes de classe mundial; oferecer uma plataforma aberta e multicloud que proporciona flexibilidade e escolha; e construir para interoperabilidade.”

Essa abordagem multifacetada parece projetada para diferenciar o Google de concorrentes que podem se destacar em áreas específicas, mas carecem da pilha completa, de chips a aplicações.

O futuro da IA empresarial: Por que os 'modelos pensantes' e a interoperabilidade do Google importam para a tecnologia empresarial

O que torna os anúncios do Google particularmente significativos é a natureza abrangente de sua estratégia de IA, abrangendo silício personalizado, rede global, desenvolvimento de modelos, estruturas de agentes e integração de aplicações.

O foco na otimização de inferência, em vez de apenas capacidades de treinamento, reflete um mercado de IA em amadurecimento. Embora treinar modelos cada vez maiores tenha dominado as manchetes, implantar esses modelos de forma eficiente em escala está se tornando o desafio mais urgente para as empresas.

A ênfase do Google na interoperabilidade — permitindo que sistemas de diferentes fornecedores trabalhem juntos — pode sinalizar uma mudança dos modelos de jardim murado que caracterizaram fases anteriores da computação em nuvem. Ao propor protocolos abertos como Agent2Agent, o Google está se posicionando como o tecido conectivo em um ecossistema de IA heterogêneo, em vez de exigir adoção total.

Esses anúncios apresentam oportunidades e desafios para os tomadores de decisão técnica empresarial. Os ganhos de eficiência prometidos por infraestruturas especializadas como os TPUs Ironwood e o Cloud WAN podem reduzir significativamente os custos de implantação de IA em escala. No entanto, navegar pelo cenário em rápida evolução de modelos, agentes e ferramentas exigirá um planejamento estratégico cuidadoso.

À medida que esses sistemas de IA mais sofisticados continuam a se desenvolver, a capacidade de orquestrar múltiplos agentes de IA especializados trabalhando em conjunto pode se tornar o principal diferencial para implementações de IA empresarial. Ao construir tanto os componentes quanto as conexões entre eles, o Google está apostando que o futuro da IA não se trata apenas de máquinas mais inteligentes, mas de máquinas que podem se comunicar efetivamente umas com as outras.

Artigo relacionado

Google Revela Modelos de IA Gemini 2.5 Prontos para Produção para Competir com a OpenAI no Mercado Empresarial A Google intensificou sua estratégia de IA na segunda-feira, lançando seus modelos avançados Gemini 2.5 para uso empresarial e introduzindo uma variante econômica para competir em preço e desempenho.A

Google Revela Ferramenta Simplificar Alimentada por IA para Leitura na Web Mais Fácil O aplicativo iOS do Google agora inclui um recurso “Simplificar”, utilizando IA para transformar textos complexos da web em conteúdo claro e compreensível sem sair da página.A ferramenta Simplificar,

Google Cloud Melhora Ferramentas de Mídia de IA com Novos Recursos de Música e Vídeo Na quarta-feira, o Google anunciou melhorias em sua plataforma de nuvem Vertex AI, aprimorando vários modelos de IA geradores de mídia proprietários.Lyria, a IA de texto para música do Google, está ag

Comentários (35)

0/200

Enviar

WillieHernández

19 de Abril de 2025 à55 06:33:55 WEST

Google Cloud Next '25の新しいAIチップとエージェントエコシステムは素晴らしい！マイクロソフトやアマゾンに挑戦状を叩きつけた感じですね。ただ、「思考モデル」がどう機能するのか、もう少し説明が欲しかったです。😅それでも期待が高まります！

EricRoberts

19 de Abril de 2025 à32 05:26:32 WEST

Google Cloud Next '25에서 새로 공개된 AI 칩과 에이전트 생태계 정말 대단해요! 마치 마이크로소프트와 아마존에 도전장을 내민 것 같아요. 그런데 '생각 모델'이 어떻게 작동하는지 더 설명해줬으면 좋겠어요. 😕 그래도 기대가 커요!

BillyThomas

19 de Abril de 2025 à9 02:21:09 WEST

¡Los nuevos chips de IA y el ecosistema de agentes de Google Cloud están revolucionando todo! Estoy emocionado de ver cómo desafían a Microsoft y Amazon. Los 'modelos de pensamiento' suenan súper innovadores, pero me preocupa un poco la curva de aprendizaje. ¡No puedo esperar para probarlo! 😃

GeorgeWilson

18 de Abril de 2025 à34 23:21:34 WEST

구글 클라우드의 새로운 AI 칩과 에이전트 생태계, 정말 멋지네요! 마이크로소프트와 아마존에 도전하는 거 너무 기대돼요. '생각 모델'도 혁신적이지만, 배우는 데 시간이 걸릴 것 같아요. 빨리 사용해보고 싶어요! 😄

RyanAdams

18 de Abril de 2025 à18 22:24:18 WEST

Os novos chips de IA e o ecossistema de agentes da Google Cloud estão mudando tudo! Estou animado para ver como eles desafiam a Microsoft e a Amazon. Os 'modelos de pensamento' parecem super inovadores, mas estou um pouco preocupado com a curva de aprendizado. Mal posso esperar para experimentar! 😎

JoseGonzalez

18 de Abril de 2025 à45 21:41:45 WEST

Google Cloud Next '25 really stepped up their game with these new AI chips and agent ecosystems! It's like they're throwing down the gauntlet to Microsoft and Amazon. I'm excited to see how this plays out, but I wish they'd explained more about how these 'thinking models' work. 🤔 Still, it's a promising start!

Principais notícias

Gemini 2.5 Pro agora ilimitado e mais barato que Claude, GPT-4o Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada Dublagem AI: Guia Definitivo para Criação de Voz Realista Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia Ai computando para consumir poder de múltiplos NYCs até 2026, diz o fundador Clone de Voz por IA: Guia definitivo para dominar a conversão de voz Experimente as palavras cruzadas de E/S da IA: uma reviravolta moderna no jogo clássico de palavras O CEO da NVIDIA esclarece conceitos errôneos sobre o impacto do mercado de Deepseek

Mais

Apresentou