opção
Lar
Notícias
Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon

Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon

17 de Abril de 2025
157

Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon

O Google Cloud está fazendo grandes movimentos para consolidar sua posição no mundo ferozmente competitivo da inteligência artificial. Na conferência anual Cloud Next em Las Vegas, eles revelaram um conjunto de novas tecnologias centradas em "modelos pensantes", ecossistemas de agentes e infraestrutura especializada adaptada para implantações massivas de IA.

A estrela do evento foi a Unidade de Processamento Tensor (TPU) de sétima geração, apelidada de Ironwood. O Google afirma que ela oferece mais de 42 exaflops de poder computacional por pod, o que é impressionantes 24 vezes mais poderoso do que o supercomputador líder, El Capitan.

“A oportunidade com a IA é tão grande quanto possível”, exclamou Amin Vahdat, vice-presidente e gerente geral de sistemas de ML e IA na nuvem do Google, durante uma coletiva de imprensa pré-evento. “Junto com nossos clientes, estamos impulsionando uma nova era dourada de inovação.”

O negócio de nuvem do Google está surfando uma onda de impulso. Em janeiro, eles relataram uma receita de nuvem no quarto trimestre de 2024 de US$ 12 bilhões, um salto de 30% em relação ao ano anterior. A empresa também observou um aumento de 80% em usuários ativos no AI Studio e na API Gemini no último mês.

Como os novos TPUs Ironwood do Google estão transformando a computação de IA com eficiência energética

O Google está se posicionando como o único grande provedor de nuvem com uma "plataforma totalmente otimizada para IA", projetada do zero para o que eles chamam de "era da inferência". Essa mudança foca em usar sistemas de IA para enfrentar problemas do mundo real, em vez de apenas treinar modelos.

O Ironwood representa uma mudança significativa na filosofia de design de chips. Diferentemente de seus predecessores, que equilibravam treinamento e inferência, o Ironwood é especificamente projetado para executar modelos de IA complexos após o treinamento.

“Não se trata mais dos dados inseridos no modelo, mas do que o modelo pode fazer com os dados após ser treinado”, explicou Vahdat.

Cada pod Ironwood contém mais de 9.000 chips e é duas vezes mais eficiente em termos de energia do que a geração anterior. Isso aborda uma grande preocupação com a IA generativa: seu enorme consumo de energia.

O Google também está abrindo sua vasta infraestrutura de rede global para clientes empresariais por meio do Cloud WAN (Rede de Área Ampla). Este serviço utiliza a rede de fibra de 2 milhões de milhas do Google, a mesma que alimenta serviços ao consumidor como YouTube e Gmail.

De acordo com o Google, o Cloud WAN pode aumentar o desempenho da rede em até 40% e reduzir o custo total de propriedade na mesma proporção em comparação com redes gerenciadas por clientes. Esse movimento é incomum para um hyperscaler, essencialmente transformando sua infraestrutura interna em um produto.

Por dentro do Gemini 2.5: Como os 'modelos pensantes' do Google melhoram as aplicações de IA empresarial

No lado do software, o Google está expandindo sua família de modelos Gemini com o Gemini 2.5 Flash, uma versão econômica de seu sistema de IA principal que introduz "capacidades de pensamento".

Diferentemente dos modelos de linguagem grandes tradicionais que geram respostas diretamente, esses "modelos pensantes" dividem problemas complexos por meio de raciocínio em várias etapas e autorreflexão. O Gemini 2.5 Pro, lançado há apenas duas semanas, visa casos de uso de alta complexidade, como descoberta de medicamentos e modelagem financeira. A variante Flash recém-anunciada ajusta sua profundidade de raciocínio com base na complexidade do prompt para equilibrar desempenho e custo.

O Google também está fortalecendo suas capacidades de mídia generativa com atualizações para Imagen (para geração de imagens), Veo (vídeo), Chirp (áudio) e introduzindo Lyria, um modelo de texto para música. Durante a coletiva de imprensa, Nenshad Bardoliwalla, Diretor de Gerenciamento de Produtos para Vertex AI, demonstrou como essas ferramentas podem colaborar para criar um vídeo promocional de concerto, completo com música personalizada e edição sofisticada, como a remoção de elementos indesejados de clipes de vídeo.

“Somente o Vertex AI reúne todos esses modelos, junto com modelos de terceiros, em uma única plataforma”, disse Bardoliwalla.

Além de sistemas de IA únicos: Como o ecossistema multiagente do Google visa aprimorar fluxos de trabalho empresariais

Os anúncios mais visionários do Google focam na criação de um "ecossistema multiagente", onde vários sistemas de IA podem colaborar entre diferentes plataformas e fornecedores.

Eles estão introduzindo um Kit de Desenvolvimento de Agentes (ADK) que permite aos desenvolvedores construir sistemas multiagentes com menos de 100 linhas de código. Além disso, o Google está propondo um novo protocolo aberto chamado Agent2Agent (A2A), permitindo que agentes de IA de diferentes fornecedores se comuniquem.

“2025 será um ano de transição onde a IA generativa mudará de responder perguntas únicas para resolver problemas complexos por meio de sistemas com agentes”, previu Vahdat.

Mais de 50 parceiros, incluindo grandes fornecedores de software empresarial como Salesforce, ServiceNow e SAP, aderiram para apoiar esse protocolo, sugerindo uma potencial mudança na indústria para sistemas de IA interoperáveis.

Para usuários não técnicos, o Google está aprimorando sua plataforma Agent Space com recursos como Agent Gallery (fornecendo uma visão única dos agentes disponíveis) e Agent Designer (uma interface sem código para criar agentes personalizados). Durante uma demonstração, o Google mostrou como um gerente de contas bancárias poderia usar essas ferramentas para analisar portfólios de clientes, prever problemas de fluxo de caixa e redigir comunicações com clientes automaticamente — tudo sem escrever nenhum código.

De resumos de documentos a pedidos em drive-thru: Como os agentes de IA especializados do Google estão afetando indústrias

O Google está integrando profundamente a IA em sua suíte de produtividade Workspace, introduzindo recursos como "Ajude-me a Analisar" no Sheets, que identifica automaticamente insights a partir de dados sem fórmulas explícitas ou tabelas dinâmicas, e Resumos de Áudio no Docs, que criam versões em áudio com voz humana de documentos.

A empresa destacou cinco categorias de agentes especializados com adoção significativa: atendimento ao cliente, trabalho criativo, análise de dados, codificação e segurança.

No atendimento ao cliente, o Google apontou para o sistema de drive-thru de IA da Wendy’s, que agora processa 60.000 pedidos diários, e o agente “Magic Apron” da The Home Depot, que oferece orientação para melhorias domésticas. Para equipes criativas, empresas como a WPP estão usando a IA do Google para conceituar e produzir campanhas de marketing em escala.

A competição em IA na nuvem se intensifica: Como a abordagem abrangente do Google desafia Microsoft e Amazon

Os anúncios do Google vêm em meio a uma competição crescente no espaço de IA na nuvem. A Microsoft integrou profundamente a tecnologia da OpenAI em sua plataforma Azure, enquanto a Amazon tem construído suas próprias ofertas alimentadas por Anthropic e chips especializados.

Thomas Kurian, CEO do Google Cloud, enfatizou o “compromisso da empresa em entregar infraestrutura, modelos, plataformas e agentes de classe mundial; oferecer uma plataforma aberta e multicloud que proporciona flexibilidade e escolha; e construir para interoperabilidade.”

Essa abordagem multifacetada parece projetada para diferenciar o Google de concorrentes que podem se destacar em áreas específicas, mas carecem da pilha completa, de chips a aplicações.

O futuro da IA empresarial: Por que os 'modelos pensantes' e a interoperabilidade do Google importam para a tecnologia empresarial

O que torna os anúncios do Google particularmente significativos é a natureza abrangente de sua estratégia de IA, abrangendo silício personalizado, rede global, desenvolvimento de modelos, estruturas de agentes e integração de aplicações.

O foco na otimização de inferência, em vez de apenas capacidades de treinamento, reflete um mercado de IA em amadurecimento. Embora treinar modelos cada vez maiores tenha dominado as manchetes, implantar esses modelos de forma eficiente em escala está se tornando o desafio mais urgente para as empresas.

A ênfase do Google na interoperabilidade — permitindo que sistemas de diferentes fornecedores trabalhem juntos — pode sinalizar uma mudança dos modelos de jardim murado que caracterizaram fases anteriores da computação em nuvem. Ao propor protocolos abertos como Agent2Agent, o Google está se posicionando como o tecido conectivo em um ecossistema de IA heterogêneo, em vez de exigir adoção total.

Esses anúncios apresentam oportunidades e desafios para os tomadores de decisão técnica empresarial. Os ganhos de eficiência prometidos por infraestruturas especializadas como os TPUs Ironwood e o Cloud WAN podem reduzir significativamente os custos de implantação de IA em escala. No entanto, navegar pelo cenário em rápida evolução de modelos, agentes e ferramentas exigirá um planejamento estratégico cuidadoso.

À medida que esses sistemas de IA mais sofisticados continuam a se desenvolver, a capacidade de orquestrar múltiplos agentes de IA especializados trabalhando em conjunto pode se tornar o principal diferencial para implementações de IA empresarial. Ao construir tanto os componentes quanto as conexões entre eles, o Google está apostando que o futuro da IA não se trata apenas de máquinas mais inteligentes, mas de máquinas que podem se comunicar efetivamente umas com as outras.

Artigo relacionado
Os principais laboratórios de IA alertam que a humanidade está perdendo o controle sobre a compreensão dos sistemas de IA Os principais laboratórios de IA alertam que a humanidade está perdendo o controle sobre a compreensão dos sistemas de IA Em uma demonstração de união sem precedentes, pesquisadores da OpenAI, Google DeepMind, Anthropic e Meta deixaram de lado as diferenças competitivas para emitir um alerta coletivo sobre o desenvolvime
Atualização de IA do Anthropic: Claude agora pesquisa todo o espaço de trabalho do Google instantaneamente Atualização de IA do Anthropic: Claude agora pesquisa todo o espaço de trabalho do Google instantaneamente A grande atualização de hoje da Anthropic transforma o Claude de um assistente de IA no que a empresa chama de "verdadeiro colaborador virtual", introduzindo recursos inovadores de pesquisa autônoma e
O mais recente modelo de IA Gemini do Google mostra queda nas pontuações de segurança nos testes O mais recente modelo de IA Gemini do Google mostra queda nas pontuações de segurança nos testes Os testes internos do Google revelam quedas de desempenho preocupantes nos protocolos de segurança de seu modelo de IA mais recente em comparação com as versões anteriores. De acordo com os benchmarks
Comentários (39)
0/200
KeithYoung
KeithYoung 21 de Agosto de 2025 à34 22:01:34 WEST

Google's new AI chips sound like a game-changer! Can't wait to see how they stack up against Microsoft and Amazon in real-world apps. 🤖 Anyone else hyped for this tech showdown?

JohnTaylor
JohnTaylor 19 de Agosto de 2025 à13 22:01:13 WEST

Google's new AI chips sound like a game-changer! Curious how they'll stack up against Microsoft's Azure in real-world apps. 🚀

EdwardBaker
EdwardBaker 16 de Agosto de 2025 à59 06:00:59 WEST

Google's new AI chips sound like a game-changer! Curious how they'll stack up against Microsoft's Azure in real-world use. 🤔

GaryJones
GaryJones 14 de Agosto de 2025 à0 22:01:00 WEST

Google's new AI chips sound like a game-changer! Excited to see how they stack up against Microsoft and Amazon in the cloud race. 🏁

WillieHernández
WillieHernández 19 de Abril de 2025 à55 06:33:55 WEST

Google Cloud Next '25の新しいAIチップとエージェントエコシステムは素晴らしい!マイクロソフトやアマゾンに挑戦状を叩きつけた感じですね。ただ、「思考モデル」がどう機能するのか、もう少し説明が欲しかったです。😅それでも期待が高まります!

EricRoberts
EricRoberts 19 de Abril de 2025 à32 05:26:32 WEST

Google Cloud Next '25에서 새로 공개된 AI 칩과 에이전트 생태계 정말 대단해요! 마치 마이크로소프트와 아마존에 도전장을 내민 것 같아요. 그런데 '생각 모델'이 어떻게 작동하는지 더 설명해줬으면 좋겠어요. 😕 그래도 기대가 커요!

De volta ao topo
OR