opção
Lar
Notícias
Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon

Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon

17 de Abril de 2025
84

Google Cloud Next '25: Novos chips e ecossistemas de agentes desafio Microsoft e Amazon

O Google Cloud está fazendo grandes movimentos para consolidar seu lugar no mundo ferozmente competitivo da inteligência artificial. Na próxima conferência anual em Las Vegas, eles lançaram um conjunto de novas tecnologias centradas em "Modelos de Pensamento", ecossistemas de agentes e infraestrutura especializada adaptada para implantações maciças de IA.

A estrela do show foi a unidade de processamento de tensores da sétima geração (TPU), apelidada de Ironwood. O Google possui que oferece mais de 42 exaflops de poder de computação por vagem, que é uma 24 vezes mais poderosa que o supercomputador líder, El Capitan.

"A oportunidade com a IA é tão grande quanto ele ganha", exclamou Amin Vahdat, vice-presidente e gerente geral de sistemas de ML e nuvem da ML, durante uma conferência de imprensa antes do evento. "Juntamente com nossos clientes, estamos alimentando uma nova era de ouro da inovação".

O negócio em nuvem do Google está montando uma onda de impulso. Em janeiro, eles relataram uma receita em nuvem de 2024 no trimestre de US $ 12 bilhões, um salto de 30% em relação ao ano anterior. A empresa também observou um aumento de 80% nos usuários ativos no estúdio de IA e na API Gemini no mês passado.

Como as novas TPUs de Ironwood do Google estão transformando a computação de IA com eficiência de energia

O Google está se posicionando como o único grande provedor de nuvem com uma "plataforma totalmente otimizada", projetada desde o início para o que eles chamam de "A Era da Inferência". Essa mudança se concentra no uso de sistemas de IA para enfrentar questões do mundo real, em vez de apenas treinar modelos.

O Ironwood representa uma mudança significativa na filosofia de design de chips. Ao contrário de seus antecessores, que equilibram treinamento e inferência, o Ironwood é projetado especificamente para executar modelos complexos de IA após o treinamento.

"Não se trata mais dos dados colocados no modelo, mas o que o modelo pode fazer com os dados após o treino", explicou Vahdat.

Cada POD de Ironwood embalta mais de 9.000 chips e é duas vezes mais eficiente em termos de energia do que a geração anterior. Isso aborda uma grande preocupação com a IA generativa: seu enorme consumo de energia.

O Google também está abrindo sua vasta infraestrutura de rede global para os clientes corporativos através da Cloud Wan (Wide Area Network). Esse serviço explora a rede de fibras de 2 milhões de quilômetros do Google, a mesma que alimenta serviços de consumidores como o YouTube e o Gmail.

De acordo com o Google, a Cloud Wan pode aumentar o desempenho da rede em até 40% e reduzir o custo total de propriedade na mesma quantidade em comparação com as redes gerenciadas pelo cliente. Esse movimento é incomum para um hiperescalador, transformando essencialmente sua infraestrutura interna em um produto.

Inside Gemini 2.5: Como os 'modelos de pensamento' do Google melhoram os aplicativos corporativos da IA

Na frente do software, o Google está expandindo sua família de modelos Gemini com o Gemini 2.5 Flash, uma versão econômica de seu principal sistema de IA que apresenta "recursos de pensamento".

Diferentemente dos modelos tradicionais de grandes linguagens que geram diretamente respostas, esses "modelos de pensamento" quebram problemas complexos por meio de raciocínio e auto-reflexão em várias etapas. O Gemini 2.5 Pro, lançado há apenas duas semanas, tem como alvo casos de uso de alta complexidade, como descoberta de medicamentos e modelagem financeira. A variante flash recém -anunciada ajusta sua profundidade de raciocínio com base na complexidade imediata para equilibrar o desempenho e o custo.

O Google também está reforçando seus recursos generativos de mídia com atualizações para o Imagen (para geração de imagens), Veo (vídeo), chirp (áudio) e introdução de Lyria, um modelo de texto para música. Durante a conferência de imprensa, Nenshad Bardoliwalla, diretor de gerenciamento de produtos da Vertex AI, mostrou como essas ferramentas podem colaborar para criar um vídeo de concerto promocional, completo com música personalizada e edição sofisticada, como remover elementos indesejados de videoclipes.

"Somente o Vertex AI reúne todos esses modelos, juntamente com modelos de terceiros em uma única plataforma", disse Bardoliwalla.

Além dos sistemas de IA únicos: como o ecossistema multi-agente do Google visa aprimorar os fluxos de trabalho corporativos

Os anúncios mais prospectivos do Google se concentram na criação de um "ecossistema multi-agente", onde vários sistemas de IA podem colaborar em diferentes plataformas e fornecedores.

Eles estão introduzindo um kit de desenvolvimento de agentes (ADK) que permite aos desenvolvedores criar sistemas multi-agentes com menos de 100 linhas de código. Além disso, o Google está propondo um novo protocolo aberto chamado Agent2AGENT (A2A), permitindo que agentes de IA de diferentes fornecedores se comuniquem.

“2025 será um ano de transição em que a IA generativa muda de responder perguntas únicas para a solução de problemas complexos através de sistemas agentes”, previu Vahdat.

Mais de 50 parceiros, incluindo os principais provedores de software corporativo como Salesforce, ServiceNow e SAP, assinaram assinados para apoiar esse protocolo, sugerindo uma mudança potencial da indústria para sistemas de IA interoperáveis.

Para usuários não técnicos, o Google está aprimorando sua plataforma espacial de agentes com recursos como a Galeria de Agentes (fornecendo uma única visão dos agentes disponíveis) e designer de agentes (uma interface sem código para criar agentes personalizados). Durante uma demonstração, o Google mostrou como um gerente de conta bancária poderia usar essas ferramentas para analisar portfólios de clientes, prever problemas de fluxo de caixa e redigir automaticamente as comunicações do cliente - tudo sem escrever nenhum código.

Dos resumos de documentos a ordens drive-thru: como os agentes de IA especializados do Google estão afetando as indústrias

O Google está integrando profundamente a IA em seu conjunto de produtividade da área de trabalho, introduzindo recursos como "Ajude-me a analisar" em folhas, o que identifica automaticamente informações de dados sem fórmulas explícitas ou tabelas dinâmicas e visões gerais de áudio em documentos, que criam versões de áudio do tipo humano de documentos.

A Companhia destacou cinco categorias de agentes especializados que veem adoção significativa: atendimento ao cliente, trabalho criativo, análise de dados, codificação e segurança.

No atendimento ao cliente, o Google apontou para o sistema de drive-through de Wendy, que agora lida com 60.000 pedidos diariamente, e o agente "Magic Apron" da Home Depot, que oferece orientação para melhoria da casa. Para equipes criativas, empresas como o WPP estão usando a IA do Google para conceituar e produzir campanhas de marketing em escala.

A competição em nuvem IA se intensifica: como a abordagem abrangente do Google desafia a Microsoft e a Amazon

Os anúncios do Google vêm em meio à intensificação da concorrência no espaço da AI na nuvem. A Microsoft integrou profundamente a tecnologia da OpenAI em sua plataforma do Azure, enquanto a Amazon está construindo suas próprias ofertas antrópicas e chips especializados.

Thomas Kurian, CEO da Google Cloud, enfatizou o “compromisso da empresa em fornecer infraestrutura, modelos, plataformas e agentes de classe mundial; oferecendo uma plataforma aberta e multi-nuvem que fornece flexibilidade e escolha; e construindo para interoperabilidade”.

Essa abordagem multifacetada parece projetada para diferenciar o Google dos concorrentes que podem se destacar em áreas específicas, mas não têm a pilha completa de chips a aplicativos.

O futuro da AI Enterprise: por que 'modelos de pensamento' do Google e a interoperabilidade são importantes para a tecnologia de negócios

O que torna os anúncios do Google particularmente significativos é a natureza abrangente de sua estratégia de IA, abrangendo silício personalizado, redes globais, desenvolvimento de modelos, estruturas de agentes e integração de aplicativos.

O foco na otimização de inferência, em vez de apenas os recursos de treinamento, reflete um mercado de IA amadurecido. Enquanto o treinamento de modelos cada vez maiores dominou as manchetes, a implantação desses modelos com eficiência em escala está se tornando o desafio mais premente para as empresas.

A ênfase do Google na interoperabilidade - permitindo que sistemas de diferentes fornecedores trabalhem juntos - pode sinalizar uma mudança para longe das abordagens do jardim murado que caracterizaram as fases anteriores da computação em nuvem. Ao propor protocolos abertos como o Agent2AGENT, o Google está se posicionando como o tecido conjuntivo em um ecossistema heterogêneo da IA, em vez de exigir a adoção de tudo ou nada.

Esses anúncios apresentam oportunidades e desafios para os tomadores de decisão técnicos corporativos. Os ganhos de eficiência prometidos por infraestrutura especializada, como Ironwood TPUs e Cloud Wan, podem reduzir significativamente os custos de implantação da IA ​​em escala. No entanto, navegar no cenário em rápida evolução de modelos, agentes e ferramentas exigirá um planejamento estratégico cuidadoso.

À medida que esses sistemas de IA mais sofisticados continuam a se desenvolver, a capacidade de orquestrar vários agentes especializados de IA que trabalham em concerto pode se tornar o principal diferencial para implementações de IA corporativa. Ao construir os componentes e as conexões entre eles, o Google está apostando que o futuro da IA ​​não é apenas sobre máquinas mais inteligentes, mas em máquinas que podem se comunicar efetivamente.

Artigo relacionado
Imagen 4:谷歌最新AI圖像生成器 Imagen 4:谷歌最新AI圖像生成器 Google近日發表最新圖像生成AI模型「Imagen 4」,宣稱將為用戶帶來比前代Imagen 3更出色的視覺體驗。本週稍早在Google I/O 2025大會亮相的這款新模型,被譽為在畫質與多樣性方面取得重大突破。Google表示,Imagen 4特別擅長處理織物質感、水珠反光與動物毛髮等精細紋理,同時能輕鬆駕馭寫實與抽象風格。其輸出解析度最高可達2K,
谷歌Gemini代碼助手強化AI編程代理功能 谷歌Gemini代碼助手強化AI編程代理功能 Google旗下AI程式開發助手Gemini Code Assist近期推出全新「代理模式」功能,目前開放預覽體驗。在最新Cloud Next大會上,Google展示這些AI代理如何突破性處理複雜編程任務——從Google文件規格書直接生成完整應用程式,或輕鬆實現跨語言程式碼轉換。更令人驚豔的是,開發者現可在Android Studio等整合開發環境中直接啟
谷歌的人工智慧未來基金可能需要謹慎行事 谷歌的人工智慧未來基金可能需要謹慎行事 Google 的新 AI 投資計劃:監管審查下的戰略轉變Google 最近宣布設立 AI 未來基金(AI Futures Fund),這標誌著這家科技巨頭在其塑造人工智慧未來的征程中邁出了大膽的一步。該計劃旨在為初創公司提供急需的資金、早期接觸仍在開發中的尖端人工智慧模型,以及來自 Google 內部專家的指導。儘管這不是 Google 第一次涉足初創企業生
Comentários (35)
0/200
MatthewHill
MatthewHill 18 de Abril de 2025 à0 00:00:00 GMT

Google Cloud's new AI chips and agent ecosystem are a bold move against Microsoft and Amazon! 🤖💪 The 'thinking models' sound cool, but I'm curious to see how they'll actually perform in real-world scenarios. Hope they don't just stay as conference buzzwords! 🚀

GregoryJones
GregoryJones 17 de Abril de 2025 à0 00:00:00 GMT

グーグルクラウドの新しいAIチップとエージェントエコシステム、MicrosoftやAmazonに対抗する大胆な動きだね!🤖💪 「思考モデル」も面白そうだけど、実際のシーンでどれだけ機能するのか気になるな。カンファレンスの話題だけで終わらないことを願ってるよ!🚀

DanielThomas
DanielThomas 18 de Abril de 2025 à0 00:00:00 GMT

구글 클라우드의 새로운 AI 칩과 에이전트 생태계, 마이크로소프트와 아마존에 맞서는 대담한 움직임이야! 🤖💪 '생각 모델'도 재미있어 보이지만, 실제 상황에서 얼마나 기능할지 궁금해. 컨퍼런스 화제로만 끝나지 않길 바래! 🚀

JasonMartin
JasonMartin 17 de Abril de 2025 à0 00:00:00 GMT

Os novos chips de IA e o ecossistema de agentes do Google Cloud são uma jogada ousada contra a Microsoft e a Amazon! 🤖💪 Os 'modelos de pensamento' parecem legais, mas estou curioso para ver como eles vão se sair em cenários reais. Espero que não fiquem só como palavras de ordem em conferências! 🚀

RogerGonzalez
RogerGonzalez 17 de Abril de 2025 à0 00:00:00 GMT

¡Los nuevos chips de IA y el ecosistema de agentes de Google Cloud son un movimiento audaz contra Microsoft y Amazon! 🤖💪 Los 'modelos de pensamiento' suenan geniales, pero tengo curiosidad por ver cómo funcionarán en escenarios del mundo real. ¡Espero que no se queden solo como palabras de moda en conferencias! 🚀

FrankMartínez
FrankMartínez 17 de Abril de 2025 à0 00:00:00 GMT

Google Cloud's new AI chips and agent ecosystem are pretty cool! They're really stepping up their game against Microsoft and Amazon. I'm excited to see how these 'thinking models' will shake things up. The only downside is the learning curve might be steep. Can't wait to dive in and see what I can do with them! 🤓🚀

De volta ao topo
OR