O Google revela novos Kubernetes e aprimoramentos de GKE para a IA Innovation

O impulso do Google para a IA não é segredo, e com boa razão. Como o CEO Sundar Pichai enfatizou em uma reunião interna antes das férias do último ano, "Em 2025, precisamos estar incansavelmente focados em desbloquear os benefícios da tecnologia [AI] e resolver problemas reais dos usuários." Essa visão está levando o Google a aprimorar significativamente suas ofertas, especialmente em serviços em nuvem e integração de IA.
No evento Google Cloud Next 2025 em Las Vegas, o Google revelou avanços substanciais no Kubernetes e no Google Kubernetes Engine (GKE). Essas atualizações visam capacitar equipes de plataforma e desenvolvedores a utilizar a IA enquanto aproveitam sua expertise existente em Kubernetes. Gabe Monroy, vice-presidente de Cloud Runtimes do Google, resumiu: "Suas habilidades e investimentos em Kubernetes não são apenas relevantes; eles são seu superpoder de IA."
Então, quais são exatamente esses novos avanços? Vamos mergulhar nos detalhes.
Gerenciamento Simplificado de Clusters de IA: O GKE está introduzindo um gerenciamento simplificado de clusters de IA por meio de ferramentas como o Cluster Director para GKE, anteriormente conhecido como Hypercompute Cluster. Essa ferramenta permite que os usuários implementem e gerenciem grandes clusters de máquinas virtuais (VMs) com GPUs Nvidia anexadas, facilitando a escalabilidade eficiente de cargas de trabalho de IA.
Um serviço futuro relacionado é o Cluster Director para Slurm. O Slurm, um agendador de tarefas e gerenciador de carga de trabalho de código aberto para Linux, será mais fácil de provisionar e operar graças à interface de usuário simplificada e APIs do Google. Estas incluirão blueprints para cargas de trabalho típicas com software pré-configurado, garantindo implementações confiáveis e repetíveis.
Implantação Otimizada de Modelos de IA: Os novos recursos do GKE também focam na otimização da implantação de modelos de IA. O GKE Inference Quickstart e o GKE Inference Gateway simplificam a seleção e implantação de modelos de IA, garantindo que eles tenham bom desempenho com balanceamento de carga inteligente.
Gabe Monroy destacou a tendência de inovação em IA intersectando com computação tradicional, particularmente no campo da inferência. Ele observou: "Estamos vendo uma clara tendência na era da IA: uma inovação incrível está acontecendo onde a computação tradicional interage com redes neurais — também conhecida como 'inferência'. Empresas na vanguarda do Kubernetes e da IA, como LiveX e Moloco, executam inferência de IA no GKE."
Inferência Econômica: O GKE está avançando na inferência econômica com o Inference Gateway. Monroy afirma que essa abordagem pode reduzir os custos de serviço em até 30%, diminuir a latência em até 60% e aumentar a vazão em 40% em comparação com outras ofertas gerenciadas e de código aberto do Kubernetes. Embora esses números sejam promissores, será necessário vê-los em ação para confirmar seu impacto.
O balanceamento de carga ciente de modelos é um componente chave dessa estratégia. Dadas as respostas de comprimento variável em modelos de IA, métodos tradicionais de balanceamento de carga como round-robin podem ser ineficientes. No entanto, o Inference Gateway oferece um gateway ciente de modelos otimizado para IA, com roteamento avançado para diferentes versões de modelos.
Eficiência de Recursos Aprimorada: O GKE também está focado em melhorar a eficiência de recursos. O GKE Autopilot agora oferece agendamento de pods mais rápido, tempos de reação de escalabilidade mais rápidos e dimensionamento de capacidade mais adequado. Isso significa que os usuários podem lidar com mais tráfego com os mesmos recursos ou manter o tráfego existente com menos recursos. O Google afirma que, com o Autopilot aprimorado, a capacidade do cluster será sempre dimensionada corretamente.
Atualmente, o Autopilot inclui uma ferramenta de configuração de cluster de melhores práticas e uma plataforma de computação otimizada para contêineres que ajusta automaticamente a capacidade para corresponder às cargas de trabalho. No entanto, ele não dimensiona clusters existentes sem uma configuração específica. A partir do terceiro trimestre, a plataforma de computação otimizada para contêineres do Autopilot também estará disponível para clusters GKE padrão sem necessidade de configuração específica, o que pode ser um divisor de águas.
Assistência em Nuvem Habilitada por IA com Gemini: Depurar e diagnosticar problemas de aplicativos pode desacelerar significativamente a inovação. Para resolver isso, o Google apresentou o Gemini Cloud Assist, oferecendo assistência alimentada por IA ao longo do ciclo de vida do aplicativo. A prévia privada do Gemini Cloud Assist Investigations ajuda os usuários a entender rapidamente as causas raiz e resolver problemas.
A melhor parte? O Assist Investigations estará acessível diretamente do console GKE, reduzindo o tempo de solução de problemas e liberando mais tempo para inovação. Ele permitirá diagnosticar problemas de pods e clusters a partir do console GKE em vários serviços do Google Cloud, incluindo nós, IAM e balanceadores de carga. Você pode visualizar logs e erros em vários serviços GKE, controladores, pods e nós subjacentes. Inscreva-se na prévia privada para experimentar esse recurso em primeira mão.
Como parte de sua estratégia mais ampla de tecnologia emergente, o Google está se posicionando como líder em plataformas otimizadas para IA. Esses desenvolvimentos permitem que empresas de vários setores usem a IA de forma mais eficaz, impulsionando a inovação e a eficiência em operações e experiências do cliente.
Por exemplo, a Intuit utiliza o Document AI e o Gemini do Google Cloud para simplificar a preparação de impostos para milhões de usuários do TurboTax. O Reddit usa o Gemini via Vertex AI, o construtor de agentes de IA do Google, para aprimorar o Reddit Answers, uma nova plataforma de conversação alimentada por IA projetada para melhorar a experiência da página inicial.
O Google conseguirá executar essas transformações habilitadas por IA com sucesso? Só o tempo dirá. Como Pichai afirmou em dezembro, "Na história, você nem sempre precisa ser o primeiro, mas precisa executar bem e realmente ser o melhor em sua classe como produto. Acho que é disso que se trata 2025."
Artigo relacionado
Navegando pela nova norma de segurança em IA do ETSI
A norma ETSI EN 304 223 estabelece requisitos básicos de segurança para a inteligência artificial que as organizações devem incorporar em suas estruturas de governança.À medida que as empresas integra
O Gmail lança uma Caixa de Entrada personalizada com IA, resumos com IA na pesquisa e muito mais
O Google lançou uma nova caixa de entrada do Gmail com tecnologia de IA que oferece uma visão geral personalizada das suas tarefas e mantém você informado sobre as principais atualizações. Além disso,
Primeira Base de Criação de Séries de Quadrinhos com IA do Baidu em Shandong é inaugurada em Zibo
Em 27 de abril, a província de Shandong alcançou um marco na criação cultural digital com o lançamento oficial de sua primeira base de criação de séries de quadrinhos com IA da Baidu na Faculdade Norm
Recomendações de tópicos especiais relacionados
Comentários (49)
Google's Kubernetes-Updates für KI sind echt spannend! 🚀 Aber mal ehrlich, wann wird das für kleinere Teams bezahlbar? Die Konkurrenz schläft ja nicht. Finde den Fokus auf 'echte Probleme' gut, aber die Komplexität bleibt eine Hürde.
Pas mal ces améliorations Kubernetes pour l'IA ! Après c'est toujours la même question : est-ce que Google va réussir à rattraper son retard face à Azure et AWS sur le cloud IA ? 🧐 L'approche 'open source' pourrait faire la différence...
Interesante ver cómo Google sigue integrando Kubernetes con IA 🚀. Pero me pregunto, ¿estas mejoras realmente simplificarán la vida de los desarrolladores o solo añadirán más complejidad? Ojalá incluyan buenos tutoriales para principiantes.
Los avances de Google en Kubernetes y GKE para IA suenan prometedores, pero ¿realmente simplificarán el trabajo de los desarrolladores o solo agregarán más capas de complejidad? 🤔 A veces siento que estas actualizaciones son más para el marketing que para solucionar problemas reales.
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀

O impulso do Google para a IA não é segredo, e com boa razão. Como o CEO Sundar Pichai enfatizou em uma reunião interna antes das férias do último ano, "Em 2025, precisamos estar incansavelmente focados em desbloquear os benefícios da tecnologia [AI] e resolver problemas reais dos usuários." Essa visão está levando o Google a aprimorar significativamente suas ofertas, especialmente em serviços em nuvem e integração de IA.
No evento Google Cloud Next 2025 em Las Vegas, o Google revelou avanços substanciais no Kubernetes e no Google Kubernetes Engine (GKE). Essas atualizações visam capacitar equipes de plataforma e desenvolvedores a utilizar a IA enquanto aproveitam sua expertise existente em Kubernetes. Gabe Monroy, vice-presidente de Cloud Runtimes do Google, resumiu: "Suas habilidades e investimentos em Kubernetes não são apenas relevantes; eles são seu superpoder de IA."
Então, quais são exatamente esses novos avanços? Vamos mergulhar nos detalhes.
Gerenciamento Simplificado de Clusters de IA: O GKE está introduzindo um gerenciamento simplificado de clusters de IA por meio de ferramentas como o Cluster Director para GKE, anteriormente conhecido como Hypercompute Cluster. Essa ferramenta permite que os usuários implementem e gerenciem grandes clusters de máquinas virtuais (VMs) com GPUs Nvidia anexadas, facilitando a escalabilidade eficiente de cargas de trabalho de IA.
Um serviço futuro relacionado é o Cluster Director para Slurm. O Slurm, um agendador de tarefas e gerenciador de carga de trabalho de código aberto para Linux, será mais fácil de provisionar e operar graças à interface de usuário simplificada e APIs do Google. Estas incluirão blueprints para cargas de trabalho típicas com software pré-configurado, garantindo implementações confiáveis e repetíveis.
Implantação Otimizada de Modelos de IA: Os novos recursos do GKE também focam na otimização da implantação de modelos de IA. O GKE Inference Quickstart e o GKE Inference Gateway simplificam a seleção e implantação de modelos de IA, garantindo que eles tenham bom desempenho com balanceamento de carga inteligente.
Gabe Monroy destacou a tendência de inovação em IA intersectando com computação tradicional, particularmente no campo da inferência. Ele observou: "Estamos vendo uma clara tendência na era da IA: uma inovação incrível está acontecendo onde a computação tradicional interage com redes neurais — também conhecida como 'inferência'. Empresas na vanguarda do Kubernetes e da IA, como LiveX e Moloco, executam inferência de IA no GKE."
Inferência Econômica: O GKE está avançando na inferência econômica com o Inference Gateway. Monroy afirma que essa abordagem pode reduzir os custos de serviço em até 30%, diminuir a latência em até 60% e aumentar a vazão em 40% em comparação com outras ofertas gerenciadas e de código aberto do Kubernetes. Embora esses números sejam promissores, será necessário vê-los em ação para confirmar seu impacto.
O balanceamento de carga ciente de modelos é um componente chave dessa estratégia. Dadas as respostas de comprimento variável em modelos de IA, métodos tradicionais de balanceamento de carga como round-robin podem ser ineficientes. No entanto, o Inference Gateway oferece um gateway ciente de modelos otimizado para IA, com roteamento avançado para diferentes versões de modelos.
Eficiência de Recursos Aprimorada: O GKE também está focado em melhorar a eficiência de recursos. O GKE Autopilot agora oferece agendamento de pods mais rápido, tempos de reação de escalabilidade mais rápidos e dimensionamento de capacidade mais adequado. Isso significa que os usuários podem lidar com mais tráfego com os mesmos recursos ou manter o tráfego existente com menos recursos. O Google afirma que, com o Autopilot aprimorado, a capacidade do cluster será sempre dimensionada corretamente.
Atualmente, o Autopilot inclui uma ferramenta de configuração de cluster de melhores práticas e uma plataforma de computação otimizada para contêineres que ajusta automaticamente a capacidade para corresponder às cargas de trabalho. No entanto, ele não dimensiona clusters existentes sem uma configuração específica. A partir do terceiro trimestre, a plataforma de computação otimizada para contêineres do Autopilot também estará disponível para clusters GKE padrão sem necessidade de configuração específica, o que pode ser um divisor de águas.
Assistência em Nuvem Habilitada por IA com Gemini: Depurar e diagnosticar problemas de aplicativos pode desacelerar significativamente a inovação. Para resolver isso, o Google apresentou o Gemini Cloud Assist, oferecendo assistência alimentada por IA ao longo do ciclo de vida do aplicativo. A prévia privada do Gemini Cloud Assist Investigations ajuda os usuários a entender rapidamente as causas raiz e resolver problemas.
A melhor parte? O Assist Investigations estará acessível diretamente do console GKE, reduzindo o tempo de solução de problemas e liberando mais tempo para inovação. Ele permitirá diagnosticar problemas de pods e clusters a partir do console GKE em vários serviços do Google Cloud, incluindo nós, IAM e balanceadores de carga. Você pode visualizar logs e erros em vários serviços GKE, controladores, pods e nós subjacentes. Inscreva-se na prévia privada para experimentar esse recurso em primeira mão.
Como parte de sua estratégia mais ampla de tecnologia emergente, o Google está se posicionando como líder em plataformas otimizadas para IA. Esses desenvolvimentos permitem que empresas de vários setores usem a IA de forma mais eficaz, impulsionando a inovação e a eficiência em operações e experiências do cliente.
Por exemplo, a Intuit utiliza o Document AI e o Gemini do Google Cloud para simplificar a preparação de impostos para milhões de usuários do TurboTax. O Reddit usa o Gemini via Vertex AI, o construtor de agentes de IA do Google, para aprimorar o Reddit Answers, uma nova plataforma de conversação alimentada por IA projetada para melhorar a experiência da página inicial.
O Google conseguirá executar essas transformações habilitadas por IA com sucesso? Só o tempo dirá. Como Pichai afirmou em dezembro, "Na história, você nem sempre precisa ser o primeiro, mas precisa executar bem e realmente ser o melhor em sua classe como produto. Acho que é disso que se trata 2025."
Navegando pela nova norma de segurança em IA do ETSI
A norma ETSI EN 304 223 estabelece requisitos básicos de segurança para a inteligência artificial que as organizações devem incorporar em suas estruturas de governança.À medida que as empresas integra
O Gmail lança uma Caixa de Entrada personalizada com IA, resumos com IA na pesquisa e muito mais
O Google lançou uma nova caixa de entrada do Gmail com tecnologia de IA que oferece uma visão geral personalizada das suas tarefas e mantém você informado sobre as principais atualizações. Além disso,
Primeira Base de Criação de Séries de Quadrinhos com IA do Baidu em Shandong é inaugurada em Zibo
Em 27 de abril, a província de Shandong alcançou um marco na criação cultural digital com o lançamento oficial de sua primeira base de criação de séries de quadrinhos com IA da Baidu na Faculdade Norm
Google's Kubernetes-Updates für KI sind echt spannend! 🚀 Aber mal ehrlich, wann wird das für kleinere Teams bezahlbar? Die Konkurrenz schläft ja nicht. Finde den Fokus auf 'echte Probleme' gut, aber die Komplexität bleibt eine Hürde.
Pas mal ces améliorations Kubernetes pour l'IA ! Après c'est toujours la même question : est-ce que Google va réussir à rattraper son retard face à Azure et AWS sur le cloud IA ? 🧐 L'approche 'open source' pourrait faire la différence...
Interesante ver cómo Google sigue integrando Kubernetes con IA 🚀. Pero me pregunto, ¿estas mejoras realmente simplificarán la vida de los desarrolladores o solo añadirán más complejidad? Ojalá incluyan buenos tutoriales para principiantes.
Los avances de Google en Kubernetes y GKE para IA suenan prometedores, pero ¿realmente simplificarán el trabajo de los desarrolladores o solo agregarán más capas de complejidad? 🤔 A veces siento que estas actualizaciones son más para el marketing que para solucionar problemas reales.
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀





Lar






