Google揭示了AI创新的新的Kubernetes和GKE增强功能

谷歌对AI的投入众所周知,且理由充分。正如首席执行官桑达尔·皮查伊在去年假期前的内部会议上强调:“2025年,我们需不懈专注于释放[AI]技术的潜力,解决用户的实际问题。”这一愿景推动谷歌显著增强其产品,特别是在云服务和AI整合方面。
在2025年拉斯维加斯举行的Google Cloud Next活动中,谷歌公布了Kubernetes和Google Kubernetes Engine(GKE)的重大进展。这些更新旨在赋能平台团队和开发者利用AI,同时发挥现有的Kubernetes专长。谷歌云运行时副总裁加布·蒙罗伊简洁地表示:“你的Kubernetes技能和投资不仅重要,它们是你的AI超级力量。”
那么,这些新进展具体是什么?让我们深入了解细节。
简化的AI集群管理:GKE推出简化的AI集群管理工具,如Cluster Director for GKE,此前称为Hypercompute Cluster。该工具允许用户部署和管理带有Nvidia GPU的大型虚拟机(VM)集群,使AI工作负载的扩展更高效。
即将推出的相关服务是Cluster Director for Slurm。Slurm是一个开源的Linux作业调度和工作负载管理器,通过谷歌简化的用户界面和API将更容易配置和操作。这些将包括典型工作负载的蓝图,预配置软件,确保可靠且可重复的部署。
优化的AI模型部署:GKE的新功能还专注于优化AI模型部署。GKE Inference Quickstart和GKE Inference Gateway简化了AI模型的选择和部署,确保通过智能负载均衡实现良好性能。
加布·蒙罗伊强调了AI创新与传统计算的交汇趋势,特别是在推理领域。他指出:“在AI时代,我们看到一个明显趋势:传统计算与神经网络交互的惊人创新——也就是‘推理’。在Kubernetes和AI前沿运营的公司,如LiveX和Moloco,在GKE上运行AI推理。”
成本效益高的推理:GKE在成本效益高的推理方面取得进展,通过Inference Gateway实现。蒙罗伊称,这种方法可将服务成本降低高达30%,延迟减少高达60%,吞吐量提高40%,相较于其他托管和开源Kubernetes产品。这些数据令人振奋,但需实际应用来验证其影响。
模型感知的负载均衡是这一策略的关键。由于AI模型的响应长度可变,传统的轮询负载均衡方法可能效率低下。然而,Inference Gateway提供针对AI优化的模型感知网关,支持不同模型版本的高级路由。
提升资源效率:GKE还致力于提升资源效率。GKE Autopilot现提供更快的Pod调度、更快的扩展反应时间和更好的容量适配。这意味着用户可用相同资源处理更多流量,或以更少资源维持现有流量。谷歌声称,改进后的Autopilot将始终确保集群容量适配。
目前,Autopilot包括最佳实践的集群配置工具和自动调整容量以匹配工作负载的容器优化计算平台。但在没有特定配置的情况下,它无法适配现有集群。从第三季度开始,Autopilot的容器优化计算平台将无需特定配置即可用于标准GKE集群,这可能改变游戏规则。
AI赋能的Gemini Cloud Assist:调试和诊断应用问题可能显著减缓创新速度。为此,谷歌推出Gemini Cloud Assist,提供AI驱动的应用生命周期协助。Gemini Cloud Assist Investigations的私人预览版帮助用户快速了解根本原因并解决问题。
最佳部分?Assist Investigations可直接从GKE控制台访问,减少故障排查时间,为创新腾出更多时间。它允许从GKE控制台诊断Pod和集群问题,涵盖节点、IAM和负载均衡器等Google Cloud服务。用户可查看多个GKE服务、控制器、Pod和底层节点的日志和错误。注册私人预览以亲身体验此功能。
作为其更广泛的新兴技术战略的一部分,谷歌正定位为AI优化平台的领导者。这些发展使各行业企业能更有效地使用AI,推动运营和客户体验的创新与效率。
例如,Intuit利用Google Cloud的Document AI和Gemini简化了数百万TurboTax用户的税务准备。Reddit通过Vertex AI的Gemini增强Reddit Answers,这是一个新的AI驱动的对话平台,旨在改善主页体验。
谷歌能否成功执行这些AI赋能的转型?时间会告诉我们答案。正如皮查伊在12月所说:“历史上,你不一定需要第一个,但必须执行出色,真正成为产品中的最佳。我认为这就是2025年的意义所在。”
相关文章
AI驱动的音乐创作:轻松打造歌曲与视频
音乐创作可能复杂,需要时间、资源和专业知识。人工智能已转变这一过程,使其简单易用。本指南介绍如何利用AI让任何人都能免费创作独特的歌曲和视觉效果,开启新的创作可能性。我们探索了具有直观界面和先进AI的平台,将您的音乐创意转化为现实,无需高昂成本。关键要点AI可生成完整歌曲,包括人声,而不仅是器乐。Suno AI和Hailuo AI等平台提供免费音乐创作工具。ChatGPT等AI工具可简化歌词创作,
创建AI驱动的着色书:综合指南
设计着色书是一项回报丰厚的追求,结合艺术表达与用户放松体验。然而,过程可能劳动密集。幸运的是,AI工具简化了高质量、统一着色页的创建。本指南提供使用AI制作着色书的逐步方法,重点在于一致风格与最佳效率的技术。关键要点使用AI提示工具开发详细、结构化的着色页提示。确保着色书所有页面艺术风格的统一性。生成单一着色页设计的多样化变体。利用Ideogram等AI平台快速、高效创建着色书。优化提示以解决不一
Qodo与Google Cloud合作,为开发者提供免费AI代码审查工具
Qodo,一家专注于代码质量的以色列AI编码初创公司,已与Google Cloud建立合作关系,以增强AI生成软件的完整性。随着企业越来越依赖AI进行编码,对强大的监督和质量保证工具的需求不断增长。Qodo的首席执行官伊塔马尔·弗里德曼指出,AI生成的代码现已成为现代开发的核心。“想象一个未来,AI编写所有代码;人类无法全部审查,”弗里德曼说。“我们需要系统来确保代码符合预期价值观。”Qodo的创
评论 (45)
0/200
JasonHarris
2025-04-22 17:46:09
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀
0
RaymondRodriguez
2025-04-22 12:59:07
Las actualizaciones de Google para Kubernetes y GKE enfocadas en IA son bastante geniales. Realmente están subiendo el nivel en la innovación de IA. Es genial verlos enfocados en resolver problemas reales de los usuarios. ¡No puedo esperar a ver qué vendrá después! 🚀
0
HarryLewis
2025-04-21 10:25:32
구글의 쿠버네티스와 GKE의 AI 관련 업데이트 정말 멋지네요! AI 혁신에 정말 열심히 하고 있는 것 같아요. 사용자의 문제를 해결하는 데 집중하는 것도 훌륭해요. 다음에 어떤 것이 나올지 기대돼요! 🚀
0
StevenNelson
2025-04-20 15:39:43
GoogleのKubernetesとGKEの強化はAIイノベーションにはすごいけど、ちょっと難しすぎるかな。😅 ユーザーの問題を解決しようとする努力は評価するけど、もっとユーザーフレンドリーな説明が欲しいな。でも、AIとテクノロジーに興味があるなら、チェックする価値はあるよ!👀
0
RaymondWalker
2025-04-19 08:59:15
¡Las nuevas mejoras de Google en Kubernetes y GKE son bastante buenas para la innovación en IA! Está claro que están empujando fuerte para resolver problemas reales de los usuarios. Solo desearía que la documentación fuera un poco más clara, es un poco complicado navegar por ella. 😓 Aún así, es un paso en la dirección correcta!
0
EmmaJohnson
2025-04-19 02:52:50
Googleの新しいKubernetesとGKEの強化は、AIイノベーションにとって素晴らしいですね!ユーザーの実際の問題を解決するために本気で取り組んでいることがわかります。ただ、ドキュメントがもう少し分かりやすければ良かったのに、少し見つけにくいです。😓それでも、前進の一歩ですね!
0
谷歌对AI的投入众所周知,且理由充分。正如首席执行官桑达尔·皮查伊在去年假期前的内部会议上强调:“2025年,我们需不懈专注于释放[AI]技术的潜力,解决用户的实际问题。”这一愿景推动谷歌显著增强其产品,特别是在云服务和AI整合方面。
在2025年拉斯维加斯举行的Google Cloud Next活动中,谷歌公布了Kubernetes和Google Kubernetes Engine(GKE)的重大进展。这些更新旨在赋能平台团队和开发者利用AI,同时发挥现有的Kubernetes专长。谷歌云运行时副总裁加布·蒙罗伊简洁地表示:“你的Kubernetes技能和投资不仅重要,它们是你的AI超级力量。”
那么,这些新进展具体是什么?让我们深入了解细节。
简化的AI集群管理:GKE推出简化的AI集群管理工具,如Cluster Director for GKE,此前称为Hypercompute Cluster。该工具允许用户部署和管理带有Nvidia GPU的大型虚拟机(VM)集群,使AI工作负载的扩展更高效。
即将推出的相关服务是Cluster Director for Slurm。Slurm是一个开源的Linux作业调度和工作负载管理器,通过谷歌简化的用户界面和API将更容易配置和操作。这些将包括典型工作负载的蓝图,预配置软件,确保可靠且可重复的部署。
优化的AI模型部署:GKE的新功能还专注于优化AI模型部署。GKE Inference Quickstart和GKE Inference Gateway简化了AI模型的选择和部署,确保通过智能负载均衡实现良好性能。
加布·蒙罗伊强调了AI创新与传统计算的交汇趋势,特别是在推理领域。他指出:“在AI时代,我们看到一个明显趋势:传统计算与神经网络交互的惊人创新——也就是‘推理’。在Kubernetes和AI前沿运营的公司,如LiveX和Moloco,在GKE上运行AI推理。”
成本效益高的推理:GKE在成本效益高的推理方面取得进展,通过Inference Gateway实现。蒙罗伊称,这种方法可将服务成本降低高达30%,延迟减少高达60%,吞吐量提高40%,相较于其他托管和开源Kubernetes产品。这些数据令人振奋,但需实际应用来验证其影响。
模型感知的负载均衡是这一策略的关键。由于AI模型的响应长度可变,传统的轮询负载均衡方法可能效率低下。然而,Inference Gateway提供针对AI优化的模型感知网关,支持不同模型版本的高级路由。
提升资源效率:GKE还致力于提升资源效率。GKE Autopilot现提供更快的Pod调度、更快的扩展反应时间和更好的容量适配。这意味着用户可用相同资源处理更多流量,或以更少资源维持现有流量。谷歌声称,改进后的Autopilot将始终确保集群容量适配。
目前,Autopilot包括最佳实践的集群配置工具和自动调整容量以匹配工作负载的容器优化计算平台。但在没有特定配置的情况下,它无法适配现有集群。从第三季度开始,Autopilot的容器优化计算平台将无需特定配置即可用于标准GKE集群,这可能改变游戏规则。
AI赋能的Gemini Cloud Assist:调试和诊断应用问题可能显著减缓创新速度。为此,谷歌推出Gemini Cloud Assist,提供AI驱动的应用生命周期协助。Gemini Cloud Assist Investigations的私人预览版帮助用户快速了解根本原因并解决问题。
最佳部分?Assist Investigations可直接从GKE控制台访问,减少故障排查时间,为创新腾出更多时间。它允许从GKE控制台诊断Pod和集群问题,涵盖节点、IAM和负载均衡器等Google Cloud服务。用户可查看多个GKE服务、控制器、Pod和底层节点的日志和错误。注册私人预览以亲身体验此功能。
作为其更广泛的新兴技术战略的一部分,谷歌正定位为AI优化平台的领导者。这些发展使各行业企业能更有效地使用AI,推动运营和客户体验的创新与效率。
例如,Intuit利用Google Cloud的Document AI和Gemini简化了数百万TurboTax用户的税务准备。Reddit通过Vertex AI的Gemini增强Reddit Answers,这是一个新的AI驱动的对话平台,旨在改善主页体验。
谷歌能否成功执行这些AI赋能的转型?时间会告诉我们答案。正如皮查伊在12月所说:“历史上,你不一定需要第一个,但必须执行出色,真正成为产品中的最佳。我认为这就是2025年的意义所在。”




Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀




Las actualizaciones de Google para Kubernetes y GKE enfocadas en IA son bastante geniales. Realmente están subiendo el nivel en la innovación de IA. Es genial verlos enfocados en resolver problemas reales de los usuarios. ¡No puedo esperar a ver qué vendrá después! 🚀




구글의 쿠버네티스와 GKE의 AI 관련 업데이트 정말 멋지네요! AI 혁신에 정말 열심히 하고 있는 것 같아요. 사용자의 문제를 해결하는 데 집중하는 것도 훌륭해요. 다음에 어떤 것이 나올지 기대돼요! 🚀




GoogleのKubernetesとGKEの強化はAIイノベーションにはすごいけど、ちょっと難しすぎるかな。😅 ユーザーの問題を解決しようとする努力は評価するけど、もっとユーザーフレンドリーな説明が欲しいな。でも、AIとテクノロジーに興味があるなら、チェックする価値はあるよ!👀




¡Las nuevas mejoras de Google en Kubernetes y GKE son bastante buenas para la innovación en IA! Está claro que están empujando fuerte para resolver problemas reales de los usuarios. Solo desearía que la documentación fuera un poco más clara, es un poco complicado navegar por ella. 😓 Aún así, es un paso en la dirección correcta!




Googleの新しいKubernetesとGKEの強化は、AIイノベーションにとって素晴らしいですね!ユーザーの実際の問題を解決するために本気で取り組んでいることがわかります。ただ、ドキュメントがもう少し分かりやすければ良かったのに、少し見つけにくいです。😓それでも、前進の一歩ですね!












