Maison
Google révèle de nouvelles améliorations de Kubernetes et GKE pour l'innovation de l'IA

L'incursion de Google dans l'IA n'est un secret pour personne, et pour cause. Comme l'a souligné le PDG Sundar Pichai lors d'une réunion interne avant les fêtes de l'année dernière, « En 2025, nous devons nous concentrer sans relâche sur l'exploitation des avantages de la technologie [IA] et sur la résolution des véritables problèmes des utilisateurs. » Cette vision pousse Google à améliorer considérablement ses offres, en particulier dans les services cloud et l'intégration de l'IA.
Lors de l'événement Google Cloud Next 2025 à Las Vegas, Google a dévoilé des avancées significatives dans Kubernetes et Google Kubernetes Engine (GKE). Ces mises à jour visent à permettre aux équipes de plateforme et aux développeurs d'exploiter l'IA tout en tirant parti de leur expertise existante en Kubernetes. Gabe Monroy, vice-président de Google pour les runtimes cloud, l'a résumé ainsi : « Vos compétences et investissements dans Kubernetes ne sont pas seulement pertinents ; ils sont votre superpouvoir en IA. »
Alors, quelles sont exactement ces nouvelles avancées ? Entrons dans les détails.
Gestion simplifiée des clusters IA : GKE introduit une gestion simplifiée des clusters IA grâce à des outils comme Cluster Director pour GKE, anciennement connu sous le nom de Hypercompute Cluster. Cet outil permet aux utilisateurs de déployer et de gérer de grands clusters de machines virtuelles (VM) avec des GPU Nvidia attachés, facilitant ainsi la mise à l'échelle efficace des charges de travail IA.
Un service à venir connexe est Cluster Director pour Slurm. Slurm, un ordonnanceur de tâches open-source et gestionnaire de charge de travail pour Linux, sera plus facile à provisionner et à exploiter grâce à l'interface utilisateur simplifiée et aux API de Google. Celles-ci incluront des modèles pour les charges de travail typiques avec des logiciels préconfigurés, garantissant des déploiements fiables et reproductibles.
Déploiement optimisé des modèles IA : Les nouvelles fonctionnalités de GKE se concentrent également sur l'optimisation du déploiement des modèles IA. Le GKE Inference Quickstart et le GKE Inference Gateway simplifient la sélection et le déploiement des modèles IA, garantissant qu'ils fonctionnent bien avec un équilibrage de charge intelligent.
Gabe Monroy a souligné la tendance de l'innovation en IA à intersecter avec l'informatique traditionnelle, en particulier dans le domaine de l'inférence. Il a noté : « Nous constatons une tendance claire à l'ère de l'IA : une innovation remarquable se produit là où l'informatique traditionnelle interagit avec les réseaux neuronaux – autrement dit, l'« inférence ». Des entreprises à la pointe de Kubernetes et de l'IA, comme LiveX et Moloco, exécutent l'inférence IA sur GKE. »
Inférence économique : GKE progresse dans l'inférence économique avec l'Inference Gateway. Monroy affirme que cette approche peut réduire les coûts de service jusqu'à 30 %, diminuer la latence jusqu'à 60 % et augmenter le débit de 40 % par rapport à d'autres offres Kubernetes gérées et open-source. Bien que ces chiffres soient prometteurs, il faudra les voir en action pour confirmer leur impact.
L'équilibrage de charge conscient des modèles est un élément clé de cette stratégie. Étant donné les longueurs de réponse variables des modèles IA, les méthodes traditionnelles d'équilibrage de charge comme le round-robin peuvent être inefficaces. Cependant, l'Inference Gateway offre une passerelle consciente des modèles optimisée pour l'IA, avec un routage avancé vers différentes versions de modèles.
Amélioration de l'efficacité des ressources : GKE se concentre également sur l'amélioration de l'efficacité des ressources. Le GKE Autopilot offre désormais un ordonnancement plus rapide des pods, des temps de réaction plus courts pour la mise à l'échelle et une meilleure adaptation de la capacité. Cela signifie que les utilisateurs peuvent gérer plus de trafic avec les mêmes ressources ou maintenir le trafic existant avec moins de ressources. Google affirme qu'avec l'Autopilot amélioré, la capacité des clusters sera toujours correctement dimensionnée.
Actuellement, Autopilot inclut un outil de configuration de cluster selon les meilleures pratiques et une plateforme de calcul optimisée pour les conteneurs qui ajuste automatiquement la capacité en fonction des charges de travail. Cependant, il ne redimensionne pas les clusters existants sans une configuration spécifique. À partir du troisième trimestre, la plateforme de calcul optimisée pour les conteneurs d'Autopilot sera également disponible pour les clusters GKE standards sans nécessiter de configuration spécifique, ce qui pourrait changer la donne.
Assistance cloud Gemini activée par l'IA : Le débogage et le diagnostic des problèmes d'application peuvent ralentir considérablement l'innovation. Pour y remédier, Google a introduit Gemini Cloud Assist, offrant une assistance alimentée par l'IA tout au long du cycle de vie de l'application. L'aperçu privé de Gemini Cloud Assist Investigations aide les utilisateurs à comprendre rapidement les causes profondes et à résoudre les problèmes.
Le meilleur ? Assist Investigations sera accessible directement depuis la console GKE, réduisant le temps de dépannage et libérant plus de temps pour l'innovation. Il permettra de diagnostiquer les problèmes de pods et de clusters depuis la console GKE à travers divers services Google Cloud, y compris les nœuds, IAM et les équilibreurs de charge. Vous pourrez consulter les journaux et les erreurs à travers plusieurs services GKE, contrôleurs, pods et nœuds sous-jacents. Inscrivez-vous pour l'aperçu privé afin de découvrir cette fonctionnalité de première main.
Dans le cadre de sa stratégie plus large en matière de technologies émergentes, Google se positionne comme un leader dans les plateformes optimisées pour l'IA. Ces développements permettent aux entreprises de divers secteurs d'utiliser l'IA plus efficacement, stimulant l'innovation et l'efficacité dans les opérations et les expériences client.
Par exemple, Intuit exploite Document AI et Gemini de Google Cloud pour simplifier la préparation des impôts pour des millions d'utilisateurs de TurboTax. Reddit utilise Gemini via Vertex AI, le constructeur d'agents IA de Google, pour améliorer Reddit Answers, une nouvelle plateforme de conversation alimentée par l'IA conçue pour améliorer l'expérience de la page d'accueil.
Google peut-il réussir ces transformations activées par l'IA ? Seul le temps le dira. Comme l'a déclaré Pichai en décembre, « Dans l'histoire, il n'est pas toujours nécessaire d'être le premier, mais il faut bien exécuter et vraiment être le meilleur dans sa catégorie en tant que produit. Je pense que c'est ce que 2025 représente. »
Article connexe
Google Photos redonne vie à la garde-robe emblématique de « Clueless » grâce à l'IA
Google Photos a annoncé mercredi une nouvelle fonctionnalité basée sur l'IA qui permettra bientôt de transformer les photos de vos vêtements en une garde-robe numérique, vous permettant ainsi de créer
La série « Red Fruit » accusée d'utiliser l'IA pour voler les visages de personnes lambda ; aucune réaction officielle
Le secteur des courtes vidéos fait actuellement l'objet d'une polémique liée à des violations impliquant l'IA. La production de Red Fruit Short Drama intitulée « The Peach Hairpin » a été accusée d’ut
Comprendre la nouvelle norme ETSI en matière de sécurité de l'IA
La norme ETSI EN 304 223 définit les exigences fondamentales en matière de sécurité pour l'intelligence artificielle que les organisations doivent intégrer dans leurs structures de gouvernance.Alors q
Recommandations de sujets spéciaux liés
commentaires (49)
Google's Kubernetes-Updates für KI sind echt spannend! 🚀 Aber mal ehrlich, wann wird das für kleinere Teams bezahlbar? Die Konkurrenz schläft ja nicht. Finde den Fokus auf 'echte Probleme' gut, aber die Komplexität bleibt eine Hürde.
Pas mal ces améliorations Kubernetes pour l'IA ! Après c'est toujours la même question : est-ce que Google va réussir à rattraper son retard face à Azure et AWS sur le cloud IA ? 🧐 L'approche 'open source' pourrait faire la différence...
Interesante ver cómo Google sigue integrando Kubernetes con IA 🚀. Pero me pregunto, ¿estas mejoras realmente simplificarán la vida de los desarrolladores o solo añadirán más complejidad? Ojalá incluyan buenos tutoriales para principiantes.
Los avances de Google en Kubernetes y GKE para IA suenan prometedores, pero ¿realmente simplificarán el trabajo de los desarrolladores o solo agregarán más capas de complejidad? 🤔 A veces siento que estas actualizaciones son más para el marketing que para solucionar problemas reales.
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀

L'incursion de Google dans l'IA n'est un secret pour personne, et pour cause. Comme l'a souligné le PDG Sundar Pichai lors d'une réunion interne avant les fêtes de l'année dernière, « En 2025, nous devons nous concentrer sans relâche sur l'exploitation des avantages de la technologie [IA] et sur la résolution des véritables problèmes des utilisateurs. » Cette vision pousse Google à améliorer considérablement ses offres, en particulier dans les services cloud et l'intégration de l'IA.
Lors de l'événement Google Cloud Next 2025 à Las Vegas, Google a dévoilé des avancées significatives dans Kubernetes et Google Kubernetes Engine (GKE). Ces mises à jour visent à permettre aux équipes de plateforme et aux développeurs d'exploiter l'IA tout en tirant parti de leur expertise existante en Kubernetes. Gabe Monroy, vice-président de Google pour les runtimes cloud, l'a résumé ainsi : « Vos compétences et investissements dans Kubernetes ne sont pas seulement pertinents ; ils sont votre superpouvoir en IA. »
Alors, quelles sont exactement ces nouvelles avancées ? Entrons dans les détails.
Gestion simplifiée des clusters IA : GKE introduit une gestion simplifiée des clusters IA grâce à des outils comme Cluster Director pour GKE, anciennement connu sous le nom de Hypercompute Cluster. Cet outil permet aux utilisateurs de déployer et de gérer de grands clusters de machines virtuelles (VM) avec des GPU Nvidia attachés, facilitant ainsi la mise à l'échelle efficace des charges de travail IA.
Un service à venir connexe est Cluster Director pour Slurm. Slurm, un ordonnanceur de tâches open-source et gestionnaire de charge de travail pour Linux, sera plus facile à provisionner et à exploiter grâce à l'interface utilisateur simplifiée et aux API de Google. Celles-ci incluront des modèles pour les charges de travail typiques avec des logiciels préconfigurés, garantissant des déploiements fiables et reproductibles.
Déploiement optimisé des modèles IA : Les nouvelles fonctionnalités de GKE se concentrent également sur l'optimisation du déploiement des modèles IA. Le GKE Inference Quickstart et le GKE Inference Gateway simplifient la sélection et le déploiement des modèles IA, garantissant qu'ils fonctionnent bien avec un équilibrage de charge intelligent.
Gabe Monroy a souligné la tendance de l'innovation en IA à intersecter avec l'informatique traditionnelle, en particulier dans le domaine de l'inférence. Il a noté : « Nous constatons une tendance claire à l'ère de l'IA : une innovation remarquable se produit là où l'informatique traditionnelle interagit avec les réseaux neuronaux – autrement dit, l'« inférence ». Des entreprises à la pointe de Kubernetes et de l'IA, comme LiveX et Moloco, exécutent l'inférence IA sur GKE. »
Inférence économique : GKE progresse dans l'inférence économique avec l'Inference Gateway. Monroy affirme que cette approche peut réduire les coûts de service jusqu'à 30 %, diminuer la latence jusqu'à 60 % et augmenter le débit de 40 % par rapport à d'autres offres Kubernetes gérées et open-source. Bien que ces chiffres soient prometteurs, il faudra les voir en action pour confirmer leur impact.
L'équilibrage de charge conscient des modèles est un élément clé de cette stratégie. Étant donné les longueurs de réponse variables des modèles IA, les méthodes traditionnelles d'équilibrage de charge comme le round-robin peuvent être inefficaces. Cependant, l'Inference Gateway offre une passerelle consciente des modèles optimisée pour l'IA, avec un routage avancé vers différentes versions de modèles.
Amélioration de l'efficacité des ressources : GKE se concentre également sur l'amélioration de l'efficacité des ressources. Le GKE Autopilot offre désormais un ordonnancement plus rapide des pods, des temps de réaction plus courts pour la mise à l'échelle et une meilleure adaptation de la capacité. Cela signifie que les utilisateurs peuvent gérer plus de trafic avec les mêmes ressources ou maintenir le trafic existant avec moins de ressources. Google affirme qu'avec l'Autopilot amélioré, la capacité des clusters sera toujours correctement dimensionnée.
Actuellement, Autopilot inclut un outil de configuration de cluster selon les meilleures pratiques et une plateforme de calcul optimisée pour les conteneurs qui ajuste automatiquement la capacité en fonction des charges de travail. Cependant, il ne redimensionne pas les clusters existants sans une configuration spécifique. À partir du troisième trimestre, la plateforme de calcul optimisée pour les conteneurs d'Autopilot sera également disponible pour les clusters GKE standards sans nécessiter de configuration spécifique, ce qui pourrait changer la donne.
Assistance cloud Gemini activée par l'IA : Le débogage et le diagnostic des problèmes d'application peuvent ralentir considérablement l'innovation. Pour y remédier, Google a introduit Gemini Cloud Assist, offrant une assistance alimentée par l'IA tout au long du cycle de vie de l'application. L'aperçu privé de Gemini Cloud Assist Investigations aide les utilisateurs à comprendre rapidement les causes profondes et à résoudre les problèmes.
Le meilleur ? Assist Investigations sera accessible directement depuis la console GKE, réduisant le temps de dépannage et libérant plus de temps pour l'innovation. Il permettra de diagnostiquer les problèmes de pods et de clusters depuis la console GKE à travers divers services Google Cloud, y compris les nœuds, IAM et les équilibreurs de charge. Vous pourrez consulter les journaux et les erreurs à travers plusieurs services GKE, contrôleurs, pods et nœuds sous-jacents. Inscrivez-vous pour l'aperçu privé afin de découvrir cette fonctionnalité de première main.
Dans le cadre de sa stratégie plus large en matière de technologies émergentes, Google se positionne comme un leader dans les plateformes optimisées pour l'IA. Ces développements permettent aux entreprises de divers secteurs d'utiliser l'IA plus efficacement, stimulant l'innovation et l'efficacité dans les opérations et les expériences client.
Par exemple, Intuit exploite Document AI et Gemini de Google Cloud pour simplifier la préparation des impôts pour des millions d'utilisateurs de TurboTax. Reddit utilise Gemini via Vertex AI, le constructeur d'agents IA de Google, pour améliorer Reddit Answers, une nouvelle plateforme de conversation alimentée par l'IA conçue pour améliorer l'expérience de la page d'accueil.
Google peut-il réussir ces transformations activées par l'IA ? Seul le temps le dira. Comme l'a déclaré Pichai en décembre, « Dans l'histoire, il n'est pas toujours nécessaire d'être le premier, mais il faut bien exécuter et vraiment être le meilleur dans sa catégorie en tant que produit. Je pense que c'est ce que 2025 représente. »
Google Photos redonne vie à la garde-robe emblématique de « Clueless » grâce à l'IA
Google Photos a annoncé mercredi une nouvelle fonctionnalité basée sur l'IA qui permettra bientôt de transformer les photos de vos vêtements en une garde-robe numérique, vous permettant ainsi de créer
La série « Red Fruit » accusée d'utiliser l'IA pour voler les visages de personnes lambda ; aucune réaction officielle
Le secteur des courtes vidéos fait actuellement l'objet d'une polémique liée à des violations impliquant l'IA. La production de Red Fruit Short Drama intitulée « The Peach Hairpin » a été accusée d’ut
Comprendre la nouvelle norme ETSI en matière de sécurité de l'IA
La norme ETSI EN 304 223 définit les exigences fondamentales en matière de sécurité pour l'intelligence artificielle que les organisations doivent intégrer dans leurs structures de gouvernance.Alors q
Google's Kubernetes-Updates für KI sind echt spannend! 🚀 Aber mal ehrlich, wann wird das für kleinere Teams bezahlbar? Die Konkurrenz schläft ja nicht. Finde den Fokus auf 'echte Probleme' gut, aber die Komplexität bleibt eine Hürde.
Pas mal ces améliorations Kubernetes pour l'IA ! Après c'est toujours la même question : est-ce que Google va réussir à rattraper son retard face à Azure et AWS sur le cloud IA ? 🧐 L'approche 'open source' pourrait faire la différence...
Interesante ver cómo Google sigue integrando Kubernetes con IA 🚀. Pero me pregunto, ¿estas mejoras realmente simplificarán la vida de los desarrolladores o solo añadirán más complejidad? Ojalá incluyan buenos tutoriales para principiantes.
Los avances de Google en Kubernetes y GKE para IA suenan prometedores, pero ¿realmente simplificarán el trabajo de los desarrolladores o solo agregarán más capas de complejidad? 🤔 A veces siento que estas actualizaciones son más para el marketing que para solucionar problemas reales.
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀











