option
Maison
Nouvelles
Google révèle de nouvelles améliorations de Kubernetes et GKE pour l'innovation de l'IA

Google révèle de nouvelles améliorations de Kubernetes et GKE pour l'innovation de l'IA

11 avril 2025
115

Google révèle de nouvelles améliorations de Kubernetes et GKE pour l'innovation de l'IA

L'incursion de Google dans l'IA n'est un secret pour personne, et pour cause. Comme l'a souligné le PDG Sundar Pichai lors d'une réunion interne avant les fêtes de l'année dernière, « En 2025, nous devons nous concentrer sans relâche sur l'exploitation des avantages de la technologie [IA] et sur la résolution des véritables problèmes des utilisateurs. » Cette vision pousse Google à améliorer considérablement ses offres, en particulier dans les services cloud et l'intégration de l'IA.

Lors de l'événement Google Cloud Next 2025 à Las Vegas, Google a dévoilé des avancées significatives dans Kubernetes et Google Kubernetes Engine (GKE). Ces mises à jour visent à permettre aux équipes de plateforme et aux développeurs d'exploiter l'IA tout en tirant parti de leur expertise existante en Kubernetes. Gabe Monroy, vice-président de Google pour les runtimes cloud, l'a résumé ainsi : « Vos compétences et investissements dans Kubernetes ne sont pas seulement pertinents ; ils sont votre superpouvoir en IA. »

Alors, quelles sont exactement ces nouvelles avancées ? Entrons dans les détails.

Gestion simplifiée des clusters IA : GKE introduit une gestion simplifiée des clusters IA grâce à des outils comme Cluster Director pour GKE, anciennement connu sous le nom de Hypercompute Cluster. Cet outil permet aux utilisateurs de déployer et de gérer de grands clusters de machines virtuelles (VM) avec des GPU Nvidia attachés, facilitant ainsi la mise à l'échelle efficace des charges de travail IA.

Un service à venir connexe est Cluster Director pour Slurm. Slurm, un ordonnanceur de tâches open-source et gestionnaire de charge de travail pour Linux, sera plus facile à provisionner et à exploiter grâce à l'interface utilisateur simplifiée et aux API de Google. Celles-ci incluront des modèles pour les charges de travail typiques avec des logiciels préconfigurés, garantissant des déploiements fiables et reproductibles.

Déploiement optimisé des modèles IA : Les nouvelles fonctionnalités de GKE se concentrent également sur l'optimisation du déploiement des modèles IA. Le GKE Inference Quickstart et le GKE Inference Gateway simplifient la sélection et le déploiement des modèles IA, garantissant qu'ils fonctionnent bien avec un équilibrage de charge intelligent.

Gabe Monroy a souligné la tendance de l'innovation en IA à intersecter avec l'informatique traditionnelle, en particulier dans le domaine de l'inférence. Il a noté : « Nous constatons une tendance claire à l'ère de l'IA : une innovation remarquable se produit là où l'informatique traditionnelle interagit avec les réseaux neuronaux – autrement dit, l'« inférence ». Des entreprises à la pointe de Kubernetes et de l'IA, comme LiveX et Moloco, exécutent l'inférence IA sur GKE. »

Inférence économique : GKE progresse dans l'inférence économique avec l'Inference Gateway. Monroy affirme que cette approche peut réduire les coûts de service jusqu'à 30 %, diminuer la latence jusqu'à 60 % et augmenter le débit de 40 % par rapport à d'autres offres Kubernetes gérées et open-source. Bien que ces chiffres soient prometteurs, il faudra les voir en action pour confirmer leur impact.

L'équilibrage de charge conscient des modèles est un élément clé de cette stratégie. Étant donné les longueurs de réponse variables des modèles IA, les méthodes traditionnelles d'équilibrage de charge comme le round-robin peuvent être inefficaces. Cependant, l'Inference Gateway offre une passerelle consciente des modèles optimisée pour l'IA, avec un routage avancé vers différentes versions de modèles.

Amélioration de l'efficacité des ressources : GKE se concentre également sur l'amélioration de l'efficacité des ressources. Le GKE Autopilot offre désormais un ordonnancement plus rapide des pods, des temps de réaction plus courts pour la mise à l'échelle et une meilleure adaptation de la capacité. Cela signifie que les utilisateurs peuvent gérer plus de trafic avec les mêmes ressources ou maintenir le trafic existant avec moins de ressources. Google affirme qu'avec l'Autopilot amélioré, la capacité des clusters sera toujours correctement dimensionnée.

Actuellement, Autopilot inclut un outil de configuration de cluster selon les meilleures pratiques et une plateforme de calcul optimisée pour les conteneurs qui ajuste automatiquement la capacité en fonction des charges de travail. Cependant, il ne redimensionne pas les clusters existants sans une configuration spécifique. À partir du troisième trimestre, la plateforme de calcul optimisée pour les conteneurs d'Autopilot sera également disponible pour les clusters GKE standards sans nécessiter de configuration spécifique, ce qui pourrait changer la donne.

Assistance cloud Gemini activée par l'IA : Le débogage et le diagnostic des problèmes d'application peuvent ralentir considérablement l'innovation. Pour y remédier, Google a introduit Gemini Cloud Assist, offrant une assistance alimentée par l'IA tout au long du cycle de vie de l'application. L'aperçu privé de Gemini Cloud Assist Investigations aide les utilisateurs à comprendre rapidement les causes profondes et à résoudre les problèmes.

Le meilleur ? Assist Investigations sera accessible directement depuis la console GKE, réduisant le temps de dépannage et libérant plus de temps pour l'innovation. Il permettra de diagnostiquer les problèmes de pods et de clusters depuis la console GKE à travers divers services Google Cloud, y compris les nœuds, IAM et les équilibreurs de charge. Vous pourrez consulter les journaux et les erreurs à travers plusieurs services GKE, contrôleurs, pods et nœuds sous-jacents. Inscrivez-vous pour l'aperçu privé afin de découvrir cette fonctionnalité de première main.

Dans le cadre de sa stratégie plus large en matière de technologies émergentes, Google se positionne comme un leader dans les plateformes optimisées pour l'IA. Ces développements permettent aux entreprises de divers secteurs d'utiliser l'IA plus efficacement, stimulant l'innovation et l'efficacité dans les opérations et les expériences client.

Par exemple, Intuit exploite Document AI et Gemini de Google Cloud pour simplifier la préparation des impôts pour des millions d'utilisateurs de TurboTax. Reddit utilise Gemini via Vertex AI, le constructeur d'agents IA de Google, pour améliorer Reddit Answers, une nouvelle plateforme de conversation alimentée par l'IA conçue pour améliorer l'expérience de la page d'accueil.

Google peut-il réussir ces transformations activées par l'IA ? Seul le temps le dira. Comme l'a déclaré Pichai en décembre, « Dans l'histoire, il n'est pas toujours nécessaire d'être le premier, mais il faut bien exécuter et vraiment être le meilleur dans sa catégorie en tant que produit. Je pense que c'est ce que 2025 représente. »

Article connexe
Création de livres de coloriage alimentés par l'IA : Un guide complet Création de livres de coloriage alimentés par l'IA : Un guide complet Concevoir des livres de coloriage est une entreprise gratifiante, combinant expression artistique et expériences apaisantes pour les utilisateurs. Cependant, le processus peut être laborieux. Heureuse
Qodo s'associe à Google Cloud pour offrir des outils gratuits d'examen de code par IA aux développeurs Qodo s'associe à Google Cloud pour offrir des outils gratuits d'examen de code par IA aux développeurs Qodo, une startup israélienne spécialisée dans le codage par IA et axée sur la qualité du code, a lancé un partenariat avec Google Cloud pour améliorer l'intégrité des logiciels générés par IA.À mesur
L'IA de DeepMind remporte l'or à l'Olympiade de Mathématiques 2025 L'IA de DeepMind remporte l'or à l'Olympiade de Mathématiques 2025 L'IA de DeepMind a réalisé un bond spectaculaire en raisonnement mathématique, décrochant une médaille d'or à l'Olympiade Internationale de Mathématiques (IMO) 2025, un an après l'argent en 2024. Cett
commentaires (45)
0/200
JasonHarris
JasonHarris 22 avril 2025 11:46:09 UTC+02:00

Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀

RaymondRodriguez
RaymondRodriguez 22 avril 2025 06:59:07 UTC+02:00

Las actualizaciones de Google para Kubernetes y GKE enfocadas en IA son bastante geniales. Realmente están subiendo el nivel en la innovación de IA. Es genial verlos enfocados en resolver problemas reales de los usuarios. ¡No puedo esperar a ver qué vendrá después! 🚀

HarryLewis
HarryLewis 21 avril 2025 04:25:32 UTC+02:00

구글의 쿠버네티스와 GKE의 AI 관련 업데이트 정말 멋지네요! AI 혁신에 정말 열심히 하고 있는 것 같아요. 사용자의 문제를 해결하는 데 집중하는 것도 훌륭해요. 다음에 어떤 것이 나올지 기대돼요! 🚀

StevenNelson
StevenNelson 20 avril 2025 09:39:43 UTC+02:00

GoogleのKubernetesとGKEの強化はAIイノベーションにはすごいけど、ちょっと難しすぎるかな。😅 ユーザーの問題を解決しようとする努力は評価するけど、もっとユーザーフレンドリーな説明が欲しいな。でも、AIとテクノロジーに興味があるなら、チェックする価値はあるよ!👀

RaymondWalker
RaymondWalker 19 avril 2025 02:59:15 UTC+02:00

¡Las nuevas mejoras de Google en Kubernetes y GKE son bastante buenas para la innovación en IA! Está claro que están empujando fuerte para resolver problemas reales de los usuarios. Solo desearía que la documentación fuera un poco más clara, es un poco complicado navegar por ella. 😓 Aún así, es un paso en la dirección correcta!

EmmaJohnson
EmmaJohnson 18 avril 2025 20:52:50 UTC+02:00

Googleの新しいKubernetesとGKEの強化は、AIイノベーションにとって素晴らしいですね!ユーザーの実際の問題を解決するために本気で取り組んでいることがわかります。ただ、ドキュメントがもう少し分かりやすければ良かったのに、少し見つけにくいです。😓それでも、前進の一歩ですね!

Retour en haut
OR