opción
Hogar
Noticias
Google revela nuevas mejoras de Kubernetes y GKE para la innovación de IA

Google revela nuevas mejoras de Kubernetes y GKE para la innovación de IA

11 de abril de 2025
115

Google revela nuevas mejoras de Kubernetes y GKE para la innovación de IA

El impulso de Google hacia la IA no es un secreto, y con buena razón. Como enfatizó el CEO Sundar Pichai en una reunión interna antes de las vacaciones del año pasado, "En 2025, debemos estar enfocados incansablemente en desbloquear los beneficios de la tecnología [IA] y resolver problemas reales de los usuarios." Esta visión está impulsando a Google a mejorar significativamente sus ofertas, especialmente en servicios en la nube e integración de IA.

En el evento Google Cloud Next 2025 en Las Vegas, Google presentó avances sustanciales en Kubernetes y Google Kubernetes Engine (GKE). Estas actualizaciones buscan empoderar a los equipos de plataforma y desarrolladores para aprovechar la IA mientras utilizan su experiencia existente en Kubernetes. Gabe Monroy, VP de Cloud Runtimes de Google, lo expresó de manera concisa: "Tus habilidades e inversiones en Kubernetes no solo son relevantes; son tu superpoder de IA."

Entonces, ¿cuáles son exactamente estos nuevos avances? Vamos a profundizar en los detalles.

Gestión simplificada de clústeres de IA: GKE está introduciendo una gestión simplificada de clústeres de IA a través de herramientas como Cluster Director para GKE, anteriormente conocido como Hypercompute Cluster. Esta herramienta permite a los usuarios implementar y gestionar grandes clústeres de máquinas virtuales (VMs) con GPUs Nvidia conectados, facilitando la escalabilidad eficiente de cargas de trabajo de IA.

Un servicio próximo relacionado es Cluster Director para Slurm. Slurm, un programador de trabajos de código abierto y gestor de cargas de trabajo para Linux, será más fácil de aprovisionar y operar gracias a la interfaz de usuario simplificada y las APIs de Google. Estas incluirán planos para cargas de trabajo típicas con software preconfigurado, asegurando implementaciones confiables y repetibles.

Despliegue optimizado de modelos de IA: Las nuevas funciones de GKE también se centran en optimizar el despliegue de modelos de IA. El GKE Inference Quickstart y el GKE Inference Gateway simplifican la selección y el despliegue de modelos de IA, asegurando que funcionen bien con un balanceo de carga inteligente.

Gabe Monroy destacó la tendencia de la innovación en IA que se cruza con la informática tradicional, particularmente en el ámbito de la inferencia. Señaló, "Estamos viendo una clara tendencia en la era de la IA: la innovación asombrosa está ocurriendo donde la informática tradicional interactúa con redes neuronales, también conocida como 'inferencia.' Empresas que operan en la vanguardia de Kubernetes e IA, como LiveX y Moloco, ejecutan inferencias de IA en GKE."

Inferencia rentable: GKE está avanzando en la inferencia rentable con el Inference Gateway. Monroy afirma que este enfoque puede reducir los costos de servicio hasta en un 30%, disminuir la latencia hasta en un 60% y aumentar el rendimiento en un 40% en comparación con otras ofertas gestionadas y de código abierto de Kubernetes. Aunque estas son cifras prometedoras, necesitaremos verlas en acción para confirmar su impacto.

El balanceo de carga consciente del modelo es un componente clave de esta estrategia. Dadas las longitudes de respuesta variables en los modelos de IA, los métodos tradicionales de balanceo de carga como round-robin pueden ser ineficientes. Sin embargo, el Inference Gateway ofrece una puerta de enlace consciente del modelo optimizada para IA, con enrutamiento avanzado a diferentes versiones del modelo.

Mejora en la eficiencia de recursos: GKE también se está enfocando en mejorar la eficiencia de recursos. El GKE Autopilot ahora ofrece una programación de pods más rápida, tiempos de reacción de escalado más rápidos y un mejor dimensionamiento de capacidad. Esto significa que los usuarios pueden manejar más tráfico con los mismos recursos o mantener el tráfico existente con menos recursos. Google afirma que con el Autopilot mejorado, la capacidad del clúster siempre estará correctamente dimensionada.

Actualmente, Autopilot incluye una herramienta de configuración de clúster de mejores prácticas y una plataforma de cómputo optimizada para contenedores que ajusta automáticamente la capacidad para coincidir con las cargas de trabajo. Sin embargo, no dimensiona correctamente los clústeres existentes sin una configuración específica. A partir del tercer trimestre, la plataforma de cómputo optimizada para contenedores de Autopilot también estará disponible para clústeres GKE estándar sin necesidad de una configuración específica, lo que podría cambiar las reglas del juego.

Asistencia en la nube con IA habilitada por Gemini: Depurar y diagnosticar problemas de aplicaciones puede ralentizar significativamente la innovación. Para abordar esto, Google presentó Gemini Cloud Assist, que ofrece asistencia impulsada por IA a lo largo del ciclo de vida de la aplicación. La vista previa privada de Gemini Cloud Assist Investigations ayuda a los usuarios a comprender rápidamente las causas raíz y resolver problemas.

¿Lo mejor? Assist Investigations será accesible directamente desde la consola de GKE, reduciendo el tiempo de resolución de problemas y liberando más tiempo para la innovación. Permitirá diagnosticar problemas de pods y clústeres desde la consola de GKE en varios servicios de Google Cloud, incluidos nodos, IAM y balanceadores de carga. Podrás ver registros y errores en múltiples servicios, controladores, pods y nodos subyacentes de GKE. Regístrate para la vista previa privada para experimentar esta función de primera mano.

Como parte de su estrategia más amplia de tecnologías emergentes, Google se está posicionando como líder en plataformas optimizadas para IA. Estos desarrollos permiten a las empresas de diversas industrias usar la IA de manera más efectiva, impulsando la innovación y la eficiencia en las operaciones y las experiencias de los clientes.

Por ejemplo, Intuit aprovecha Document AI y Gemini de Google Cloud para simplificar la preparación de impuestos para millones de usuarios de TurboTax. Reddit utiliza Gemini a través de Vertex AI, el constructor de agentes de IA de Google, para mejorar Reddit Answers, una nueva plataforma de conversación impulsada por IA diseñada para mejorar la experiencia de la página de inicio.

¿Podrá Google ejecutar con éxito estas transformaciones habilitadas por IA? Solo el tiempo lo dirá. Como dijo Pichai en diciembre, "En la historia, no siempre necesitas ser el primero, pero tienes que ejecutar bien y ser realmente el mejor en su clase como producto. Creo que de eso se trata 2025."

Artículo relacionado
Creación de Música con IA: Crea Canciones y Videos sin Esfuerzo Creación de Música con IA: Crea Canciones y Videos sin Esfuerzo La creación de música puede ser compleja, requiriendo tiempo, recursos y experiencia. La inteligencia artificial ha transformado este proceso, haciéndolo simple y accesible. Esta guía destaca cómo la
Creación de Libros para Colorear Impulsados por IA: Una Guía Completa Creación de Libros para Colorear Impulsados por IA: Una Guía Completa Diseñar libros para colorear es una actividad gratificante que combina la expresión artística con experiencias relajantes para los usuarios. Sin embargo, el proceso puede ser intensivo en trabajo. Afo
Qodo se asocia con Google Cloud para ofrecer herramientas gratuitas de revisión de código de IA para desarrolladores Qodo se asocia con Google Cloud para ofrecer herramientas gratuitas de revisión de código de IA para desarrolladores Qodo, una startup de codificación de IA con sede en Israel enfocada en la calidad del código, ha iniciado una asociación con Google Cloud para mejorar la integridad del software generado por IA.A medi
comentario (45)
0/200
JasonHarris
JasonHarris 22 de abril de 2025 11:46:09 GMT+02:00

Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀

RaymondRodriguez
RaymondRodriguez 22 de abril de 2025 06:59:07 GMT+02:00

Las actualizaciones de Google para Kubernetes y GKE enfocadas en IA son bastante geniales. Realmente están subiendo el nivel en la innovación de IA. Es genial verlos enfocados en resolver problemas reales de los usuarios. ¡No puedo esperar a ver qué vendrá después! 🚀

HarryLewis
HarryLewis 21 de abril de 2025 04:25:32 GMT+02:00

구글의 쿠버네티스와 GKE의 AI 관련 업데이트 정말 멋지네요! AI 혁신에 정말 열심히 하고 있는 것 같아요. 사용자의 문제를 해결하는 데 집중하는 것도 훌륭해요. 다음에 어떤 것이 나올지 기대돼요! 🚀

StevenNelson
StevenNelson 20 de abril de 2025 09:39:43 GMT+02:00

GoogleのKubernetesとGKEの強化はAIイノベーションにはすごいけど、ちょっと難しすぎるかな。😅 ユーザーの問題を解決しようとする努力は評価するけど、もっとユーザーフレンドリーな説明が欲しいな。でも、AIとテクノロジーに興味があるなら、チェックする価値はあるよ!👀

RaymondWalker
RaymondWalker 19 de abril de 2025 02:59:15 GMT+02:00

¡Las nuevas mejoras de Google en Kubernetes y GKE son bastante buenas para la innovación en IA! Está claro que están empujando fuerte para resolver problemas reales de los usuarios. Solo desearía que la documentación fuera un poco más clara, es un poco complicado navegar por ella. 😓 Aún así, es un paso en la dirección correcta!

EmmaJohnson
EmmaJohnson 18 de abril de 2025 20:52:50 GMT+02:00

Googleの新しいKubernetesとGKEの強化は、AIイノベーションにとって素晴らしいですね!ユーザーの実際の問題を解決するために本気で取り組んでいることがわかります。ただ、ドキュメントがもう少し分かりやすければ良かったのに、少し見つけにくいです。😓それでも、前進の一歩ですね!

Volver arriba
OR