Google revela nuevas mejoras de Kubernetes y GKE para la innovación de IA

El impulso de Google hacia la IA no es un secreto, y con buena razón. Como enfatizó el CEO Sundar Pichai en una reunión interna antes de las vacaciones del año pasado, "En 2025, debemos estar enfocados incansablemente en desbloquear los beneficios de la tecnología [IA] y resolver problemas reales de los usuarios." Esta visión está impulsando a Google a mejorar significativamente sus ofertas, especialmente en servicios en la nube e integración de IA.
En el evento Google Cloud Next 2025 en Las Vegas, Google presentó avances sustanciales en Kubernetes y Google Kubernetes Engine (GKE). Estas actualizaciones buscan empoderar a los equipos de plataforma y desarrolladores para aprovechar la IA mientras utilizan su experiencia existente en Kubernetes. Gabe Monroy, VP de Cloud Runtimes de Google, lo expresó de manera concisa: "Tus habilidades e inversiones en Kubernetes no solo son relevantes; son tu superpoder de IA."
Entonces, ¿cuáles son exactamente estos nuevos avances? Vamos a profundizar en los detalles.
Gestión simplificada de clústeres de IA: GKE está introduciendo una gestión simplificada de clústeres de IA a través de herramientas como Cluster Director para GKE, anteriormente conocido como Hypercompute Cluster. Esta herramienta permite a los usuarios implementar y gestionar grandes clústeres de máquinas virtuales (VMs) con GPUs Nvidia conectados, facilitando la escalabilidad eficiente de cargas de trabajo de IA.
Un servicio próximo relacionado es Cluster Director para Slurm. Slurm, un programador de trabajos de código abierto y gestor de cargas de trabajo para Linux, será más fácil de aprovisionar y operar gracias a la interfaz de usuario simplificada y las APIs de Google. Estas incluirán planos para cargas de trabajo típicas con software preconfigurado, asegurando implementaciones confiables y repetibles.
Despliegue optimizado de modelos de IA: Las nuevas funciones de GKE también se centran en optimizar el despliegue de modelos de IA. El GKE Inference Quickstart y el GKE Inference Gateway simplifican la selección y el despliegue de modelos de IA, asegurando que funcionen bien con un balanceo de carga inteligente.
Gabe Monroy destacó la tendencia de la innovación en IA que se cruza con la informática tradicional, particularmente en el ámbito de la inferencia. Señaló, "Estamos viendo una clara tendencia en la era de la IA: la innovación asombrosa está ocurriendo donde la informática tradicional interactúa con redes neuronales, también conocida como 'inferencia.' Empresas que operan en la vanguardia de Kubernetes e IA, como LiveX y Moloco, ejecutan inferencias de IA en GKE."
Inferencia rentable: GKE está avanzando en la inferencia rentable con el Inference Gateway. Monroy afirma que este enfoque puede reducir los costos de servicio hasta en un 30%, disminuir la latencia hasta en un 60% y aumentar el rendimiento en un 40% en comparación con otras ofertas gestionadas y de código abierto de Kubernetes. Aunque estas son cifras prometedoras, necesitaremos verlas en acción para confirmar su impacto.
El balanceo de carga consciente del modelo es un componente clave de esta estrategia. Dadas las longitudes de respuesta variables en los modelos de IA, los métodos tradicionales de balanceo de carga como round-robin pueden ser ineficientes. Sin embargo, el Inference Gateway ofrece una puerta de enlace consciente del modelo optimizada para IA, con enrutamiento avanzado a diferentes versiones del modelo.
Mejora en la eficiencia de recursos: GKE también se está enfocando en mejorar la eficiencia de recursos. El GKE Autopilot ahora ofrece una programación de pods más rápida, tiempos de reacción de escalado más rápidos y un mejor dimensionamiento de capacidad. Esto significa que los usuarios pueden manejar más tráfico con los mismos recursos o mantener el tráfico existente con menos recursos. Google afirma que con el Autopilot mejorado, la capacidad del clúster siempre estará correctamente dimensionada.
Actualmente, Autopilot incluye una herramienta de configuración de clúster de mejores prácticas y una plataforma de cómputo optimizada para contenedores que ajusta automáticamente la capacidad para coincidir con las cargas de trabajo. Sin embargo, no dimensiona correctamente los clústeres existentes sin una configuración específica. A partir del tercer trimestre, la plataforma de cómputo optimizada para contenedores de Autopilot también estará disponible para clústeres GKE estándar sin necesidad de una configuración específica, lo que podría cambiar las reglas del juego.
Asistencia en la nube con IA habilitada por Gemini: Depurar y diagnosticar problemas de aplicaciones puede ralentizar significativamente la innovación. Para abordar esto, Google presentó Gemini Cloud Assist, que ofrece asistencia impulsada por IA a lo largo del ciclo de vida de la aplicación. La vista previa privada de Gemini Cloud Assist Investigations ayuda a los usuarios a comprender rápidamente las causas raíz y resolver problemas.
¿Lo mejor? Assist Investigations será accesible directamente desde la consola de GKE, reduciendo el tiempo de resolución de problemas y liberando más tiempo para la innovación. Permitirá diagnosticar problemas de pods y clústeres desde la consola de GKE en varios servicios de Google Cloud, incluidos nodos, IAM y balanceadores de carga. Podrás ver registros y errores en múltiples servicios, controladores, pods y nodos subyacentes de GKE. Regístrate para la vista previa privada para experimentar esta función de primera mano.
Como parte de su estrategia más amplia de tecnologías emergentes, Google se está posicionando como líder en plataformas optimizadas para IA. Estos desarrollos permiten a las empresas de diversas industrias usar la IA de manera más efectiva, impulsando la innovación y la eficiencia en las operaciones y las experiencias de los clientes.
Por ejemplo, Intuit aprovecha Document AI y Gemini de Google Cloud para simplificar la preparación de impuestos para millones de usuarios de TurboTax. Reddit utiliza Gemini a través de Vertex AI, el constructor de agentes de IA de Google, para mejorar Reddit Answers, una nueva plataforma de conversación impulsada por IA diseñada para mejorar la experiencia de la página de inicio.
¿Podrá Google ejecutar con éxito estas transformaciones habilitadas por IA? Solo el tiempo lo dirá. Como dijo Pichai en diciembre, "En la historia, no siempre necesitas ser el primero, pero tienes que ejecutar bien y ser realmente el mejor en su clase como producto. Creo que de eso se trata 2025."
Artículo relacionado
Google Fotos da vida al emblemático armario de «Clueless» gracias a la inteligencia artificial
Google Fotos anunció el miércoles una nueva función basada en la inteligencia artificial que pronto convertirá las fotos de tu ropa en un armario digital, lo que te permitirá crear nuevas combinacione
El cortometraje «Red Fruit» es acusado de utilizar IA para robar los rostros de personas corrientes; no hay respuesta oficial
El sector de los vídeos cortos se enfrenta actualmente a una polémica relacionada con la infracción de derechos de autor mediante el uso de la inteligencia artificial. La producción de Red Fruit Short
Una guía por la nueva norma de seguridad de la IA del ETSI
La norma ETSI EN 304 223 establece los requisitos de seguridad fundamentales para la inteligencia artificial que las organizaciones deben integrar en sus estructuras de gobernanza.A medida que las emp
Recomendaciones de temas especiales relacionados
comentario (49)
0/500
Google's Kubernetes-Updates für KI sind echt spannend! 🚀 Aber mal ehrlich, wann wird das für kleinere Teams bezahlbar? Die Konkurrenz schläft ja nicht. Finde den Fokus auf 'echte Probleme' gut, aber die Komplexität bleibt eine Hürde.
Pas mal ces améliorations Kubernetes pour l'IA ! Après c'est toujours la même question : est-ce que Google va réussir à rattraper son retard face à Azure et AWS sur le cloud IA ? 🧐 L'approche 'open source' pourrait faire la différence...
Interesante ver cómo Google sigue integrando Kubernetes con IA 🚀. Pero me pregunto, ¿estas mejoras realmente simplificarán la vida de los desarrolladores o solo añadirán más complejidad? Ojalá incluyan buenos tutoriales para principiantes.
Los avances de Google en Kubernetes y GKE para IA suenan prometedores, pero ¿realmente simplificarán el trabajo de los desarrolladores o solo agregarán más capas de complejidad? 🤔 A veces siento que estas actualizaciones son más para el marketing que para solucionar problemas reales.
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀

El impulso de Google hacia la IA no es un secreto, y con buena razón. Como enfatizó el CEO Sundar Pichai en una reunión interna antes de las vacaciones del año pasado, "En 2025, debemos estar enfocados incansablemente en desbloquear los beneficios de la tecnología [IA] y resolver problemas reales de los usuarios." Esta visión está impulsando a Google a mejorar significativamente sus ofertas, especialmente en servicios en la nube e integración de IA.
En el evento Google Cloud Next 2025 en Las Vegas, Google presentó avances sustanciales en Kubernetes y Google Kubernetes Engine (GKE). Estas actualizaciones buscan empoderar a los equipos de plataforma y desarrolladores para aprovechar la IA mientras utilizan su experiencia existente en Kubernetes. Gabe Monroy, VP de Cloud Runtimes de Google, lo expresó de manera concisa: "Tus habilidades e inversiones en Kubernetes no solo son relevantes; son tu superpoder de IA."
Entonces, ¿cuáles son exactamente estos nuevos avances? Vamos a profundizar en los detalles.
Gestión simplificada de clústeres de IA: GKE está introduciendo una gestión simplificada de clústeres de IA a través de herramientas como Cluster Director para GKE, anteriormente conocido como Hypercompute Cluster. Esta herramienta permite a los usuarios implementar y gestionar grandes clústeres de máquinas virtuales (VMs) con GPUs Nvidia conectados, facilitando la escalabilidad eficiente de cargas de trabajo de IA.
Un servicio próximo relacionado es Cluster Director para Slurm. Slurm, un programador de trabajos de código abierto y gestor de cargas de trabajo para Linux, será más fácil de aprovisionar y operar gracias a la interfaz de usuario simplificada y las APIs de Google. Estas incluirán planos para cargas de trabajo típicas con software preconfigurado, asegurando implementaciones confiables y repetibles.
Despliegue optimizado de modelos de IA: Las nuevas funciones de GKE también se centran en optimizar el despliegue de modelos de IA. El GKE Inference Quickstart y el GKE Inference Gateway simplifican la selección y el despliegue de modelos de IA, asegurando que funcionen bien con un balanceo de carga inteligente.
Gabe Monroy destacó la tendencia de la innovación en IA que se cruza con la informática tradicional, particularmente en el ámbito de la inferencia. Señaló, "Estamos viendo una clara tendencia en la era de la IA: la innovación asombrosa está ocurriendo donde la informática tradicional interactúa con redes neuronales, también conocida como 'inferencia.' Empresas que operan en la vanguardia de Kubernetes e IA, como LiveX y Moloco, ejecutan inferencias de IA en GKE."
Inferencia rentable: GKE está avanzando en la inferencia rentable con el Inference Gateway. Monroy afirma que este enfoque puede reducir los costos de servicio hasta en un 30%, disminuir la latencia hasta en un 60% y aumentar el rendimiento en un 40% en comparación con otras ofertas gestionadas y de código abierto de Kubernetes. Aunque estas son cifras prometedoras, necesitaremos verlas en acción para confirmar su impacto.
El balanceo de carga consciente del modelo es un componente clave de esta estrategia. Dadas las longitudes de respuesta variables en los modelos de IA, los métodos tradicionales de balanceo de carga como round-robin pueden ser ineficientes. Sin embargo, el Inference Gateway ofrece una puerta de enlace consciente del modelo optimizada para IA, con enrutamiento avanzado a diferentes versiones del modelo.
Mejora en la eficiencia de recursos: GKE también se está enfocando en mejorar la eficiencia de recursos. El GKE Autopilot ahora ofrece una programación de pods más rápida, tiempos de reacción de escalado más rápidos y un mejor dimensionamiento de capacidad. Esto significa que los usuarios pueden manejar más tráfico con los mismos recursos o mantener el tráfico existente con menos recursos. Google afirma que con el Autopilot mejorado, la capacidad del clúster siempre estará correctamente dimensionada.
Actualmente, Autopilot incluye una herramienta de configuración de clúster de mejores prácticas y una plataforma de cómputo optimizada para contenedores que ajusta automáticamente la capacidad para coincidir con las cargas de trabajo. Sin embargo, no dimensiona correctamente los clústeres existentes sin una configuración específica. A partir del tercer trimestre, la plataforma de cómputo optimizada para contenedores de Autopilot también estará disponible para clústeres GKE estándar sin necesidad de una configuración específica, lo que podría cambiar las reglas del juego.
Asistencia en la nube con IA habilitada por Gemini: Depurar y diagnosticar problemas de aplicaciones puede ralentizar significativamente la innovación. Para abordar esto, Google presentó Gemini Cloud Assist, que ofrece asistencia impulsada por IA a lo largo del ciclo de vida de la aplicación. La vista previa privada de Gemini Cloud Assist Investigations ayuda a los usuarios a comprender rápidamente las causas raíz y resolver problemas.
¿Lo mejor? Assist Investigations será accesible directamente desde la consola de GKE, reduciendo el tiempo de resolución de problemas y liberando más tiempo para la innovación. Permitirá diagnosticar problemas de pods y clústeres desde la consola de GKE en varios servicios de Google Cloud, incluidos nodos, IAM y balanceadores de carga. Podrás ver registros y errores en múltiples servicios, controladores, pods y nodos subyacentes de GKE. Regístrate para la vista previa privada para experimentar esta función de primera mano.
Como parte de su estrategia más amplia de tecnologías emergentes, Google se está posicionando como líder en plataformas optimizadas para IA. Estos desarrollos permiten a las empresas de diversas industrias usar la IA de manera más efectiva, impulsando la innovación y la eficiencia en las operaciones y las experiencias de los clientes.
Por ejemplo, Intuit aprovecha Document AI y Gemini de Google Cloud para simplificar la preparación de impuestos para millones de usuarios de TurboTax. Reddit utiliza Gemini a través de Vertex AI, el constructor de agentes de IA de Google, para mejorar Reddit Answers, una nueva plataforma de conversación impulsada por IA diseñada para mejorar la experiencia de la página de inicio.
¿Podrá Google ejecutar con éxito estas transformaciones habilitadas por IA? Solo el tiempo lo dirá. Como dijo Pichai en diciembre, "En la historia, no siempre necesitas ser el primero, pero tienes que ejecutar bien y ser realmente el mejor en su clase como producto. Creo que de eso se trata 2025."
Google Fotos da vida al emblemático armario de «Clueless» gracias a la inteligencia artificial
Google Fotos anunció el miércoles una nueva función basada en la inteligencia artificial que pronto convertirá las fotos de tu ropa en un armario digital, lo que te permitirá crear nuevas combinacione
El cortometraje «Red Fruit» es acusado de utilizar IA para robar los rostros de personas corrientes; no hay respuesta oficial
El sector de los vídeos cortos se enfrenta actualmente a una polémica relacionada con la infracción de derechos de autor mediante el uso de la inteligencia artificial. La producción de Red Fruit Short
Una guía por la nueva norma de seguridad de la IA del ETSI
La norma ETSI EN 304 223 establece los requisitos de seguridad fundamentales para la inteligencia artificial que las organizaciones deben integrar en sus estructuras de gobernanza.A medida que las emp
Google's Kubernetes-Updates für KI sind echt spannend! 🚀 Aber mal ehrlich, wann wird das für kleinere Teams bezahlbar? Die Konkurrenz schläft ja nicht. Finde den Fokus auf 'echte Probleme' gut, aber die Komplexität bleibt eine Hürde.
Pas mal ces améliorations Kubernetes pour l'IA ! Après c'est toujours la même question : est-ce que Google va réussir à rattraper son retard face à Azure et AWS sur le cloud IA ? 🧐 L'approche 'open source' pourrait faire la différence...
Interesante ver cómo Google sigue integrando Kubernetes con IA 🚀. Pero me pregunto, ¿estas mejoras realmente simplificarán la vida de los desarrolladores o solo añadirán más complejidad? Ojalá incluyan buenos tutoriales para principiantes.
Los avances de Google en Kubernetes y GKE para IA suenan prometedores, pero ¿realmente simplificarán el trabajo de los desarrolladores o solo agregarán más capas de complejidad? 🤔 A veces siento que estas actualizaciones son más para el marketing que para solucionar problemas reales.
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀





Hogar






