Hogar Noticias Google revela nuevas mejoras de Kubernetes y GKE para la innovación de IA

Google revela nuevas mejoras de Kubernetes y GKE para la innovación de IA

11 de abril de 2025
JosephScott
58

Google revela nuevas mejoras de Kubernetes y GKE para la innovación de IA

El impulso de Google en IA no es ningún secreto, y con una buena razón. Como el CEO Sundar Pichai enfatizó en una reunión interna antes de las vacaciones del año pasado, "en 2025, debemos centrarnos implacablemente en desbloquear los beneficios de la tecnología [AI] y resolver problemas reales de los usuarios". Esta visión está impulsando a Google a mejorar sus ofertas significativamente, especialmente en los servicios en la nube y la integración de IA.

En el evento Google Cloud Next 2025 en Las Vegas, Google presentó avances sustanciales en Kubernetes y Google Kubernetes (GKE). Estas actualizaciones tienen como objetivo capacitar a los equipos y desarrolladores de la plataforma para aprovechar la IA al tiempo que aprovechan su experiencia existente en Kubernetes. Gabe Monroy, vicepresidente de Runtimes de Cloud de Google, lo expresó sucintamente: "Sus habilidades e inversiones de Kubernetes no son solo relevantes; son su superpotencia de IA".

Entonces, ¿cuáles son exactamente estos nuevos avances? Vamos a sumergirnos en los detalles.

Gestión de clúster de IA simplificada: GKE está introduciendo la gestión de clúster de IA simplificada a través de herramientas como el director de clúster para GKE, anteriormente conocido como HyperCompute Cluster. Esta herramienta permite a los usuarios implementar y administrar grandes grupos de máquinas virtuales (VM) con GPU NVIDIA adjuntas, lo que facilita la escala de las cargas de trabajo de IA de manera eficiente.

Un próximo servicio relacionado es el director de clúster para Slurm. Slurm, un programador de trabajo de código abierto y administrador de carga de trabajo para Linux, será más fácil de aprovisionar y operar gracias a la UI y API simplificadas de Google. Estos incluirán planos para cargas de trabajo típicas con software preconfigurado, asegurando implementaciones confiables y repetibles.

Implementación del modelo de IA optimizado: las nuevas características de GKE también se centran en optimizar la implementación del modelo de IA. La Inferencia GKE QuickStart y GKE Inference Gateway simplifican la selección y el despliegue de modelos AI, asegurando que funcionen bien con el equilibrio de carga inteligente.

Gabe Monroy destacó la tendencia de la innovación de IA que se cruza con la informática tradicional, particularmente en el ámbito de la inferencia. Señaló: "Estamos viendo una tendencia clara en la era de la IA: la innovación sorprendente está ocurriendo donde el calculador tradicional interactúa con las redes neuronales, también conocidas como 'inferencia'. Las empresas que operan a la vanguardia de Kubernetes y AI, como LiveX y Moloco, ejecutan inferencia de IA en GKE ".

Inferencia rentable: GKE está avanzando en una inferencia rentable con la puerta de enlace de inferencia. Monroy afirma que este enfoque puede reducir los costos de servicio hasta en un 30%, reducir la latencia hasta en un 60%y aumentar el rendimiento en un 40%en comparación con otras ofertas de Kubernetes administradas y de código abierto. Si bien estas son cifras prometedoras, necesitaremos verlas en acción para confirmar su impacto.

El equilibrio de carga consciente del modelo es un componente clave de esta estrategia. Dadas las longitudes de respuesta variable en los modelos de IA, los métodos tradicionales de equilibrio de carga como la redonda pueden ser ineficientes. Sin embargo, la puerta de enlace de inferencia ofrece una puerta de enlace consciente del modelo optimizada para IA, con un enrutamiento avanzado a diferentes versiones de modelo.

Eficiencia mejorada de recursos: GKE también se centra en mejorar la eficiencia de los recursos. El piloto automático GKE ahora ofrece una programación de pod más rápida, tiempos de reacción de escala más rápidos y una mejor capacidad de tamaño correcto. Esto significa que los usuarios pueden manejar más tráfico con los mismos recursos o mantener el tráfico existente con menos recursos. Google afirma que con el piloto automático mejorado, la capacidad del clúster siempre será de tamaño correcto.

Actualmente, el piloto automático incluye una herramienta de configuración del clúster de mejores prácticas y una plataforma de cómputo optimizada por contenedores que ajusta automáticamente la capacidad para que coincida con las cargas de trabajo. Sin embargo, no tiene un tamaño correcto de grupos existentes sin una configuración específica. A partir del tercer trimestre, la plataforma de cómputo optimizada del contenedor de AutoPilot también estará disponible para los grupos GKE estándar sin necesidad de una configuración específica, que podría ser un cambio de juego.

Asistencia de nube Gemini habilitada para AI: la depuración y el diagnóstico de los problemas de aplicación pueden ralentizar significativamente la innovación. Para abordar esto, Google introdujo Gemini Cloud Assist, ofreciendo asistencia a IA a través del ciclo de vida de la aplicación. La vista previa privada de las investigaciones de asistencia en la nube de Gemini ayuda a los usuarios a comprender rápidamente las causas raíz y resolver problemas.

La mejor parte? Las investigaciones de asistencia serán accesibles directamente desde la consola GKE, reduciendo el tiempo de solución de problemas y liberando más tiempo para la innovación. Le permitirá diagnosticar problemas de POD y clúster de la consola GKE en varios servicios de Google Cloud, incluidos nodos, IAM y equilibradores de carga. Puede ver registros y errores en múltiples servicios GKE, controladores, vainas y nodos subyacentes. Regístrese para la vista previa privada para experimentar esta función de primera mano.

Como parte de su estrategia de tecnología emergente más amplia, Google se está posicionando como líder en plataformas optimizadas AI-AI. Estos desarrollos permiten a las empresas en todas las industrias utilizar la IA de manera más efectiva, impulsando la innovación y la eficiencia en las operaciones y las experiencias de los clientes.

Por ejemplo, Intuit aprovecha la IA y Gemini del documento de Google Cloud para simplificar la preparación de impuestos para millones de usuarios de TurboTax. Reddit usa Gemini a través de Vertex AI, AI Agent Builder de Google, para mejorar las respuestas de Reddit, una nueva plataforma de conversación con AI diseñada para mejorar la experiencia de la página de inicio.

¿Puede Google ejecutar con éxito estas transformaciones habilitadas para AI? Solo el tiempo lo dirá. Como Pichai dijo en diciembre, "En la historia, no siempre necesitas ser el primero, pero tienes que ejecutar bien y realmente ser el mejor en clase como producto. Creo que de eso se trata 2025".

Artículo relacionado
Decodificación de Oshi no Ko's 'Idol': un análisis de buceo profundo Decodificación de Oshi no Ko's 'Idol': un análisis de buceo profundo El tema de apertura de *Oshi no Ko *, titulado "Idol", trasciende siendo solo una melodía J-Pop pegadiza; Es una obra maestra narrativa que se sumerge profundamente en las complejidades del estrellato, la identidad y las líneas a menudo borrosas entre la imagen pública de un ídolo y la realidad privada. Esta canción no solo prepara el escenario para
Reacción de fanfiction de Wattpad: la hilarante toma de Timi Saint Reacción de fanfiction de Wattpad: la hilarante toma de Timi Saint Si estás de humor para un viaje salvaje lleno de risas y esos momentos dignos de estrangulamiento, entonces tienes que ver la última escapada de YouTube de Timi Saint. Esta estrella en ascenso es conocida por sus reacciones sin filtrar y su habilidad para traer humor relatable a la pantalla. En su nuevo video, Timi di
Cómo estamos usando IA para ayudar a las ciudades a abordar el calor extremo Cómo estamos usando IA para ayudar a las ciudades a abordar el calor extremo Parece que 2024 podría romper el récord del año más caluroso hasta el momento, superando 2023. Esta tendencia es particularmente dura para las personas que viven en las islas de calor urbano: aquellos lugares en las ciudades donde el concreto y el asfalto absorben los rayos del sol y luego irradian el calor directamente. Estas áreas pueden calentarse
Comentario (45)
0/200
BenRoberts
BenRoberts 12 de abril de 2025 12:27:35 GMT

The new Kubernetes and GKE enhancements are pretty cool for AI projects! It's made deploying and managing AI workloads a breeze. Though, it can be a bit overwhelming for beginners, so maybe Google could offer more tutorials?

LucasWalker
LucasWalker 12 de abril de 2025 12:27:35 GMT

新しいKubernetesとGKEの強化は、AIプロジェクトに最適ですね!AIワークロードのデプロイと管理が簡単になりました。ただ、初心者には少し圧倒的かもしれないので、Googleがもっとチュートリアルを提供してくれると良いですね。

DonaldSanchez
DonaldSanchez 12 de abril de 2025 12:27:35 GMT

새로운 Kubernetes와 GKE 개선은 AI 프로젝트에 정말 좋네요! AI 워크로드를 배포하고 관리하는 것이 훨씬 쉬워졌어요. 다만, 초보자에게는 조금 압도적일 수 있으니, 구글이 더 많은 튜토리얼을 제공하면 좋겠어요.

KennethKing
KennethKing 12 de abril de 2025 12:27:35 GMT

As novas melhorias do Kubernetes e GKE são ótimas para projetos de IA! Tornou o deploy e a gestão de cargas de trabalho de IA muito mais fáceis. No entanto, pode ser um pouco esmagador para iniciantes, então talvez o Google pudesse oferecer mais tutoriais?

AnthonyPerez
AnthonyPerez 12 de abril de 2025 12:27:35 GMT

Las nuevas mejoras de Kubernetes y GKE son geniales para proyectos de IA. Ha facilitado mucho el despliegue y la gestión de cargas de trabajo de IA. Aunque puede ser un poco abrumador para principiantes, ¿quizás Google podría ofrecer más tutoriales?

KevinScott
KevinScott 12 de abril de 2025 07:56:26 GMT

Google's focus on AI with Kubernetes and GKE is impressive, but I'm still figuring out how to use it effectively. It's like they're speaking a different language sometimes. Can anyone give me a simple guide or something? I want to harness this power, but it's a bit overwhelming right now!

Back to Top
OR