Google раскрывает новые усовершенствования Kubernetes и GKE для инноваций ИИ

Продвижение Google в области ИИ не является секретом, и на то есть веские причины. Как подчеркнул генеральный директор Сундар Пичаи на внутреннем совещании перед прошлогодними праздниками, «В 2025 году нам нужно неустанно сосредотачиваться на раскрытии преимуществ технологии [ИИ] и решении реальных проблем пользователей». Это видение побуждает Google значительно улучшать свои предложения, особенно в области облачных сервисов и интеграции ИИ.
На мероприятии Google Cloud Next 2025 в Лас-Вегасе Google представила значительные улучшения в Kubernetes и Google Kubernetes Engine (GKE). Эти обновления направлены на то, чтобы дать командам платформ и разработчикам возможность использовать ИИ, опираясь на их существующий опыт работы с Kubernetes. Гейб Монрой, вице-президент Google по облачным средам выполнения, выразился лаконично: «Ваши навыки и инвестиции в Kubernetes не просто актуальны; они — ваша суперсила в области ИИ».
Итак, что именно представляют собой эти новые улучшения? Давайте разберемся в деталях.
Упрощенное управление кластерами ИИ: GKE вводит упрощенное управление кластерами ИИ с помощью инструментов, таких как Cluster Director для GKE, ранее известного как Hypercompute Cluster. Этот инструмент позволяет пользователям развертывать и управлять большими кластерами виртуальных машин (VM) с подключенными графическими процессорами Nvidia, упрощая эффективное масштабирование рабочих нагрузок ИИ.
Связанная с этим предстоящая услуга — Cluster Director для Slurm. Slurm, открытый планировщик задач и менеджер рабочих нагрузок для Linux, станет проще в настройке и эксплуатации благодаря упрощенному интерфейсу и API от Google. Они будут включать шаблоны для типичных рабочих нагрузок с предварительно настроенным программным обеспечением, обеспечивая надежные и воспроизводимые развертывания.
Оптимизированное развертывание моделей ИИ: Новые функции GKE также сосредоточены на оптимизации развертывания моделей ИИ. GKE Inference Quickstart и GKE Inference Gateway упрощают выбор и развертывание моделей ИИ, обеспечивая их высокую производительность с интеллектуальной балансировкой нагрузки.
Гейб Монрой отметил тенденцию пересечения инноваций в области ИИ с традиционными вычислениями, особенно в сфере вывода. Он заметил: «Мы видим явную тенденцию в эпоху ИИ: удивительные инновации происходят там, где традиционные вычисления взаимодействуют с нейронными сетями — иначе говоря, ‘вывод’. Компании, работающие на передовой Kubernetes и ИИ, такие как LiveX и Moloco, используют вывод ИИ на GKE».
Экономичный вывод: GKE делает шаги в сторону экономичного вывода с помощью Inference Gateway. Монрой утверждает, что этот подход может снизить затраты на обслуживание до 30%, сократить задержки до 60% и увеличить пропускную способность на 40% по сравнению с другими управляемыми и открытыми предложениями Kubernetes. Хотя эти цифры многообещающие, их влияние нужно будет проверить на практике.
Балансировка нагрузки, учитывающая модели, является ключевым компонентом этой стратегии. Учитывая переменную длину ответов в моделях ИИ, традиционные методы балансировки нагрузки, такие как round-robin, могут быть неэффективными. Однако Inference Gateway предлагает шлюз, оптимизированный для ИИ, с продвинутой маршрутизацией к различным версиям моделей.
Повышенная эффективность ресурсов: GKE также сосредотачивается на повышении эффективности ресурсов. GKE Autopilot теперь предлагает более быстрое планирование подов, более быстрые реакции на масштабирование и лучшее соответствие мощности. Это означает, что пользователи могут обрабатывать больше трафика с теми же ресурсами или поддерживать существующий трафик с меньшими ресурсами. Google утверждает, что с улучшенным Autopilot мощность кластера всегда будет оптимальной.
В настоящее время Autopilot включает инструмент конфигурации кластера по лучшим практикам и оптимизированную для контейнеров вычислительную платформу, которая автоматически подстраивает мощность под рабочие нагрузки. Однако она не оптимизирует существующие кластеры без специальной конфигурации. Начиная с третьего квартала, оптимизированная для контейнеров вычислительная платформа Autopilot также будет доступна для стандартных кластеров GKE без необходимости специальной конфигурации, что может стать переломным моментом.
ИИ-поддержка Gemini Cloud Assist: Отладка и диагностика проблем приложений могут значительно замедлить инновации. Для решения этой проблемы Google представила Gemini Cloud Assist, предлагающую помощь на базе ИИ на протяжении всего жизненного цикла приложения. Частная предварительная версия Gemini Cloud Assist Investigations помогает пользователям быстро понять причины проблем и устранить их.
Лучшая часть? Assist Investigations будет доступна непосредственно из консоли GKE, сокращая время на устранение неполадок и освобождая больше времени для инноваций. Она позволит диагностировать проблемы подов и кластеров из консоли GKE для различных сервисов Google Cloud, включая узлы, IAM и балансировщики нагрузки. Вы сможете просматривать логи и ошибки для множества сервисов GKE, контроллеров, подов и базовых узлов. Зарегистрируйтесь для участия в частной предварительной версии, чтобы испытать эту функцию на себе.
В рамках своей более широкой стратегии в области новых технологий Google позиционирует себя как лидера в платформах, оптимизированных для ИИ. Эти разработки позволяют предприятиям из разных отраслей более эффективно использовать ИИ, стимулируя инновации и эффективность в операциях и клиентском опыте.
Например, Intuit использует Document AI и Gemini от Google Cloud, чтобы упростить подготовку налогов для миллионов пользователей TurboTax. Reddit использует Gemini через Vertex AI, конструктор ИИ-агентов от Google, чтобы улучшить Reddit Answers, новую платформу для разговоров на базе ИИ, предназначенную для улучшения опыта главной страницы.
Сможет ли Google успешно реализовать эти трансформации с поддержкой ИИ? Время покажет. Как заявил Пичаи в декабре, «В истории не всегда нужно быть первым, но нужно хорошо выполнять и действительно быть лучшим в своем классе как продукт. Я думаю, именно об этом 2025 год».
Связанная статья
Эксперты по ИИ приступают к работе: крупные модели захватывают фабрики, промышленное производство вступает в новую эпоху
На передовых рубежах биологической ферментации, архитектурного проектирования и даже очистки сточных вод новый вид «сотрудников» незаметно меняет облик традиционного производства. Это не покрытые пото
Google Photos с помощью искусственного интеллекта воскрешает культовый гардероб из фильма «Бестолковые»
В среду сервис Google Фото анонсировал новую функцию на базе искусственного интеллекта, которая в скором времени превратит фотографии вашей одежды в цифровой гардероб, позволяя создавать новые комбина
Короткометражный фильм «Красные фрукты» обвиняют в использовании ИИ для кражи лиц обычных людей; официального комментария пока нет
В настоящее время индустрия короткометражных видеороликов сталкивается со скандалом, связанным с нарушением авторских прав при использовании искусственного интеллекта. Производство Red Fruit Short Dra
Рекомендации по связанным специальным темам
Комментарии (49)
Google's Kubernetes-Updates für KI sind echt spannend! 🚀 Aber mal ehrlich, wann wird das für kleinere Teams bezahlbar? Die Konkurrenz schläft ja nicht. Finde den Fokus auf 'echte Probleme' gut, aber die Komplexität bleibt eine Hürde.
Pas mal ces améliorations Kubernetes pour l'IA ! Après c'est toujours la même question : est-ce que Google va réussir à rattraper son retard face à Azure et AWS sur le cloud IA ? 🧐 L'approche 'open source' pourrait faire la différence...
Interesante ver cómo Google sigue integrando Kubernetes con IA 🚀. Pero me pregunto, ¿estas mejoras realmente simplificarán la vida de los desarrolladores o solo añadirán más complejidad? Ojalá incluyan buenos tutoriales para principiantes.
Los avances de Google en Kubernetes y GKE para IA suenan prometedores, pero ¿realmente simplificarán el trabajo de los desarrolladores o solo agregarán más capas de complejidad? 🤔 A veces siento que estas actualizaciones son más para el marketing que para solucionar problemas reales.
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀

Продвижение Google в области ИИ не является секретом, и на то есть веские причины. Как подчеркнул генеральный директор Сундар Пичаи на внутреннем совещании перед прошлогодними праздниками, «В 2025 году нам нужно неустанно сосредотачиваться на раскрытии преимуществ технологии [ИИ] и решении реальных проблем пользователей». Это видение побуждает Google значительно улучшать свои предложения, особенно в области облачных сервисов и интеграции ИИ.
На мероприятии Google Cloud Next 2025 в Лас-Вегасе Google представила значительные улучшения в Kubernetes и Google Kubernetes Engine (GKE). Эти обновления направлены на то, чтобы дать командам платформ и разработчикам возможность использовать ИИ, опираясь на их существующий опыт работы с Kubernetes. Гейб Монрой, вице-президент Google по облачным средам выполнения, выразился лаконично: «Ваши навыки и инвестиции в Kubernetes не просто актуальны; они — ваша суперсила в области ИИ».
Итак, что именно представляют собой эти новые улучшения? Давайте разберемся в деталях.
Упрощенное управление кластерами ИИ: GKE вводит упрощенное управление кластерами ИИ с помощью инструментов, таких как Cluster Director для GKE, ранее известного как Hypercompute Cluster. Этот инструмент позволяет пользователям развертывать и управлять большими кластерами виртуальных машин (VM) с подключенными графическими процессорами Nvidia, упрощая эффективное масштабирование рабочих нагрузок ИИ.
Связанная с этим предстоящая услуга — Cluster Director для Slurm. Slurm, открытый планировщик задач и менеджер рабочих нагрузок для Linux, станет проще в настройке и эксплуатации благодаря упрощенному интерфейсу и API от Google. Они будут включать шаблоны для типичных рабочих нагрузок с предварительно настроенным программным обеспечением, обеспечивая надежные и воспроизводимые развертывания.
Оптимизированное развертывание моделей ИИ: Новые функции GKE также сосредоточены на оптимизации развертывания моделей ИИ. GKE Inference Quickstart и GKE Inference Gateway упрощают выбор и развертывание моделей ИИ, обеспечивая их высокую производительность с интеллектуальной балансировкой нагрузки.
Гейб Монрой отметил тенденцию пересечения инноваций в области ИИ с традиционными вычислениями, особенно в сфере вывода. Он заметил: «Мы видим явную тенденцию в эпоху ИИ: удивительные инновации происходят там, где традиционные вычисления взаимодействуют с нейронными сетями — иначе говоря, ‘вывод’. Компании, работающие на передовой Kubernetes и ИИ, такие как LiveX и Moloco, используют вывод ИИ на GKE».
Экономичный вывод: GKE делает шаги в сторону экономичного вывода с помощью Inference Gateway. Монрой утверждает, что этот подход может снизить затраты на обслуживание до 30%, сократить задержки до 60% и увеличить пропускную способность на 40% по сравнению с другими управляемыми и открытыми предложениями Kubernetes. Хотя эти цифры многообещающие, их влияние нужно будет проверить на практике.
Балансировка нагрузки, учитывающая модели, является ключевым компонентом этой стратегии. Учитывая переменную длину ответов в моделях ИИ, традиционные методы балансировки нагрузки, такие как round-robin, могут быть неэффективными. Однако Inference Gateway предлагает шлюз, оптимизированный для ИИ, с продвинутой маршрутизацией к различным версиям моделей.
Повышенная эффективность ресурсов: GKE также сосредотачивается на повышении эффективности ресурсов. GKE Autopilot теперь предлагает более быстрое планирование подов, более быстрые реакции на масштабирование и лучшее соответствие мощности. Это означает, что пользователи могут обрабатывать больше трафика с теми же ресурсами или поддерживать существующий трафик с меньшими ресурсами. Google утверждает, что с улучшенным Autopilot мощность кластера всегда будет оптимальной.
В настоящее время Autopilot включает инструмент конфигурации кластера по лучшим практикам и оптимизированную для контейнеров вычислительную платформу, которая автоматически подстраивает мощность под рабочие нагрузки. Однако она не оптимизирует существующие кластеры без специальной конфигурации. Начиная с третьего квартала, оптимизированная для контейнеров вычислительная платформа Autopilot также будет доступна для стандартных кластеров GKE без необходимости специальной конфигурации, что может стать переломным моментом.
ИИ-поддержка Gemini Cloud Assist: Отладка и диагностика проблем приложений могут значительно замедлить инновации. Для решения этой проблемы Google представила Gemini Cloud Assist, предлагающую помощь на базе ИИ на протяжении всего жизненного цикла приложения. Частная предварительная версия Gemini Cloud Assist Investigations помогает пользователям быстро понять причины проблем и устранить их.
Лучшая часть? Assist Investigations будет доступна непосредственно из консоли GKE, сокращая время на устранение неполадок и освобождая больше времени для инноваций. Она позволит диагностировать проблемы подов и кластеров из консоли GKE для различных сервисов Google Cloud, включая узлы, IAM и балансировщики нагрузки. Вы сможете просматривать логи и ошибки для множества сервисов GKE, контроллеров, подов и базовых узлов. Зарегистрируйтесь для участия в частной предварительной версии, чтобы испытать эту функцию на себе.
В рамках своей более широкой стратегии в области новых технологий Google позиционирует себя как лидера в платформах, оптимизированных для ИИ. Эти разработки позволяют предприятиям из разных отраслей более эффективно использовать ИИ, стимулируя инновации и эффективность в операциях и клиентском опыте.
Например, Intuit использует Document AI и Gemini от Google Cloud, чтобы упростить подготовку налогов для миллионов пользователей TurboTax. Reddit использует Gemini через Vertex AI, конструктор ИИ-агентов от Google, чтобы улучшить Reddit Answers, новую платформу для разговоров на базе ИИ, предназначенную для улучшения опыта главной страницы.
Сможет ли Google успешно реализовать эти трансформации с поддержкой ИИ? Время покажет. Как заявил Пичаи в декабре, «В истории не всегда нужно быть первым, но нужно хорошо выполнять и действительно быть лучшим в своем классе как продукт. Я думаю, именно об этом 2025 год».
Эксперты по ИИ приступают к работе: крупные модели захватывают фабрики, промышленное производство вступает в новую эпоху
На передовых рубежах биологической ферментации, архитектурного проектирования и даже очистки сточных вод новый вид «сотрудников» незаметно меняет облик традиционного производства. Это не покрытые пото
Google Photos с помощью искусственного интеллекта воскрешает культовый гардероб из фильма «Бестолковые»
В среду сервис Google Фото анонсировал новую функцию на базе искусственного интеллекта, которая в скором времени превратит фотографии вашей одежды в цифровой гардероб, позволяя создавать новые комбина
Короткометражный фильм «Красные фрукты» обвиняют в использовании ИИ для кражи лиц обычных людей; официального комментария пока нет
В настоящее время индустрия короткометражных видеороликов сталкивается со скандалом, связанным с нарушением авторских прав при использовании искусственного интеллекта. Производство Red Fruit Short Dra
Google's Kubernetes-Updates für KI sind echt spannend! 🚀 Aber mal ehrlich, wann wird das für kleinere Teams bezahlbar? Die Konkurrenz schläft ja nicht. Finde den Fokus auf 'echte Probleme' gut, aber die Komplexität bleibt eine Hürde.
Pas mal ces améliorations Kubernetes pour l'IA ! Après c'est toujours la même question : est-ce que Google va réussir à rattraper son retard face à Azure et AWS sur le cloud IA ? 🧐 L'approche 'open source' pourrait faire la différence...
Interesante ver cómo Google sigue integrando Kubernetes con IA 🚀. Pero me pregunto, ¿estas mejoras realmente simplificarán la vida de los desarrolladores o solo añadirán más complejidad? Ojalá incluyan buenos tutoriales para principiantes.
Los avances de Google en Kubernetes y GKE para IA suenan prometedores, pero ¿realmente simplificarán el trabajo de los desarrolladores o solo agregarán más capas de complejidad? 🤔 A veces siento que estas actualizaciones son más para el marketing que para solucionar problemas reales.
Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀





Дом






