Google раскрывает новые усовершенствования Kubernetes и GKE для инноваций ИИ
11 апреля 2025 г.
JosephScott
58

Толк Google в ИИ не секрет, и не очень веская. Как подчеркивал генеральный директор Sundar Pichai во внутренней встрече до прошлогодних праздников, «в 2025 году мы должны быть неуклонно сосредоточены на открытии преимуществ технологии [AI] и решении реальных проблем пользователей». Это видение заставляет Google значительно улучшить свои предложения, особенно в облачных сервисах и интеграции искусственного интеллекта.
На мероприятии Google Cloud в следующем 2025 году в Лас -Вегасе Google обнародовал существенные достижения в Kubernetes и Google Kubernetes Engine (GKE). Эти обновления направлены на то, чтобы расширить возможности команд и разработчиков платформ для использования ИИ, используя их существующую экспертизу Kubernetes. Гейб Монрой, вице -президент Google в области Cloud -Runtte, кратко выразил это: «Ваши навыки и инвестиции в Kubernetes не просто актуальны; они ваша сверхдержава ИИ».
Итак, что именно эти новые достижения? Давайте погрузимся в детали.
Упрощенное управление кластером ИИ: GKE вводит упрощенное управление кластером ИИ с помощью таких инструментов, как директор Cluster для GKE, ранее известный как гиперкомпьютный кластер. Этот инструмент позволяет пользователям развертывать и управлять большими кластерами виртуальных машин (VMS) с прикрепленными графическими процессорами NVIDIA, что облегчает эффективное масштабирование рабочих нагрузок ИИ.
Связанная предстоящая служба является директором кластера Slurm. Slurm, планировщик работы с открытым исходным кодом и менеджер рабочей нагрузки для Linux, будет проще предоставить и работать благодаря упрощенному пользовательскому интерфейсу Google и API. Они будут включать в себя чертежи для типичных рабочих нагрузок с предварительно сконфигурированным программным обеспечением, обеспечивая надежные и повторяемые развертывания.
Оптимизированное развертывание модели искусственного интеллекта: новые функции GKE также сосредоточены на оптимизации развертывания модели искусственного интеллекта. Груба QuickStart и GKE вывода GKE ShodStart и GKE упрощают выбор и развертывание моделей искусственного интеллекта, гарантируя, что они хорошо работают с интеллектуальной балансировкой нагрузки.
Гейб Монрой подчеркнул тенденцию инноваций ИИ, пересекающихся с традиционными вычислениями, особенно в сфере вывода. Он отметил: «Мы видим четкую тенденцию в эпоху ИИ: удивительные инновации происходят там, где традиционные вычисления взаимодействуют с нейронными сетями - иначе известными как« вывод ». Компании, работающие на переднем крае Kubernetes и AI, таких как Livex и Moloco, выполняют вывод ИИ на GKE ».
Экономический вывод: GKE делает шаги в экономически эффективном выводе с шлюзом вывода. Монрой утверждает, что этот подход может снизить расходы на обслуживание до 30%, сократить задержку до 60%и увеличить пропускную способность на 40%по сравнению с другими управляемыми и открытым исходным кодом Kubernees. Хотя это многообещающие цифры, нам нужно увидеть их в действии, чтобы подтвердить их влияние.
Балансировка нагрузки с моделями является ключевым компонентом этой стратегии. Учитывая переменные длины отклика в моделях ИИ, традиционные методы балансировки нагрузки, такие как круглый робин, могут быть неэффективными. Однако шлюз вывода предлагает модельный шлюз, оптимизированный для ИИ, с расширенной маршрутизацией в разные модельные версии.
Повышенная эффективность ресурсов: GKE также фокусируется на повышении эффективности ресурсов. Autopilot GKE теперь предлагает более быстрое планирование стручков, более быстрое время реакции масштабирования и лучшее значение для лучшего размера. Это означает, что пользователи могут обрабатывать больше трафика с теми же ресурсами или поддерживать существующий трафик с меньшим количеством ресурсов. Google утверждает, что с улучшенным автопилотом емкость кластера всегда будет иметь правильный размер.
В настоящее время Autopilot включает в себя инструмент конфигурации кластера наиболее практик и контейнер-оптимизированную вычислительную платформу, которая автоматически настраивает емкость для соответствия рабочим нагрузкам. Тем не менее, это не существует существующих кластеров правильного размера без определенной конфигурации. Начиная с третьего квартала, оптимизированная вычислительная платформа Autopilot также будет доступна для стандартных кластеров GKE без необходимости конкретной конфигурации, которая может изменить ситуацию.
AI-поддержка ADAPD GEMINI Cloud Assist: отладка и диагностика вопросов применения может значительно замедлить инновации. Чтобы решить эту проблему, Google представил Gemini Cloud Assist, предлагая помощь в области жизненного цикла приложения на протяжении всего жизненного цикла приложения. Частный предварительный просмотр исследований Gemini Cloud Assist помогает пользователям быстро понять первопричины и решить проблемы.
Самая лучшая часть? Помощь в расследовании будет доступна непосредственно из консоли GKE, сокращая время устранения неполадок и освобождая больше времени для инноваций. Это позволит вам диагностировать проблемы с POD и кластер из консоли GKE в различных облачных сервисах Google, включая узлы, IAM и балансировщики нагрузки. Вы можете просматривать журналы и ошибки в нескольких службах GKE, контроллерах, стручках и базовых узлах. Подпишитесь на частный предварительный просмотр, чтобы испытать эту функцию из первых рук.
В рамках своей более широкой новой технологической стратегии Google позиционирует себя как лидер в платформах A-оптимизированных. Эти разработки позволяют предприятиям в разных отраслях использования ИИ более эффективно, стимулируя инновации и эффективность в операциях и опыте клиентов.
Например, Intuit использует AI и Gemini Document Google Cloud для упрощения налоговой подготовки для миллионов пользователей Turbotax. Reddit использует Gemini через Vertex AI, Google Ag Agent Builder, для улучшения ответов Reddit, новой платформы для разговоров с AI, предназначенной для улучшения опыта домашней страницы.
Может ли Google успешно выполнить эти с поддержкой AI-AI-включенные преобразования? Только время покажет. Как заявил Пичай в декабре: «В истории вам не всегда нужно быть первым, но вы должны хорошо выполнять и действительно быть лучшим в классе как продукт. Я думаю, что это все 2025».
Связанная статья
Преобразование цветовой коррекции с помощью AI Luts в редактировании видео
Готовы ли вы революционизировать свой подход к коррекции цвета в редактировании видео? Инструменты, управляемые ИИ, теперь делают его проще, чем когда-либо для достижения профессиональных, кинематографических взглядов. С появлением современных моделей ИИ, создание пользовательских LUTS (поисковые таблицы), адаптированные к конкретной эстетике, теперь является ACCE
Декодирование Oshi no KO «Идол»: анализ глубокого погружения
Вступительная тема *Oshi no Ko *под названием «Idol» преодолевает просто броскую мелодию J-Pop; Это повествовательный шедевр, который глубоко погружается в сложности славы, идентичности и часто разлученных линий между публичным имидным иминским идолом и частной реальностью. Эта песня не только создает сцену для
Реакция фанфиков Wattpad: веселый дубль Тими Святого
Если у вас есть настроение для дикой поездки, наполненной смехом и этими достойными моментами, то вы должны проверить последнюю эскападу Timi Saint YouTube. Эта восходящая звезда известна своими нефильтрованными реакциями и ее умением привести к экрану относительному юмору. В своем новом видео, Тими ди
Комментарии (45)
BenRoberts
12 апреля 2025 г., 12:27:35 GMT
The new Kubernetes and GKE enhancements are pretty cool for AI projects! It's made deploying and managing AI workloads a breeze. Though, it can be a bit overwhelming for beginners, so maybe Google could offer more tutorials?
0
LucasWalker
12 апреля 2025 г., 12:27:35 GMT
新しいKubernetesとGKEの強化は、AIプロジェクトに最適ですね!AIワークロードのデプロイと管理が簡単になりました。ただ、初心者には少し圧倒的かもしれないので、Googleがもっとチュートリアルを提供してくれると良いですね。
0
DonaldSanchez
12 апреля 2025 г., 12:27:35 GMT
새로운 Kubernetes와 GKE 개선은 AI 프로젝트에 정말 좋네요! AI 워크로드를 배포하고 관리하는 것이 훨씬 쉬워졌어요. 다만, 초보자에게는 조금 압도적일 수 있으니, 구글이 더 많은 튜토리얼을 제공하면 좋겠어요.
0
KennethKing
12 апреля 2025 г., 12:27:35 GMT
As novas melhorias do Kubernetes e GKE são ótimas para projetos de IA! Tornou o deploy e a gestão de cargas de trabalho de IA muito mais fáceis. No entanto, pode ser um pouco esmagador para iniciantes, então talvez o Google pudesse oferecer mais tutoriais?
0
AnthonyPerez
12 апреля 2025 г., 12:27:35 GMT
Las nuevas mejoras de Kubernetes y GKE son geniales para proyectos de IA. Ha facilitado mucho el despliegue y la gestión de cargas de trabajo de IA. Aunque puede ser un poco abrumador para principiantes, ¿quizás Google podría ofrecer más tutoriales?
0
KevinScott
12 апреля 2025 г., 7:56:26 GMT
Google's focus on AI with Kubernetes and GKE is impressive, but I'm still figuring out how to use it effectively. It's like they're speaking a different language sometimes. Can anyone give me a simple guide or something? I want to harness this power, but it's a bit overwhelming right now!
0






Толк Google в ИИ не секрет, и не очень веская. Как подчеркивал генеральный директор Sundar Pichai во внутренней встрече до прошлогодних праздников, «в 2025 году мы должны быть неуклонно сосредоточены на открытии преимуществ технологии [AI] и решении реальных проблем пользователей». Это видение заставляет Google значительно улучшить свои предложения, особенно в облачных сервисах и интеграции искусственного интеллекта.
На мероприятии Google Cloud в следующем 2025 году в Лас -Вегасе Google обнародовал существенные достижения в Kubernetes и Google Kubernetes Engine (GKE). Эти обновления направлены на то, чтобы расширить возможности команд и разработчиков платформ для использования ИИ, используя их существующую экспертизу Kubernetes. Гейб Монрой, вице -президент Google в области Cloud -Runtte, кратко выразил это: «Ваши навыки и инвестиции в Kubernetes не просто актуальны; они ваша сверхдержава ИИ».
Итак, что именно эти новые достижения? Давайте погрузимся в детали.
Упрощенное управление кластером ИИ: GKE вводит упрощенное управление кластером ИИ с помощью таких инструментов, как директор Cluster для GKE, ранее известный как гиперкомпьютный кластер. Этот инструмент позволяет пользователям развертывать и управлять большими кластерами виртуальных машин (VMS) с прикрепленными графическими процессорами NVIDIA, что облегчает эффективное масштабирование рабочих нагрузок ИИ.
Связанная предстоящая служба является директором кластера Slurm. Slurm, планировщик работы с открытым исходным кодом и менеджер рабочей нагрузки для Linux, будет проще предоставить и работать благодаря упрощенному пользовательскому интерфейсу Google и API. Они будут включать в себя чертежи для типичных рабочих нагрузок с предварительно сконфигурированным программным обеспечением, обеспечивая надежные и повторяемые развертывания.
Оптимизированное развертывание модели искусственного интеллекта: новые функции GKE также сосредоточены на оптимизации развертывания модели искусственного интеллекта. Груба QuickStart и GKE вывода GKE ShodStart и GKE упрощают выбор и развертывание моделей искусственного интеллекта, гарантируя, что они хорошо работают с интеллектуальной балансировкой нагрузки.
Гейб Монрой подчеркнул тенденцию инноваций ИИ, пересекающихся с традиционными вычислениями, особенно в сфере вывода. Он отметил: «Мы видим четкую тенденцию в эпоху ИИ: удивительные инновации происходят там, где традиционные вычисления взаимодействуют с нейронными сетями - иначе известными как« вывод ». Компании, работающие на переднем крае Kubernetes и AI, таких как Livex и Moloco, выполняют вывод ИИ на GKE ».
Экономический вывод: GKE делает шаги в экономически эффективном выводе с шлюзом вывода. Монрой утверждает, что этот подход может снизить расходы на обслуживание до 30%, сократить задержку до 60%и увеличить пропускную способность на 40%по сравнению с другими управляемыми и открытым исходным кодом Kubernees. Хотя это многообещающие цифры, нам нужно увидеть их в действии, чтобы подтвердить их влияние.
Балансировка нагрузки с моделями является ключевым компонентом этой стратегии. Учитывая переменные длины отклика в моделях ИИ, традиционные методы балансировки нагрузки, такие как круглый робин, могут быть неэффективными. Однако шлюз вывода предлагает модельный шлюз, оптимизированный для ИИ, с расширенной маршрутизацией в разные модельные версии.
Повышенная эффективность ресурсов: GKE также фокусируется на повышении эффективности ресурсов. Autopilot GKE теперь предлагает более быстрое планирование стручков, более быстрое время реакции масштабирования и лучшее значение для лучшего размера. Это означает, что пользователи могут обрабатывать больше трафика с теми же ресурсами или поддерживать существующий трафик с меньшим количеством ресурсов. Google утверждает, что с улучшенным автопилотом емкость кластера всегда будет иметь правильный размер.
В настоящее время Autopilot включает в себя инструмент конфигурации кластера наиболее практик и контейнер-оптимизированную вычислительную платформу, которая автоматически настраивает емкость для соответствия рабочим нагрузкам. Тем не менее, это не существует существующих кластеров правильного размера без определенной конфигурации. Начиная с третьего квартала, оптимизированная вычислительная платформа Autopilot также будет доступна для стандартных кластеров GKE без необходимости конкретной конфигурации, которая может изменить ситуацию.
AI-поддержка ADAPD GEMINI Cloud Assist: отладка и диагностика вопросов применения может значительно замедлить инновации. Чтобы решить эту проблему, Google представил Gemini Cloud Assist, предлагая помощь в области жизненного цикла приложения на протяжении всего жизненного цикла приложения. Частный предварительный просмотр исследований Gemini Cloud Assist помогает пользователям быстро понять первопричины и решить проблемы.
Самая лучшая часть? Помощь в расследовании будет доступна непосредственно из консоли GKE, сокращая время устранения неполадок и освобождая больше времени для инноваций. Это позволит вам диагностировать проблемы с POD и кластер из консоли GKE в различных облачных сервисах Google, включая узлы, IAM и балансировщики нагрузки. Вы можете просматривать журналы и ошибки в нескольких службах GKE, контроллерах, стручках и базовых узлах. Подпишитесь на частный предварительный просмотр, чтобы испытать эту функцию из первых рук.
В рамках своей более широкой новой технологической стратегии Google позиционирует себя как лидер в платформах A-оптимизированных. Эти разработки позволяют предприятиям в разных отраслях использования ИИ более эффективно, стимулируя инновации и эффективность в операциях и опыте клиентов.
Например, Intuit использует AI и Gemini Document Google Cloud для упрощения налоговой подготовки для миллионов пользователей Turbotax. Reddit использует Gemini через Vertex AI, Google Ag Agent Builder, для улучшения ответов Reddit, новой платформы для разговоров с AI, предназначенной для улучшения опыта домашней страницы.
Может ли Google успешно выполнить эти с поддержкой AI-AI-включенные преобразования? Только время покажет. Как заявил Пичай в декабре: «В истории вам не всегда нужно быть первым, но вы должны хорошо выполнять и действительно быть лучшим в классе как продукт. Я думаю, что это все 2025».




The new Kubernetes and GKE enhancements are pretty cool for AI projects! It's made deploying and managing AI workloads a breeze. Though, it can be a bit overwhelming for beginners, so maybe Google could offer more tutorials?




新しいKubernetesとGKEの強化は、AIプロジェクトに最適ですね!AIワークロードのデプロイと管理が簡単になりました。ただ、初心者には少し圧倒的かもしれないので、Googleがもっとチュートリアルを提供してくれると良いですね。




새로운 Kubernetes와 GKE 개선은 AI 프로젝트에 정말 좋네요! AI 워크로드를 배포하고 관리하는 것이 훨씬 쉬워졌어요. 다만, 초보자에게는 조금 압도적일 수 있으니, 구글이 더 많은 튜토리얼을 제공하면 좋겠어요.




As novas melhorias do Kubernetes e GKE são ótimas para projetos de IA! Tornou o deploy e a gestão de cargas de trabalho de IA muito mais fáceis. No entanto, pode ser um pouco esmagador para iniciantes, então talvez o Google pudesse oferecer mais tutoriais?




Las nuevas mejoras de Kubernetes y GKE son geniales para proyectos de IA. Ha facilitado mucho el despliegue y la gestión de cargas de trabajo de IA. Aunque puede ser un poco abrumador para principiantes, ¿quizás Google podría ofrecer más tutoriales?




Google's focus on AI with Kubernetes and GKE is impressive, but I'm still figuring out how to use it effectively. It's like they're speaking a different language sometimes. Can anyone give me a simple guide or something? I want to harness this power, but it's a bit overwhelming right now!












