вариант
Дом
Новости
Google раскрывает новые усовершенствования Kubernetes и GKE для инноваций ИИ

Google раскрывает новые усовершенствования Kubernetes и GKE для инноваций ИИ

11 апреля 2025 г.
115

Google раскрывает новые усовершенствования Kubernetes и GKE для инноваций ИИ

Продвижение Google в области ИИ не является секретом, и на то есть веские причины. Как подчеркнул генеральный директор Сундар Пичаи на внутреннем совещании перед прошлогодними праздниками, «В 2025 году нам нужно неустанно сосредотачиваться на раскрытии преимуществ технологии [ИИ] и решении реальных проблем пользователей». Это видение побуждает Google значительно улучшать свои предложения, особенно в области облачных сервисов и интеграции ИИ.

На мероприятии Google Cloud Next 2025 в Лас-Вегасе Google представила значительные улучшения в Kubernetes и Google Kubernetes Engine (GKE). Эти обновления направлены на то, чтобы дать командам платформ и разработчикам возможность использовать ИИ, опираясь на их существующий опыт работы с Kubernetes. Гейб Монрой, вице-президент Google по облачным средам выполнения, выразился лаконично: «Ваши навыки и инвестиции в Kubernetes не просто актуальны; они — ваша суперсила в области ИИ».

Итак, что именно представляют собой эти новые улучшения? Давайте разберемся в деталях.

Упрощенное управление кластерами ИИ: GKE вводит упрощенное управление кластерами ИИ с помощью инструментов, таких как Cluster Director для GKE, ранее известного как Hypercompute Cluster. Этот инструмент позволяет пользователям развертывать и управлять большими кластерами виртуальных машин (VM) с подключенными графическими процессорами Nvidia, упрощая эффективное масштабирование рабочих нагрузок ИИ.

Связанная с этим предстоящая услуга — Cluster Director для Slurm. Slurm, открытый планировщик задач и менеджер рабочих нагрузок для Linux, станет проще в настройке и эксплуатации благодаря упрощенному интерфейсу и API от Google. Они будут включать шаблоны для типичных рабочих нагрузок с предварительно настроенным программным обеспечением, обеспечивая надежные и воспроизводимые развертывания.

Оптимизированное развертывание моделей ИИ: Новые функции GKE также сосредоточены на оптимизации развертывания моделей ИИ. GKE Inference Quickstart и GKE Inference Gateway упрощают выбор и развертывание моделей ИИ, обеспечивая их высокую производительность с интеллектуальной балансировкой нагрузки.

Гейб Монрой отметил тенденцию пересечения инноваций в области ИИ с традиционными вычислениями, особенно в сфере вывода. Он заметил: «Мы видим явную тенденцию в эпоху ИИ: удивительные инновации происходят там, где традиционные вычисления взаимодействуют с нейронными сетями — иначе говоря, ‘вывод’. Компании, работающие на передовой Kubernetes и ИИ, такие как LiveX и Moloco, используют вывод ИИ на GKE».

Экономичный вывод: GKE делает шаги в сторону экономичного вывода с помощью Inference Gateway. Монрой утверждает, что этот подход может снизить затраты на обслуживание до 30%, сократить задержки до 60% и увеличить пропускную способность на 40% по сравнению с другими управляемыми и открытыми предложениями Kubernetes. Хотя эти цифры многообещающие, их влияние нужно будет проверить на практике.

Балансировка нагрузки, учитывающая модели, является ключевым компонентом этой стратегии. Учитывая переменную длину ответов в моделях ИИ, традиционные методы балансировки нагрузки, такие как round-robin, могут быть неэффективными. Однако Inference Gateway предлагает шлюз, оптимизированный для ИИ, с продвинутой маршрутизацией к различным версиям моделей.

Повышенная эффективность ресурсов: GKE также сосредотачивается на повышении эффективности ресурсов. GKE Autopilot теперь предлагает более быстрое планирование подов, более быстрые реакции на масштабирование и лучшее соответствие мощности. Это означает, что пользователи могут обрабатывать больше трафика с теми же ресурсами или поддерживать существующий трафик с меньшими ресурсами. Google утверждает, что с улучшенным Autopilot мощность кластера всегда будет оптимальной.

В настоящее время Autopilot включает инструмент конфигурации кластера по лучшим практикам и оптимизированную для контейнеров вычислительную платформу, которая автоматически подстраивает мощность под рабочие нагрузки. Однако она не оптимизирует существующие кластеры без специальной конфигурации. Начиная с третьего квартала, оптимизированная для контейнеров вычислительная платформа Autopilot также будет доступна для стандартных кластеров GKE без необходимости специальной конфигурации, что может стать переломным моментом.

ИИ-поддержка Gemini Cloud Assist: Отладка и диагностика проблем приложений могут значительно замедлить инновации. Для решения этой проблемы Google представила Gemini Cloud Assist, предлагающую помощь на базе ИИ на протяжении всего жизненного цикла приложения. Частная предварительная версия Gemini Cloud Assist Investigations помогает пользователям быстро понять причины проблем и устранить их.

Лучшая часть? Assist Investigations будет доступна непосредственно из консоли GKE, сокращая время на устранение неполадок и освобождая больше времени для инноваций. Она позволит диагностировать проблемы подов и кластеров из консоли GKE для различных сервисов Google Cloud, включая узлы, IAM и балансировщики нагрузки. Вы сможете просматривать логи и ошибки для множества сервисов GKE, контроллеров, подов и базовых узлов. Зарегистрируйтесь для участия в частной предварительной версии, чтобы испытать эту функцию на себе.

В рамках своей более широкой стратегии в области новых технологий Google позиционирует себя как лидера в платформах, оптимизированных для ИИ. Эти разработки позволяют предприятиям из разных отраслей более эффективно использовать ИИ, стимулируя инновации и эффективность в операциях и клиентском опыте.

Например, Intuit использует Document AI и Gemini от Google Cloud, чтобы упростить подготовку налогов для миллионов пользователей TurboTax. Reddit использует Gemini через Vertex AI, конструктор ИИ-агентов от Google, чтобы улучшить Reddit Answers, новую платформу для разговоров на базе ИИ, предназначенную для улучшения опыта главной страницы.

Сможет ли Google успешно реализовать эти трансформации с поддержкой ИИ? Время покажет. Как заявил Пичаи в декабре, «В истории не всегда нужно быть первым, но нужно хорошо выполнять и действительно быть лучшим в своем классе как продукт. Я думаю, именно об этом 2025 год».

Связанная статья
AI-управляемое создание музыки: Легко создавайте песни и видео AI-управляемое создание музыки: Легко создавайте песни и видео Создание музыки может быть сложным, требующим времени, ресурсов и опыта. Искусственный интеллект преобразил этот процесс, сделав его простым и доступным. Это руководство показывает, как ИИ позволяет к
Создание раскрасок с использованием ИИ: Полное руководство Создание раскрасок с использованием ИИ: Полное руководство Создание раскрасок — это увлекательное занятие, сочетающее художественное выражение с успокаивающим опытом для пользователей. Однако процесс может быть трудоемким. К счастью, инструменты ИИ упрощают с
Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo, израильский стартап в области AI-кодирования, ориентированный на качество кода, начал сотрудничество с Google Cloud для повышения целостности программного обеспечения, созданного AI.По мере рост
Комментарии (45)
JasonHarris
JasonHarris 22 апреля 2025 г., 12:46:09 GMT+03:00

Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀

RaymondRodriguez
RaymondRodriguez 22 апреля 2025 г., 7:59:07 GMT+03:00

Las actualizaciones de Google para Kubernetes y GKE enfocadas en IA son bastante geniales. Realmente están subiendo el nivel en la innovación de IA. Es genial verlos enfocados en resolver problemas reales de los usuarios. ¡No puedo esperar a ver qué vendrá después! 🚀

HarryLewis
HarryLewis 21 апреля 2025 г., 5:25:32 GMT+03:00

구글의 쿠버네티스와 GKE의 AI 관련 업데이트 정말 멋지네요! AI 혁신에 정말 열심히 하고 있는 것 같아요. 사용자의 문제를 해결하는 데 집중하는 것도 훌륭해요. 다음에 어떤 것이 나올지 기대돼요! 🚀

StevenNelson
StevenNelson 20 апреля 2025 г., 10:39:43 GMT+03:00

GoogleのKubernetesとGKEの強化はAIイノベーションにはすごいけど、ちょっと難しすぎるかな。😅 ユーザーの問題を解決しようとする努力は評価するけど、もっとユーザーフレンドリーな説明が欲しいな。でも、AIとテクノロジーに興味があるなら、チェックする価値はあるよ!👀

RaymondWalker
RaymondWalker 19 апреля 2025 г., 3:59:15 GMT+03:00

¡Las nuevas mejoras de Google en Kubernetes y GKE son bastante buenas para la innovación en IA! Está claro que están empujando fuerte para resolver problemas reales de los usuarios. Solo desearía que la documentación fuera un poco más clara, es un poco complicado navegar por ella. 😓 Aún así, es un paso en la dirección correcta!

EmmaJohnson
EmmaJohnson 18 апреля 2025 г., 21:52:50 GMT+03:00

Googleの新しいKubernetesとGKEの強化は、AIイノベーションにとって素晴らしいですね!ユーザーの実際の問題を解決するために本気で取り組んでいることがわかります。ただ、ドキュメントがもう少し分かりやすければ良かったのに、少し見つけにくいです。😓それでも、前進の一歩ですね!

Вернуться к вершине
OR