옵션
뉴스
Google은 AI Innovation을위한 새로운 Kubernetes 및 GKE 향상을 공개합니다.

Google은 AI Innovation을위한 새로운 Kubernetes 및 GKE 향상을 공개합니다.

2025년 4월 11일
115

Google은 AI Innovation을위한 새로운 Kubernetes 및 GKE 향상을 공개합니다.

Google의 AI 진출은 비밀이 아니며, 그럴만한 이유가 있습니다. CEO Sundar Pichai가 지난해 휴일 전 내부 회의에서 강조했듯이, "2025년에는 [AI] 기술의 이점을 활용하고 실제 사용자 문제를 해결하는 데 끊임없이 집중해야 합니다." 이 비전은 Google이 클라우드 서비스와 AI 통합을 통해 제품을 크게 개선하도록 이끌고 있습니다.

2025년 라스베이거스에서 열린 Google Cloud Next 2025 행사에서 Google은 Kubernetes와 Google Kubernetes Engine(GKE)에서 상당한 발전을 공개했습니다. 이러한 업데이트는 플랫폼 팀과 개발자들이 기존 Kubernetes 전문성을 활용하면서 AI를 활용할 수 있도록 지원하는 것을 목표로 합니다. Google의 클라우드 런타임 부사장 Gabe Monroy는 간결하게 말했습니다: "당신의 Kubernetes 기술과 투자는 단순히 관련 있는 것이 아니라, 당신의 AI 슈퍼파워입니다."

그렇다면, 이 새로운 발전은 정확히 무엇일까요? 자세히 알아보겠습니다.

간소화된 AI 클러스터 관리: GKE는 이전에 Hypercompute Cluster로 알려졌던 Cluster Director for GKE와 같은 도구를 통해 간소화된 AI 클러스터 관리를 도입하고 있습니다. 이 도구는 사용자가 Nvidia GPU가 연결된 대규모 가상 머신(VM) 클러스터를 배포하고 관리할 수 있게 해주며, AI 워크로드를 효율적으로 확장하기 쉽게 만듭니다.

관련된 곧 출시될 서비스는 Slurm용 Cluster Director입니다. Linux용 오픈소스 작업 스케줄러 및 워크로드 관리자인 Slurm은 Google의 간소화된 UI와 API 덕분에 프로비저닝 및 운영이 더 쉬워질 것입니다. 여기에는 사전 구성된 소프트웨어가 포함된 일반적인 워크로드용 블루프린트가 포함되어 안정적이고 반복 가능한 배포를 보장합니다.

최적화된 AI 모델 배포: GKE의 새로운 기능은 AI 모델 배포 최적화에도 초점을 맞추고 있습니다. GKE Inference Quickstart와 GKE Inference Gateway는 AI 모델의 선택과 배포를 간소화하여 지능형 로드 밸런싱으로 모델이 잘 수행되도록 합니다.

Gabe Monroy는 AI 혁신이 전통적인 컴퓨팅과 교차하는 추세, 특히 추론(inference) 영역에서 두드러진다고 강조했습니다. 그는 "AI 시대에 분명한 추세를 보고 있습니다: 전통적인 컴퓨팅이 신경망과 상호작용하는 곳, 즉 '추론'에서 놀라운 혁신이 일어나고 있습니다. LiveX와 Moloco와 같은 Kubernetes와 AI의 최전선에서 운영하는 기업들은 GKE에서 AI 추론을 실행합니다."라고 말했습니다.

비용 효율적인 추론: GKE는 Inference Gateway를 통해 비용 효율적인 추론에서 큰 진전을 이루고 있습니다. Monroy는 이 접근법이 다른 관리형 및 오픈소스 Kubernetes 제품에 비해 서비스 비용을 최대 30% 줄이고, 지연 시간을 최대 60% 단축하며, 처리량을 40% 증가시킬 수 있다고 주장합니다. 이는 유망한 수치이지만, 그 영향을 확인하려면 실제로 작동하는 모습을 확인해야 할 것입니다.

모델 인식 로드 밸런싱은 이 전략의 핵심 구성 요소입니다. AI 모델의 가변적인 응답 길이를 고려할 때, 라운드 로빈과 같은 전통적인 로드 밸런싱 방법은 비효율적일 수 있습니다. 그러나 Inference Gateway는 AI에 최적화된 모델 인식 게이트웨이를 제공하며, 다양한 모델 버전으로의 고급 라우팅을 지원합니다.

향상된 리소스 효율성: GKE는 리소스 효율성 향상에도 초점을 맞추고 있습니다. GKE Autopilot은 이제 더 빠른 포드 스케줄링, 더 빠른 스케일링 반응 시간, 그리고 더 나은 용량 적정화를 제공합니다. 이는 사용자가 동일한 리소스로 더 많은 트래픽을 처리하거나 적은 리소스로 기존 트래픽을 유지할 수 있음을 의미합니다. Google은 개선된 Autopilot을 통해 클러스터 용량이 항상 적절하게 조정될 것이라고 주장합니다.

현재 Autopilot은 모범 사례 클러스터 구성 도구와 워크로드에 맞춰 용량을 자동으로 조정하는 컨테이너 최적화 컴퓨팅 플랫폼을 포함합니다. 그러나 특정 구성이 없으면 기존 클러스터를 적정화하지 않습니다. 3분기부터 Autopilot의 컨테이너 최적화 컴퓨팅 플랫폼은 특정 구성 없이도 표준 GKE 클러스터에 제공될 예정이며, 이는 게임 체인저가 될 수 있습니다.

AI 지원 Gemini Cloud Assist: 애플리케이션 문제 디버깅과 진단은 혁신을 크게 늦출 수 있습니다. 이를 해결하기 위해 Google은 애플리케이션 라이프사이클 전반에 걸쳐 AI 기반 지원을 제공하는 Gemini Cloud Assist를 도입했습니다. Gemini Cloud Assist Investigations의 비공개 프리뷰는 사용자가 근본 원인을 빠르게 파악하고 문제를 해결할 수 있도록 도와줍니다.

가장 좋은 점은? Assist Investigations는 GKE 콘솔에서 직접 접근 가능하여 문제 해결 시간을 줄이고 혁신에 더 많은 시간을 할애할 수 있게 합니다. 이를 통해 노드, IAM, 로드 밸런서를 포함한 다양한 Google Cloud 서비스에서 GKE 콘솔을 통해 포드 및 클러스터 문제를 진단할 수 있습니다. 여러 GKE 서비스, 컨트롤러, 포드 및 기본 노드에서 로그와 오류를 확인할 수 있습니다. 이 기능을 직접 경험하려면 비공개 프리뷰에 등록하세요.

Google은 더 광범위한 신흥 기술 전략의 일환으로 AI 최적화 플랫폼의 리더로 자리 잡고 있습니다. 이러한 발전은 산업 전반의 기업들이 AI를 더 효과적으로 사용하여 운영과 고객 경험에서 혁신과 효율성을 이끌어낼 수 있게 합니다.

예를 들어, Intuit는 Google Cloud의 Document AI와 Gemini를 활용하여 수백만 TurboTax 사용자의 세금 준비를 간소화합니다. Reddit은 Google의 AI 에이전트 빌더인 Vertex AI를 통해 Gemini를 사용하여 홈페이지 경험을 개선하는 새로운 AI 기반 대화 플랫폼인 Reddit Answers를 강화합니다.

Google이 이러한 AI 지원 변환을 성공적으로 실행할 수 있을까요? 시간만이 말해줄 것입니다. Pichai가 12월에 언급했듯이, "역사적으로 항상 먼저일 필요는 없지만, 잘 실행하고 제품으로서 최고가 되어야 합니다. 그것이 2025년의 전부라고 생각합니다."

관련 기사
Qodo, Google Cloud와 협력하여 개발자를 위한 무료 AI 코드 리뷰 도구 제공 Qodo, Google Cloud와 협력하여 개발자를 위한 무료 AI 코드 리뷰 도구 제공 코드 품질에 초점을 맞춘 이스라엘 기반 AI 코딩 스타트업 Qodo가 Google Cloud와 파트너십을 시작하여 AI로 생성된 소프트웨어의 무결성을 강화했습니다.기업들이 코딩에 AI를 점점 더 많이 의존함에 따라, 강력한 감독 및 품질 보증 도구에 대한 수요가 증가하고 있습니다.Qodo의 CEO Itamar Friedman은 AI로 생성된 코드가 현대 개
DeepMind의 AI가 2025 수학 올림피아드에서 금메달 획득 DeepMind의 AI가 2025 수학 올림피아드에서 금메달 획득 DeepMind의 AI는 수학적 추론에서 놀라운 도약을 이루어, 2024년에 은메달을 획득한 지 불과 1년 만에 2025 국제수학올림피아드(IMO)에서 금메달을 차지했습니다. 이 돌파구는 인간과 같은 창의력이 요구되는 복잡하고 추상적인 문제를 해결하는 AI의 성장하는 능력을 강조합니다. 이 기사에서는 DeepMind의 변혁적 여정, 주요 기술적 발전, 그리
AI로 구동되는 패럴랙스 메이커: 역동적인 2.5D 애니메이션 제작 AI로 구동되는 패럴랙스 메이커: 역동적인 2.5D 애니메이션 제작 정적인 이미지를 매혹적인 2.5D 애니메이션으로 변환하세요. 이 오픈 소스 도구는 아티스트와 게임 개발자가 자신의 작업에 깊이와 움직임을 더할 수 있도록 지원합니다. Stability AI API를 활용하여 Parallax Maker는 저사양 하드웨어에서도 원활한 워크플로우를 보장합니다. 이 도구의 기능과 창의적인 프로젝트를 어떻게 향상시킬 수 있는지 알아
의견 (45)
0/200
JasonHarris
JasonHarris 2025년 4월 22일 오후 6시 46분 9초 GMT+09:00

Google's Kubernetes and GKE updates for AI are pretty cool! They're really stepping up their game in AI innovation. It's awesome to see them focusing on solving real user problems. Can't wait to see what they come up with next! 🚀

RaymondRodriguez
RaymondRodriguez 2025년 4월 22일 오후 1시 59분 7초 GMT+09:00

Las actualizaciones de Google para Kubernetes y GKE enfocadas en IA son bastante geniales. Realmente están subiendo el nivel en la innovación de IA. Es genial verlos enfocados en resolver problemas reales de los usuarios. ¡No puedo esperar a ver qué vendrá después! 🚀

HarryLewis
HarryLewis 2025년 4월 21일 오전 11시 25분 32초 GMT+09:00

구글의 쿠버네티스와 GKE의 AI 관련 업데이트 정말 멋지네요! AI 혁신에 정말 열심히 하고 있는 것 같아요. 사용자의 문제를 해결하는 데 집중하는 것도 훌륭해요. 다음에 어떤 것이 나올지 기대돼요! 🚀

StevenNelson
StevenNelson 2025년 4월 20일 오후 4시 39분 43초 GMT+09:00

GoogleのKubernetesとGKEの強化はAIイノベーションにはすごいけど、ちょっと難しすぎるかな。😅 ユーザーの問題を解決しようとする努力は評価するけど、もっとユーザーフレンドリーな説明が欲しいな。でも、AIとテクノロジーに興味があるなら、チェックする価値はあるよ!👀

RaymondWalker
RaymondWalker 2025년 4월 19일 오전 9시 59분 15초 GMT+09:00

¡Las nuevas mejoras de Google en Kubernetes y GKE son bastante buenas para la innovación en IA! Está claro que están empujando fuerte para resolver problemas reales de los usuarios. Solo desearía que la documentación fuera un poco más clara, es un poco complicado navegar por ella. 😓 Aún así, es un paso en la dirección correcta!

EmmaJohnson
EmmaJohnson 2025년 4월 19일 오전 3시 52분 50초 GMT+09:00

Googleの新しいKubernetesとGKEの強化は、AIイノベーションにとって素晴らしいですね!ユーザーの実際の問題を解決するために本気で取り組んでいることがわかります。ただ、ドキュメントがもう少し分かりやすければ良かったのに、少し見つけにくいです。😓それでも、前進の一歩ですね!

위로 돌아갑니다
OR