Google은 AI Innovation을위한 새로운 Kubernetes 및 GKE 향상을 공개합니다.
2025년 4월 11일
JosephScott
58

Google이 AI 로의 추진은 비밀이 아니며 정당한 이유가 있습니다. Sundar Pichai CEO가 작년 휴일 이전의 내부 회의에서 강조하면서 "2025 년에 우리는 [AI] 기술의 이점을 잠금 해제하고 실제 사용자 문제를 해결하는 데 끊임없이 집중해야합니다." 이 비전은 특히 클라우드 서비스 및 AI 통합에서 제품을 크게 향상시키기 위해 Google을 주도하고 있습니다.
Las Vegas의 Google Cloud 202 이벤트에서 Google은 Kubernetes 및 Google Kubernetes Engine (GKE)에서 상당한 발전을 공개했습니다. 이 업데이트는 플랫폼 팀과 개발자가 기존 Kubernetes 전문 지식을 활용하면서 AI를 활용할 수 있도록 권한을 부여하는 것을 목표로합니다. Google의 Cloud Runtimes 부사장 인 Gabe Monroy는 간결하게 다음과 같이 말합니다. "Kubernetes 기술과 투자는 관련이있는 것이 아니라 AI 초강대국입니다."
그렇다면이 새로운 발전은 정확히 무엇입니까? 세부 사항을 다이빙합시다.
단순화 된 AI 클러스터 관리 : GKE는 이전에 HyperCompute 클러스터로 알려진 GKE 용 클러스터 디렉터와 같은 도구를 통해 단순화 된 AI 클러스터 관리를 도입하고 있습니다. 이 도구를 사용하면 NVIDIA GPU가 연결된 대형 가상 머신 (VMS) 클러스터를 배포하고 관리 할 수 있으므로 AI 워크로드를 효율적으로 쉽게 확장 할 수 있습니다.
다가오는 서비스는 Slurm의 클러스터 디렉터입니다. Linux의 오픈 소스 작업 스케줄러 및 워크로드 관리자 인 Slurm은 Google의 단순화 된 UI 및 API 덕분에 프로비저닝 및 운영하기가 더 쉽습니다. 여기에는 사전 구성된 소프트웨어가있는 일반적인 워크로드에 대한 청사진이 포함되어 신뢰할 수 있고 반복 가능한 배포가 포함됩니다.
최적화 된 AI 모델 배포 : GKE의 새로운 기능은 AI 모델 배포 최적화에 중점을 둡니다. GKE 추론 QuickStart 및 GKE 추론 게이트웨이는 AI 모델의 선택 및 배포를 단순화하여 지능형로드 밸런싱으로 잘 수행 할 수 있도록합니다.
Gabe Monroy는 특히 전통적인 컴퓨팅, 특히 추론 영역에서 AI 혁신의 추세를 강조했습니다. 그는 "우리는 AI 시대에 분명한 경향을보고 있습니다. 전통적인 컴퓨팅이 신경망과 상호 작용하는 곳 (그렇지 않으면 '추론'이라고 알려진 놀라운 혁신이 일어나고 있습니다. LiveX 및 Moloco와 같은 Kubernetes 및 AI의 최첨단에서 운영되는 회사는 GKE에서 AI 추론을 실행합니다. "
비용 효율적인 추론 : GKE는 추론 게이트웨이에 대한 비용 효율적인 추론을 발전시키고 있습니다. Monroy는이 접근법이 서빙 비용을 최대 30%줄이고, 대기 시간을 최대 60%줄이고, 다른 관리 및 오픈 소스 Kubernetes 제품에 비해 40%를 40%증가시킬 수 있다고 주장합니다. 이것들은 유망한 인물이지만, 우리는 그들의 영향을 확인하기 위해 행동하는 것을 볼 필요가 있습니다.
모델 인식로드 밸런싱은이 전략의 핵심 구성 요소입니다. AI 모델의 가변 응답 길이를 고려할 때 라운드 로빈과 같은 전통적인 하중 밸런싱 방법은 비효율적 일 수 있습니다. 그러나 추론 게이트웨이는 AI에 최적화 된 모델 인식 게이트웨이를 제공하며 다른 모델 버전으로 고급 라우팅을 제공합니다.
향상된 자원 효율성 : GKE는 또한 자원 효율성 향상에 중점을두고 있습니다. GKE 자동 조종 장치는 이제 더 빠른 포드 스케줄링, 더 빠른 스케일링 반응 시간 및 더 나은 용량 오른쪽 크기를 제공합니다. 즉, 사용자는 동일한 리소스로 더 많은 트래픽을 처리하거나 자원이 적은 기존 트래픽을 유지할 수 있습니다. Google은 자동 조종 장치가 개선되면 클러스터 용량이 항상 오른쪽 크기라고 주장합니다.
현재 자동 조종 장치에는 최고 실습 클러스터 구성 도구와 작업량과 일치하는 용량을 자동으로 조정하는 컨테이너 최적화 된 컴퓨팅 플랫폼이 포함되어 있습니다. 그러나 특정 구성이 없으면 기존 클러스터를 올바른 크기가 아닙니다. 3 분기부터 AutoPilot의 컨테이너 최적화 컴퓨팅 플랫폼은 게임 체인저가 될 수있는 특정 구성이 필요하지 않고 표준 GKE 클러스터에도 사용할 수 있습니다.
AI 지원 Gemini Cloud Assist : 디버깅 및 응용 프로그램 문제 진단은 혁신을 크게 느리게 할 수 있습니다. 이를 해결하기 위해 Google은 Gemini Cloud Assist를 도입하여 응용 프로그램 라이프 사이클 전체에서 AI 기반 지원을 제공했습니다. Gemini Cloud 지원 조사의 개인 미리보기는 사용자가 근본 원인을 빠르게 이해하고 문제를 해결하는 데 도움이됩니다.
가장 중요한 부분? GKE 콘솔에서 직접 조사 할 수있게되어 문제 해결 시간을 줄이고 혁신 시간을 더 많이 확보 할 수 있습니다. 노드, iAM 및로드 밸런서를 포함한 다양한 Google 클라우드 서비스에서 GKE 콘솔에서 POD 및 클러스터 문제를 진단 할 수 있습니다. 여러 GKE 서비스, 컨트롤러, 포드 및 기본 노드에서 로그 및 오류를 볼 수 있습니다. 이 기능을 직접 경험하려면 개인 미리보기에 가입하십시오.
광범위한 신흥 기술 전략의 일환으로 Google은 AI-OP 최적화 플랫폼의 리더로 자리 매김하고 있습니다. 이러한 개발을 통해 산업 전반의 비즈니스는 AI를보다 효과적으로 사용할 수있어 운영 및 고객 경험의 혁신과 효율성을 높일 수 있습니다.
예를 들어, Intuit은 Google Cloud의 문서 AI 및 Gemini를 활용하여 수백만 명의 Turbotax 사용자를위한 세금 준비를 단순화합니다. Reddit은 Google의 AI 에이전트 빌더 인 Vertex AI를 통해 Gemini를 사용하여 홈페이지 경험을 향상 시키도록 설계된 새로운 AI 구동 대화 플랫폼 인 Reddit Answers를 향상시킵니다.
Google이 이러한 AI 지원 변환을 성공적으로 실행할 수 있습니까? 시간만이 말할 것입니다. Pichai가 12 월에 언급했듯이, "역사상, 당신은 항상 우선 일 필요는 없지만, 당신은 잘 실행하고 실제로 제품으로 최고가되어야합니다. 나는 그것이 2025 년의 모든 것인 것이라고 생각합니다."
관련 기사
AI 전자 책 생성기 : 아마존 KDP 성공을위한 상위 5 개 도구
eBook을 만들고 판매함으로써 온라인 소득의 세계로 뛰어 들기를 간절히 원하십니까? AI 기술의 출현으로 프로세스는 효율적일뿐만 아니라 엄청나게 접근 가능해졌습니다. 이 기사는 수동 소득 OP를 활용하는 데 도움이되는 상위 5 개의 AI 전자 책 생성기를 탐구합니다.
Billy Idol의 'Rebel Yell': 라이브 공연에 대한 심도있는 모습
빌리 아이돌 (Billy Idol)의 '반란군'은 단지 노래 일뿐입니다. 1980 년대의 록 문화의 상징으로 여러 세대의 팬들과 계속 공명합니다. 이 작품은 맥동 에너지와 살아있는 'Rebel Yell'공연의 상징적 인 영상을 통해 여행을 떠나 CEM의 요소를 풀어줍니다.
비디오 편집에서 ai luts로 색상 보정을 변환합니다
비디오 편집에서 색상 보정에 대한 접근 방식을 혁신 할 준비가 되셨습니까? AI 구동 도구는 이제 전문적이고 영화적인 외모를 달성하기 위해 그 어느 때보 다 간단하게 만들고 있습니다. 고급 AI 모델의 출현으로 특정 미학에 맞는 맞춤형 LUT (룩업 테이블)를 만드는 것은 이제 ACCE입니다.
의견 (45)
0/200
BenRoberts
2025년 4월 12일 오후 12시 27분 35초 GMT
The new Kubernetes and GKE enhancements are pretty cool for AI projects! It's made deploying and managing AI workloads a breeze. Though, it can be a bit overwhelming for beginners, so maybe Google could offer more tutorials?
0
LucasWalker
2025년 4월 12일 오후 12시 27분 35초 GMT
新しいKubernetesとGKEの強化は、AIプロジェクトに最適ですね!AIワークロードのデプロイと管理が簡単になりました。ただ、初心者には少し圧倒的かもしれないので、Googleがもっとチュートリアルを提供してくれると良いですね。
0
DonaldSanchez
2025년 4월 12일 오후 12시 27분 35초 GMT
새로운 Kubernetes와 GKE 개선은 AI 프로젝트에 정말 좋네요! AI 워크로드를 배포하고 관리하는 것이 훨씬 쉬워졌어요. 다만, 초보자에게는 조금 압도적일 수 있으니, 구글이 더 많은 튜토리얼을 제공하면 좋겠어요.
0
KennethKing
2025년 4월 12일 오후 12시 27분 35초 GMT
As novas melhorias do Kubernetes e GKE são ótimas para projetos de IA! Tornou o deploy e a gestão de cargas de trabalho de IA muito mais fáceis. No entanto, pode ser um pouco esmagador para iniciantes, então talvez o Google pudesse oferecer mais tutoriais?
0
AnthonyPerez
2025년 4월 12일 오후 12시 27분 35초 GMT
Las nuevas mejoras de Kubernetes y GKE son geniales para proyectos de IA. Ha facilitado mucho el despliegue y la gestión de cargas de trabajo de IA. Aunque puede ser un poco abrumador para principiantes, ¿quizás Google podría ofrecer más tutoriales?
0
KevinScott
2025년 4월 12일 오전 7시 56분 26초 GMT
Google's focus on AI with Kubernetes and GKE is impressive, but I'm still figuring out how to use it effectively. It's like they're speaking a different language sometimes. Can anyone give me a simple guide or something? I want to harness this power, but it's a bit overwhelming right now!
0






Google이 AI 로의 추진은 비밀이 아니며 정당한 이유가 있습니다. Sundar Pichai CEO가 작년 휴일 이전의 내부 회의에서 강조하면서 "2025 년에 우리는 [AI] 기술의 이점을 잠금 해제하고 실제 사용자 문제를 해결하는 데 끊임없이 집중해야합니다." 이 비전은 특히 클라우드 서비스 및 AI 통합에서 제품을 크게 향상시키기 위해 Google을 주도하고 있습니다.
Las Vegas의 Google Cloud 202 이벤트에서 Google은 Kubernetes 및 Google Kubernetes Engine (GKE)에서 상당한 발전을 공개했습니다. 이 업데이트는 플랫폼 팀과 개발자가 기존 Kubernetes 전문 지식을 활용하면서 AI를 활용할 수 있도록 권한을 부여하는 것을 목표로합니다. Google의 Cloud Runtimes 부사장 인 Gabe Monroy는 간결하게 다음과 같이 말합니다. "Kubernetes 기술과 투자는 관련이있는 것이 아니라 AI 초강대국입니다."
그렇다면이 새로운 발전은 정확히 무엇입니까? 세부 사항을 다이빙합시다.
단순화 된 AI 클러스터 관리 : GKE는 이전에 HyperCompute 클러스터로 알려진 GKE 용 클러스터 디렉터와 같은 도구를 통해 단순화 된 AI 클러스터 관리를 도입하고 있습니다. 이 도구를 사용하면 NVIDIA GPU가 연결된 대형 가상 머신 (VMS) 클러스터를 배포하고 관리 할 수 있으므로 AI 워크로드를 효율적으로 쉽게 확장 할 수 있습니다.
다가오는 서비스는 Slurm의 클러스터 디렉터입니다. Linux의 오픈 소스 작업 스케줄러 및 워크로드 관리자 인 Slurm은 Google의 단순화 된 UI 및 API 덕분에 프로비저닝 및 운영하기가 더 쉽습니다. 여기에는 사전 구성된 소프트웨어가있는 일반적인 워크로드에 대한 청사진이 포함되어 신뢰할 수 있고 반복 가능한 배포가 포함됩니다.
최적화 된 AI 모델 배포 : GKE의 새로운 기능은 AI 모델 배포 최적화에 중점을 둡니다. GKE 추론 QuickStart 및 GKE 추론 게이트웨이는 AI 모델의 선택 및 배포를 단순화하여 지능형로드 밸런싱으로 잘 수행 할 수 있도록합니다.
Gabe Monroy는 특히 전통적인 컴퓨팅, 특히 추론 영역에서 AI 혁신의 추세를 강조했습니다. 그는 "우리는 AI 시대에 분명한 경향을보고 있습니다. 전통적인 컴퓨팅이 신경망과 상호 작용하는 곳 (그렇지 않으면 '추론'이라고 알려진 놀라운 혁신이 일어나고 있습니다. LiveX 및 Moloco와 같은 Kubernetes 및 AI의 최첨단에서 운영되는 회사는 GKE에서 AI 추론을 실행합니다. "
비용 효율적인 추론 : GKE는 추론 게이트웨이에 대한 비용 효율적인 추론을 발전시키고 있습니다. Monroy는이 접근법이 서빙 비용을 최대 30%줄이고, 대기 시간을 최대 60%줄이고, 다른 관리 및 오픈 소스 Kubernetes 제품에 비해 40%를 40%증가시킬 수 있다고 주장합니다. 이것들은 유망한 인물이지만, 우리는 그들의 영향을 확인하기 위해 행동하는 것을 볼 필요가 있습니다.
모델 인식로드 밸런싱은이 전략의 핵심 구성 요소입니다. AI 모델의 가변 응답 길이를 고려할 때 라운드 로빈과 같은 전통적인 하중 밸런싱 방법은 비효율적 일 수 있습니다. 그러나 추론 게이트웨이는 AI에 최적화 된 모델 인식 게이트웨이를 제공하며 다른 모델 버전으로 고급 라우팅을 제공합니다.
향상된 자원 효율성 : GKE는 또한 자원 효율성 향상에 중점을두고 있습니다. GKE 자동 조종 장치는 이제 더 빠른 포드 스케줄링, 더 빠른 스케일링 반응 시간 및 더 나은 용량 오른쪽 크기를 제공합니다. 즉, 사용자는 동일한 리소스로 더 많은 트래픽을 처리하거나 자원이 적은 기존 트래픽을 유지할 수 있습니다. Google은 자동 조종 장치가 개선되면 클러스터 용량이 항상 오른쪽 크기라고 주장합니다.
현재 자동 조종 장치에는 최고 실습 클러스터 구성 도구와 작업량과 일치하는 용량을 자동으로 조정하는 컨테이너 최적화 된 컴퓨팅 플랫폼이 포함되어 있습니다. 그러나 특정 구성이 없으면 기존 클러스터를 올바른 크기가 아닙니다. 3 분기부터 AutoPilot의 컨테이너 최적화 컴퓨팅 플랫폼은 게임 체인저가 될 수있는 특정 구성이 필요하지 않고 표준 GKE 클러스터에도 사용할 수 있습니다.
AI 지원 Gemini Cloud Assist : 디버깅 및 응용 프로그램 문제 진단은 혁신을 크게 느리게 할 수 있습니다. 이를 해결하기 위해 Google은 Gemini Cloud Assist를 도입하여 응용 프로그램 라이프 사이클 전체에서 AI 기반 지원을 제공했습니다. Gemini Cloud 지원 조사의 개인 미리보기는 사용자가 근본 원인을 빠르게 이해하고 문제를 해결하는 데 도움이됩니다.
가장 중요한 부분? GKE 콘솔에서 직접 조사 할 수있게되어 문제 해결 시간을 줄이고 혁신 시간을 더 많이 확보 할 수 있습니다. 노드, iAM 및로드 밸런서를 포함한 다양한 Google 클라우드 서비스에서 GKE 콘솔에서 POD 및 클러스터 문제를 진단 할 수 있습니다. 여러 GKE 서비스, 컨트롤러, 포드 및 기본 노드에서 로그 및 오류를 볼 수 있습니다. 이 기능을 직접 경험하려면 개인 미리보기에 가입하십시오.
광범위한 신흥 기술 전략의 일환으로 Google은 AI-OP 최적화 플랫폼의 리더로 자리 매김하고 있습니다. 이러한 개발을 통해 산업 전반의 비즈니스는 AI를보다 효과적으로 사용할 수있어 운영 및 고객 경험의 혁신과 효율성을 높일 수 있습니다.
예를 들어, Intuit은 Google Cloud의 문서 AI 및 Gemini를 활용하여 수백만 명의 Turbotax 사용자를위한 세금 준비를 단순화합니다. Reddit은 Google의 AI 에이전트 빌더 인 Vertex AI를 통해 Gemini를 사용하여 홈페이지 경험을 향상 시키도록 설계된 새로운 AI 구동 대화 플랫폼 인 Reddit Answers를 향상시킵니다.
Google이 이러한 AI 지원 변환을 성공적으로 실행할 수 있습니까? 시간만이 말할 것입니다. Pichai가 12 월에 언급했듯이, "역사상, 당신은 항상 우선 일 필요는 없지만, 당신은 잘 실행하고 실제로 제품으로 최고가되어야합니다. 나는 그것이 2025 년의 모든 것인 것이라고 생각합니다."




The new Kubernetes and GKE enhancements are pretty cool for AI projects! It's made deploying and managing AI workloads a breeze. Though, it can be a bit overwhelming for beginners, so maybe Google could offer more tutorials?




新しいKubernetesとGKEの強化は、AIプロジェクトに最適ですね!AIワークロードのデプロイと管理が簡単になりました。ただ、初心者には少し圧倒的かもしれないので、Googleがもっとチュートリアルを提供してくれると良いですね。




새로운 Kubernetes와 GKE 개선은 AI 프로젝트에 정말 좋네요! AI 워크로드를 배포하고 관리하는 것이 훨씬 쉬워졌어요. 다만, 초보자에게는 조금 압도적일 수 있으니, 구글이 더 많은 튜토리얼을 제공하면 좋겠어요.




As novas melhorias do Kubernetes e GKE são ótimas para projetos de IA! Tornou o deploy e a gestão de cargas de trabalho de IA muito mais fáceis. No entanto, pode ser um pouco esmagador para iniciantes, então talvez o Google pudesse oferecer mais tutoriais?




Las nuevas mejoras de Kubernetes y GKE son geniales para proyectos de IA. Ha facilitado mucho el despliegue y la gestión de cargas de trabajo de IA. Aunque puede ser un poco abrumador para principiantes, ¿quizás Google podría ofrecer más tutoriales?




Google's focus on AI with Kubernetes and GKE is impressive, but I'm still figuring out how to use it effectively. It's like they're speaking a different language sometimes. Can anyone give me a simple guide or something? I want to harness this power, but it's a bit overwhelming right now!












