Google揭示了AI創新的新的Kubernetes和GKE增強功能
2025年04月11日
JosephScott
58

Google推進AI並不是秘密,並且有充分的理由。正如首席執行官Sundar Pichai在去年假期之前的一次內部會議上強調的那樣,“ 2025年,我們需要不懈地專注於解鎖[AI]技術的好處並解決真正的用戶問題。”這種願景正在推動Google大大提高其產品,尤其是在雲服務和AI集成中。
在Google Cloud Next 2025在拉斯維加斯舉行的活動中,Google推出了Kubernetes和Google Kubernetes Engine(GKE)的實質性進步。這些更新旨在使平台團隊和開發人員能夠利用AI,同時利用其現有的Kubernetes專業知識。 Google的Cloud Runtimes副總裁Gabe Monroy簡潔地說:“您的Kubernetes技能和投資不僅相關;它們是您的AI超級大國。”
那麼,這些新進步到底是什麼?讓我們研究細節。
簡化的AI群集管理: GKE通過諸如GKE群集導演(以前稱為HyperCompute cluster)等工具引入了簡化的AI群集管理。該工具允許用戶使用附加的NVIDIA GPU部署和管理大型虛擬機(VM)群集,從而更易於有效地擴展AI工作負載。
Slurm的集群總監。 Linux的開源作業調度程序和工作負載管理器Slurm將更容易提供和操作,這要歸功於Google的簡化UI和API。這些將包括用於使用預配置軟件的典型工作負載的藍圖,以確保可靠且可重複的部署。
優化的AI模型部署: GKE的新功能還專注於優化AI模型部署。 GKE推斷QuickStart和GKE推理網關簡化了AI模型的選擇和部署,確保它們在智能負載平衡方面的表現良好。
Gabe Monroy強調了AI創新與傳統計算相交的趨勢,尤其是在推理領域。他指出:“我們看到了AI時代的明顯趨勢:傳統計算與神經網絡相互作用的驚人創新正在發生 - 否則稱為“推理”。在Kubernetes和AI的最前沿運營的公司(如Livex和Moloco)對GKE進行了AI推斷。”
具有成本效益的推斷: GKE與推理網關的成本效益推斷正在取得進步。 Monroy聲稱,與其他託管和開源Kubernetes產品相比,這種方法可以將服務成本降低30%,將延遲降低60%,並將吞吐量降低40%。儘管這些都是有希望的數字,但我們需要看到它們正在行動以確認其影響。
模型感知負載平衡是此策略的關鍵組成部分。鑑於AI模型中的可變響應長度,傳統的負載平衡方法(如圓形旋轉)可能效率低下。但是,推理網關提供了針對AI優化的模型感知網關,並具有高級路由到不同的模型版本。
提高資源效率: GKE還專注於提高資源效率。 GKE自動駕駛儀現在提供更快的POD調度,更快的縮放反應時間和更高的容量右尺寸。這意味著用戶可以使用相同的資源處理更多流量或使用較少的資源維護現有流量。 Google聲稱,隨著自動駕駛儀的改進,集群容量將始終是正確的。
當前,AutoPilot包括一個最佳實踐群集配置工具和一個容器優化的計算平台,可自動調整匹配工作負載的能力。但是,如果沒有特定的配置,它不正確尺寸的現有群集。從第三季度開始,Autopilot的容器優化的計算平台也將用於標準GKE群集,而無需特定的配置,這可能是改變遊戲規則。
支持AI的雙子座雲輔助:調試和診斷應用程序問題可能會大大減慢創新。為了解決這個問題,Google引入了Gemini Cloud Assist,在整個應用程序生命週期內提供了AI驅動的輔助。雙子座雲輔助調查的私人預覽可幫助用戶快速理解根本原因並解決問題。
最好的部分?輔助調查將可以直接從GKE控制台訪問,從而減少故障排除時間並騰出更多時間進行創新。它將允許您從各種Google雲服務(包括節點,IAM和負載平衡器)中診斷出GKE控制台中的POD和集群問題。您可以在多個GKE服務,控制器,POD和基礎節點上查看日誌和錯誤。註冊私人預覽以親身體驗此功能。
作為其更廣泛的新興技術戰略的一部分,Google將自己定位為AI優化平台的領導者。這些發展使各行業的企業能夠更有效地使用AI,從而推動運營和客戶體驗的創新和效率。
例如,Intuit利用Google Cloud的文檔AI和Gemini簡化了數百萬TurboTax用戶的稅收準備。 Reddit使用Google的AI代理構建器Via Gemini通過Via via Via via via via deage ai構建器,以增強Reddit Answers,這是一個新的AI驅動的對話平台,旨在改善主頁體驗。
Google可以成功執行這些支持AI的轉換嗎?只有時間會證明。正如皮希(Pichai)在12月所說的那樣:“歷史上,您並不總是需要第一名,但是您必須很好地執行,並且確實是班上最好的產品。我認為這就是2025年的全部目的。”
相關文章
解碼Oshi no Ko的“偶像”:深入潛水分析
*oshi no ko *的開頭主題名為“偶像”,超越了醒目的J-pop曲調。這是一個敘事的傑作,深入探討了明星,身份的複雜性以及偶像的公共形象和私人現實之間經常張開的線條。這首歌不僅為
Wattpad幻想小說反應:Timi Saint的熱鬧
如果您想在狂野的旅程中充滿笑聲和那些值得畏縮的時刻,那麼您必須查看Timi Saint的最新YouTube Escapade。這位後起之秀以她未經過濾的反應和將相關幽默帶到屏幕上的訣竅而聞名。在她的最新視頻中,Timi di
我們如何使用AI來幫助城市應對極端熱量
看起來2024年可能會打破迄今為止最熱的一年的記錄,超過了2023年。這種趨勢對生活在城市熱島的人們來說尤為艱難,這些景點是在混凝土和瀝青浸泡太陽射線,然後散發出熱量的城市中的那些景點。這些區域可以溫暖
評論 (45)
0/200
BenRoberts
2025年04月12日 12:27:35
The new Kubernetes and GKE enhancements are pretty cool for AI projects! It's made deploying and managing AI workloads a breeze. Though, it can be a bit overwhelming for beginners, so maybe Google could offer more tutorials?
0
LucasWalker
2025年04月12日 12:27:35
新しいKubernetesとGKEの強化は、AIプロジェクトに最適ですね!AIワークロードのデプロイと管理が簡単になりました。ただ、初心者には少し圧倒的かもしれないので、Googleがもっとチュートリアルを提供してくれると良いですね。
0
DonaldSanchez
2025年04月12日 12:27:35
새로운 Kubernetes와 GKE 개선은 AI 프로젝트에 정말 좋네요! AI 워크로드를 배포하고 관리하는 것이 훨씬 쉬워졌어요. 다만, 초보자에게는 조금 압도적일 수 있으니, 구글이 더 많은 튜토리얼을 제공하면 좋겠어요.
0
KennethKing
2025年04月12日 12:27:35
As novas melhorias do Kubernetes e GKE são ótimas para projetos de IA! Tornou o deploy e a gestão de cargas de trabalho de IA muito mais fáceis. No entanto, pode ser um pouco esmagador para iniciantes, então talvez o Google pudesse oferecer mais tutoriais?
0
AnthonyPerez
2025年04月12日 12:27:35
Las nuevas mejoras de Kubernetes y GKE son geniales para proyectos de IA. Ha facilitado mucho el despliegue y la gestión de cargas de trabajo de IA. Aunque puede ser un poco abrumador para principiantes, ¿quizás Google podría ofrecer más tutoriales?
0
KevinScott
2025年04月12日 07:56:26
Google's focus on AI with Kubernetes and GKE is impressive, but I'm still figuring out how to use it effectively. It's like they're speaking a different language sometimes. Can anyone give me a simple guide or something? I want to harness this power, but it's a bit overwhelming right now!
0






Google推進AI並不是秘密,並且有充分的理由。正如首席執行官Sundar Pichai在去年假期之前的一次內部會議上強調的那樣,“ 2025年,我們需要不懈地專注於解鎖[AI]技術的好處並解決真正的用戶問題。”這種願景正在推動Google大大提高其產品,尤其是在雲服務和AI集成中。
在Google Cloud Next 2025在拉斯維加斯舉行的活動中,Google推出了Kubernetes和Google Kubernetes Engine(GKE)的實質性進步。這些更新旨在使平台團隊和開發人員能夠利用AI,同時利用其現有的Kubernetes專業知識。 Google的Cloud Runtimes副總裁Gabe Monroy簡潔地說:“您的Kubernetes技能和投資不僅相關;它們是您的AI超級大國。”
那麼,這些新進步到底是什麼?讓我們研究細節。
簡化的AI群集管理: GKE通過諸如GKE群集導演(以前稱為HyperCompute cluster)等工具引入了簡化的AI群集管理。該工具允許用戶使用附加的NVIDIA GPU部署和管理大型虛擬機(VM)群集,從而更易於有效地擴展AI工作負載。
Slurm的集群總監。 Linux的開源作業調度程序和工作負載管理器Slurm將更容易提供和操作,這要歸功於Google的簡化UI和API。這些將包括用於使用預配置軟件的典型工作負載的藍圖,以確保可靠且可重複的部署。
優化的AI模型部署: GKE的新功能還專注於優化AI模型部署。 GKE推斷QuickStart和GKE推理網關簡化了AI模型的選擇和部署,確保它們在智能負載平衡方面的表現良好。
Gabe Monroy強調了AI創新與傳統計算相交的趨勢,尤其是在推理領域。他指出:“我們看到了AI時代的明顯趨勢:傳統計算與神經網絡相互作用的驚人創新正在發生 - 否則稱為“推理”。在Kubernetes和AI的最前沿運營的公司(如Livex和Moloco)對GKE進行了AI推斷。”
具有成本效益的推斷: GKE與推理網關的成本效益推斷正在取得進步。 Monroy聲稱,與其他託管和開源Kubernetes產品相比,這種方法可以將服務成本降低30%,將延遲降低60%,並將吞吐量降低40%。儘管這些都是有希望的數字,但我們需要看到它們正在行動以確認其影響。
模型感知負載平衡是此策略的關鍵組成部分。鑑於AI模型中的可變響應長度,傳統的負載平衡方法(如圓形旋轉)可能效率低下。但是,推理網關提供了針對AI優化的模型感知網關,並具有高級路由到不同的模型版本。
提高資源效率: GKE還專注於提高資源效率。 GKE自動駕駛儀現在提供更快的POD調度,更快的縮放反應時間和更高的容量右尺寸。這意味著用戶可以使用相同的資源處理更多流量或使用較少的資源維護現有流量。 Google聲稱,隨著自動駕駛儀的改進,集群容量將始終是正確的。
當前,AutoPilot包括一個最佳實踐群集配置工具和一個容器優化的計算平台,可自動調整匹配工作負載的能力。但是,如果沒有特定的配置,它不正確尺寸的現有群集。從第三季度開始,Autopilot的容器優化的計算平台也將用於標準GKE群集,而無需特定的配置,這可能是改變遊戲規則。
支持AI的雙子座雲輔助:調試和診斷應用程序問題可能會大大減慢創新。為了解決這個問題,Google引入了Gemini Cloud Assist,在整個應用程序生命週期內提供了AI驅動的輔助。雙子座雲輔助調查的私人預覽可幫助用戶快速理解根本原因並解決問題。
最好的部分?輔助調查將可以直接從GKE控制台訪問,從而減少故障排除時間並騰出更多時間進行創新。它將允許您從各種Google雲服務(包括節點,IAM和負載平衡器)中診斷出GKE控制台中的POD和集群問題。您可以在多個GKE服務,控制器,POD和基礎節點上查看日誌和錯誤。註冊私人預覽以親身體驗此功能。
作為其更廣泛的新興技術戰略的一部分,Google將自己定位為AI優化平台的領導者。這些發展使各行業的企業能夠更有效地使用AI,從而推動運營和客戶體驗的創新和效率。
例如,Intuit利用Google Cloud的文檔AI和Gemini簡化了數百萬TurboTax用戶的稅收準備。 Reddit使用Google的AI代理構建器Via Gemini通過Via via Via via via via deage ai構建器,以增強Reddit Answers,這是一個新的AI驅動的對話平台,旨在改善主頁體驗。
Google可以成功執行這些支持AI的轉換嗎?只有時間會證明。正如皮希(Pichai)在12月所說的那樣:“歷史上,您並不總是需要第一名,但是您必須很好地執行,並且確實是班上最好的產品。我認為這就是2025年的全部目的。”




The new Kubernetes and GKE enhancements are pretty cool for AI projects! It's made deploying and managing AI workloads a breeze. Though, it can be a bit overwhelming for beginners, so maybe Google could offer more tutorials?




新しいKubernetesとGKEの強化は、AIプロジェクトに最適ですね!AIワークロードのデプロイと管理が簡単になりました。ただ、初心者には少し圧倒的かもしれないので、Googleがもっとチュートリアルを提供してくれると良いですね。




새로운 Kubernetes와 GKE 개선은 AI 프로젝트에 정말 좋네요! AI 워크로드를 배포하고 관리하는 것이 훨씬 쉬워졌어요. 다만, 초보자에게는 조금 압도적일 수 있으니, 구글이 더 많은 튜토리얼을 제공하면 좋겠어요.




As novas melhorias do Kubernetes e GKE são ótimas para projetos de IA! Tornou o deploy e a gestão de cargas de trabalho de IA muito mais fáceis. No entanto, pode ser um pouco esmagador para iniciantes, então talvez o Google pudesse oferecer mais tutoriais?




Las nuevas mejoras de Kubernetes y GKE son geniales para proyectos de IA. Ha facilitado mucho el despliegue y la gestión de cargas de trabajo de IA. Aunque puede ser un poco abrumador para principiantes, ¿quizás Google podría ofrecer más tutoriales?




Google's focus on AI with Kubernetes and GKE is impressive, but I'm still figuring out how to use it effectively. It's like they're speaking a different language sometimes. Can anyone give me a simple guide or something? I want to harness this power, but it's a bit overwhelming right now!












