Google Cloud 人工智慧主管闡述提升模型能力的主要發展方向

身為 Google Cloud 的產品副總裁,Michael Gerstenhaber 的主要工作重心在於 Vertex——該公司全面的企業級 AI 部署平台。這個職位讓他能夠從宏觀角度觀察企業如何實際部署 AI 模型,以及在釋放自主 AI 潛力方面仍面臨的關鍵障礙。
我與麥可的對話中,他提出了一項特別獨到的見解。他將 AI 模型的進展視為同時向三個不同領域的推進:原始智能、響應延遲,以及關鍵的第三個因素——成本效益。這個第三個領域與純粹的能力關係不大,更多在於可負擔性,決定了模型是否能以足夠低廉的成本部署,並在龐大且難以預測的規模下運作。對於任何希望引導尖端模型開發走向新方向的人來說,這是一個極具價值的框架。
為求清晰,本次訪談內容已進行刪節與編輯。
首先,能否請您簡述您的 AI 背景以及目前在 Google 的職務?
我從事人工智慧工作約有兩年。在 Anthropic 工作一年半後,我約六個月前加入 Google。我負責領導 Vertex 開發者平台。我們的主要使用者是開發自訂應用的工程師。他們需要存取代理工作流程、穩健的代理平台,以及全球最先進模型的推論能力。 我的團隊負責提供這個基礎平台,而終端用戶應用程式則由我們的客戶——例如 Shopify 和湯森路透——在各自的特定產業中自行開發。
是什麼促使您轉投 Google 呢?
Google 的獨特優勢在於其垂直整合能力,涵蓋範圍從使用者介面一直延伸至基礎架構層。我們自行設計資料中心、管理電力採購、開發客製化晶片(TPUs)、訓練自有基礎模型,並掌控推論與代理式協調層。 我們提供記憶體與程式碼生成等功能的 API。除此之外,我們還建置了用於合規與治理的代理引擎,以及像 Gemini 這樣的消費者與企業介面。這種端到端的掌控力是我們的一大優勢,也是我加入的關鍵原因。
TechCrunch 活動TechCrunch 創辦人峰會最高可省 $300 或 30%
加入2026 年 TechCrunch 創辦人峰會,與 1,000 多名創辦人及投資者共度專注於成長、執行與擴張的全天盛會。從塑造產業的創辦人與投資者身上獲取洞見。與處於相似成長階段的同儕建立人脈。帶著可立即執行的策略滿載而歸。
優惠截止日期為 3 月 13 日。
TechCrunch 創辦人峰會最高可省 $300 或 30%
加入2026 年 TechCrunch 創辦人峰會,與 1,000 多名創辦人及投資者共度專注於成長、執行與擴張的全天盛會。從引領產業的創辦人與投資者身上汲取洞見。與處於相似成長階段的同儕建立人脈。帶著可立即付諸實行的策略滿載而歸。
優惠截止日期為 3 月 13 日。
麻薩諸塞州波士頓 | 2026年6月9日 立即註冊這很有趣——儘管各有所異,三大 AI 實驗室在核心能力上似乎旗鼓相當。這純粹是一場智慧競賽,還是局勢更為複雜?
我觀察到三種截然不同的效能界限。首先,像 Gemini Pro 這樣的模型專注於原始智能的優化。複雜程式碼生成便是絕佳例證;您會追求最高品質的輸出,即使耗時較長也無妨,因為您之後還需維護並部署該程式碼。
第二道界限是延遲。在即時客戶服務情境中,AI 既需要具備執行政策的能力(例如處理退貨或座位升級),也需具備在用戶失去耐心前迅速給出答案的速度。在此情境下,你需要的是能在嚴格的時間限制內運作的最聰明模型。
第三個限制是規模擴展下的成本。像 Reddit 或 Meta 這樣的企業,旨在管理海量內容,面臨著難以預測的需求。若不清楚成本將如何隨規模擴展,它們便無法承擔無限的企業風險。它們需要的是在預算範圍內最智能的模型,同時也必須具備足夠的成本效益,以處理潛在無限量的任務。
一個持續存在的疑問是:為何具代理能力的 AI 系統尚未獲得更廣泛的採用?儘管模型能力與令人印象深刻的示範已然存在,但許多人一年前預期的變革性轉變卻尚未完全實現。主要瓶頸究竟何在?
這項底層技術僅有約兩年的歷史,關鍵基礎設施仍未完備。我們缺乏審計代理行為或授權代理存取資料的既定模式。要落實這些可投入生產的模式,需要投入大量工作。實際部署的採用速度總是落後於技術能力。短短兩年時間,根本不足以讓智慧能力的全貌體現在成熟的部署系統中,而這正是當前的挑戰所在。
在軟體工程領域,其採用速度之所以格外迅速,是因為它能與現有的開發週期完美整合。工程師擁有安全的開發與測試環境。在 Google,程式碼必須經過兩位工程師的審查與批准,才能以公司名義交付給客戶。這些「人為介入」的流程使實作風險極低。我們需要為其他領域和專業發展出同等安全、可靠的模式。
相關文章
Hightouch 憑藉 AI 驅動的行銷工具,年經常性收入(ARR)突破 1 億美元
過去,行銷人員必須仰賴設計師和其他創意專家,才能為個人化的線上廣告活動製作圖片和影片。2024 年底,成立七年的新創公司 Hightouch 推出了一項由人工智慧驅動的服務,讓行銷專業人士能夠為達美樂、Chime、PetSmart 和 Spotify 等品牌生成客製化內容——無需品牌設計團隊或廣告代理商的介入。這項服務已證實極為成功。自 20 個月前推出其 AI 產品以來,Hightouch 表示
Meta 的天然氣需求激增可能為南達科他州的電力網注入動能
資料中心的規模已膨脹至如此之大,其用電量如今已與美國整個州的用電量相當。以 Meta 的 Hyperion AI 資料中心為例:一旦完工,其用電量將與南達科他州相當。Meta最近宣布,除了已規劃的三座天然氣發電廠外,將再投資興建七座,以支援其耗資270億美元的資料中心。這十座位於路易斯安那州的發電廠合計將產生約7.5吉瓦的電力——略高於南達科他州全州的總發電量。與許多科技公司一樣,Meta 長期以
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
相關專題推薦
評論 (1)
0/500
Honestly, I'm a bit skeptical about all these "key frontiers" they keep talking about. Every big tech company has their own list, but real enterprise adoption still stumbles on basic stuff like data quality and cost. Vertex might be Google's shiny platform, but without solving those practical headaches, it's just another expensive toy. 🤷♂️

身為 Google Cloud 的產品副總裁,Michael Gerstenhaber 的主要工作重心在於 Vertex——該公司全面的企業級 AI 部署平台。這個職位讓他能夠從宏觀角度觀察企業如何實際部署 AI 模型,以及在釋放自主 AI 潛力方面仍面臨的關鍵障礙。
我與麥可的對話中,他提出了一項特別獨到的見解。他將 AI 模型的進展視為同時向三個不同領域的推進:原始智能、響應延遲,以及關鍵的第三個因素——成本效益。這個第三個領域與純粹的能力關係不大,更多在於可負擔性,決定了模型是否能以足夠低廉的成本部署,並在龐大且難以預測的規模下運作。對於任何希望引導尖端模型開發走向新方向的人來說,這是一個極具價值的框架。
為求清晰,本次訪談內容已進行刪節與編輯。
首先,能否請您簡述您的 AI 背景以及目前在 Google 的職務?
我從事人工智慧工作約有兩年。在 Anthropic 工作一年半後,我約六個月前加入 Google。我負責領導 Vertex 開發者平台。我們的主要使用者是開發自訂應用的工程師。他們需要存取代理工作流程、穩健的代理平台,以及全球最先進模型的推論能力。 我的團隊負責提供這個基礎平台,而終端用戶應用程式則由我們的客戶——例如 Shopify 和湯森路透——在各自的特定產業中自行開發。
是什麼促使您轉投 Google 呢?
Google 的獨特優勢在於其垂直整合能力,涵蓋範圍從使用者介面一直延伸至基礎架構層。我們自行設計資料中心、管理電力採購、開發客製化晶片(TPUs)、訓練自有基礎模型,並掌控推論與代理式協調層。 我們提供記憶體與程式碼生成等功能的 API。除此之外,我們還建置了用於合規與治理的代理引擎,以及像 Gemini 這樣的消費者與企業介面。這種端到端的掌控力是我們的一大優勢,也是我加入的關鍵原因。
TechCrunch 活動TechCrunch 創辦人峰會最高可省 $300 或 30%
加入2026 年 TechCrunch 創辦人峰會,與 1,000 多名創辦人及投資者共度專注於成長、執行與擴張的全天盛會。從塑造產業的創辦人與投資者身上獲取洞見。與處於相似成長階段的同儕建立人脈。帶著可立即執行的策略滿載而歸。
優惠截止日期為 3 月 13 日。
TechCrunch 創辦人峰會最高可省 $300 或 30%
加入2026 年 TechCrunch 創辦人峰會,與 1,000 多名創辦人及投資者共度專注於成長、執行與擴張的全天盛會。從引領產業的創辦人與投資者身上汲取洞見。與處於相似成長階段的同儕建立人脈。帶著可立即付諸實行的策略滿載而歸。
優惠截止日期為 3 月 13 日。
麻薩諸塞州波士頓 | 2026年6月9日 立即註冊這很有趣——儘管各有所異,三大 AI 實驗室在核心能力上似乎旗鼓相當。這純粹是一場智慧競賽,還是局勢更為複雜?
我觀察到三種截然不同的效能界限。首先,像 Gemini Pro 這樣的模型專注於原始智能的優化。複雜程式碼生成便是絕佳例證;您會追求最高品質的輸出,即使耗時較長也無妨,因為您之後還需維護並部署該程式碼。
第二道界限是延遲。在即時客戶服務情境中,AI 既需要具備執行政策的能力(例如處理退貨或座位升級),也需具備在用戶失去耐心前迅速給出答案的速度。在此情境下,你需要的是能在嚴格的時間限制內運作的最聰明模型。
第三個限制是規模擴展下的成本。像 Reddit 或 Meta 這樣的企業,旨在管理海量內容,面臨著難以預測的需求。若不清楚成本將如何隨規模擴展,它們便無法承擔無限的企業風險。它們需要的是在預算範圍內最智能的模型,同時也必須具備足夠的成本效益,以處理潛在無限量的任務。
一個持續存在的疑問是:為何具代理能力的 AI 系統尚未獲得更廣泛的採用?儘管模型能力與令人印象深刻的示範已然存在,但許多人一年前預期的變革性轉變卻尚未完全實現。主要瓶頸究竟何在?
這項底層技術僅有約兩年的歷史,關鍵基礎設施仍未完備。我們缺乏審計代理行為或授權代理存取資料的既定模式。要落實這些可投入生產的模式,需要投入大量工作。實際部署的採用速度總是落後於技術能力。短短兩年時間,根本不足以讓智慧能力的全貌體現在成熟的部署系統中,而這正是當前的挑戰所在。
在軟體工程領域,其採用速度之所以格外迅速,是因為它能與現有的開發週期完美整合。工程師擁有安全的開發與測試環境。在 Google,程式碼必須經過兩位工程師的審查與批准,才能以公司名義交付給客戶。這些「人為介入」的流程使實作風險極低。我們需要為其他領域和專業發展出同等安全、可靠的模式。
Hightouch 憑藉 AI 驅動的行銷工具,年經常性收入(ARR)突破 1 億美元
過去,行銷人員必須仰賴設計師和其他創意專家,才能為個人化的線上廣告活動製作圖片和影片。2024 年底,成立七年的新創公司 Hightouch 推出了一項由人工智慧驅動的服務,讓行銷專業人士能夠為達美樂、Chime、PetSmart 和 Spotify 等品牌生成客製化內容——無需品牌設計團隊或廣告代理商的介入。這項服務已證實極為成功。自 20 個月前推出其 AI 產品以來,Hightouch 表示
Meta 的天然氣需求激增可能為南達科他州的電力網注入動能
資料中心的規模已膨脹至如此之大,其用電量如今已與美國整個州的用電量相當。以 Meta 的 Hyperion AI 資料中心為例:一旦完工,其用電量將與南達科他州相當。Meta最近宣布,除了已規劃的三座天然氣發電廠外,將再投資興建七座,以支援其耗資270億美元的資料中心。這十座位於路易斯安那州的發電廠合計將產生約7.5吉瓦的電力——略高於南達科他州全州的總發電量。與許多科技公司一樣,Meta 長期以
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
Honestly, I'm a bit skeptical about all these "key frontiers" they keep talking about. Every big tech company has their own list, but real enterprise adoption still stumbles on basic stuff like data quality and cost. Vertex might be Google's shiny platform, but without solving those practical headaches, it's just another expensive toy. 🤷♂️





首頁






