Google偷偷摸摸地超越了企业AI:从“赶上”到“赶上我们”
就在一年前,关于谷歌和企业AI的讨论似乎停滞不前。尽管谷歌开创了Transformer等技术,这家科技巨头似乎落后了,被OpenAI的病毒式成功、Anthropic的编码能力和微软在企业市场的激进推进所掩盖。
但快进到上周在拉斯维加斯举办的Google Cloud Next 2025,场景已截然不同。自信的谷歌,凭借顶尖的模型、强大的基础设施和明确的企业战略,宣布了戏剧性的转变。在与谷歌高管的闭门分析师会议中,一位分析师概括了现场气氛:“这感觉像是谷歌从‘追赶’变成了‘来追我们’的时刻。”
谷歌的飞跃
这种感觉——谷歌不仅赶上了OpenAI和微软,还在企业AI竞赛中一跃领先——在整个活动中显而易见。这不仅仅是营销炒作。在过去一年中,谷歌专注于执行,将其技术实力转化为高性能的集成平台,迅速赢得了企业决策者的青睐。从运行在高效定制芯片上的全球最强大AI模型,到为现实世界商业挑战量身定制的AI代理生态系统,谷歌正有力证明它从未真正迷失,而是在经历一段深层次的基础开发期。
随着其集成技术栈现已满负荷运行,谷歌似乎已准备好引领企业AI革命的下一阶段。在Next活动中与谷歌高管的访谈中,他们强调了谷歌在基础设施和模型整合方面的独特优势——这些优势是OpenAI、微软或AWS等竞争对手难以复制的。
疑虑的阴影:正视近期历史
要充分理解谷歌当前的势头,必须正视近期历史。谷歌发明了Transformer架构,引发了大型语言模型(LLM)的现代革命,并早在十年前就开始投资专用AI硬件(TPU),如今这些硬件推动了行业领先的效率。然而,令人费解的是,仅在两年半前,谷歌发现自己处于守势。
OpenAI的ChatGPT以惊人速度俘获了公众的想象力和企业兴趣,成为历史上增长最快的应用。Anthropic等竞争对手在编码等领域开辟了利基市场。与此同时,谷歌的公开举措往往显得犹豫或有瑕疵。2023年臭名昭著的Bard演示失误以及其图像生成器产生历史上不准确描绘的争议,助长了一种叙事:谷歌可能因内部官僚作风或对齐问题矫枉过正而受阻。谷歌似乎迷失了方向,呼应了其在云竞争中的最初缓慢步伐,市场份额远远落后于亚马逊和微软,位居第三。
转折点:有意识的领导决策
然而,在幕后,谷歌内部正在发生重大转变,这源于最高层有意识地决定重夺领导地位。谷歌DeepMind AI开发者平台产品副总裁Mat Velloso在2024年2月从微软加入谷歌时,感受到了这一关键时刻。“当我加入谷歌时,我与Sundar [Pichai]和其他几位领导交谈,感觉他们正在决定,好的,这个[生成式AI]是行业明显关心的东西。我们要让它实现,”Velloso在上周Next的采访中分享道。
这种新的推动力并未因外界担忧的“人才流失”而受阻。相反,谷歌在2024年初加倍努力执行,通过激进的招聘、内部整合和客户吸引力标志着这一阶段。尽管竞争对手进行了引人注目的招聘,谷歌保留了其核心AI领导团队,包括DeepMind首席执行官Demis Hassabis和谷歌云首席执行官Thomas Kurian,为公司提供了稳定性和深厚专业知识。
此外,人才开始向谷歌的专注使命流动。例如,Logan Kilpatrick从OpenAI回到谷歌,被在公司内部构建基础AI的机会所吸引。他加入Velloso,描述这是一个“从零到一的体验”,任务是从头为Gemini建立开发者吸引力。“第一天团队只有我……这个平台上没有用户,没有收入。当时没人对Gemini感兴趣,”Kilpatrick回忆起起点。像Josh Woodward(帮助启动AI Studio,现领导Gemini应用和实验室)以及Noam Shazeer(原始“Attention Is All You Need”Transformer论文的关键合著者)等领导也在2024年底回到公司,担任关键Gemini项目的技术联合负责人。
支柱一:Gemini 2.5与思考模型时代
虽然企业口号已转向“不仅仅是模型”,但拥有性能最佳的大型语言模型仍是一项重大成就,也是公司卓越研究和高效技术架构的有力验证。随着Next '25前几周Gemini 2.5 Pro的发布,谷歌果断夺得了这一桂冠。它迅速登上独立Chatbot Arena排行榜榜首,显著超越了OpenAI最新的GPT-4o变体,并在如Humanity’s Last Exam等极具挑战性的推理基准测试中表现出色。Pichai在主题演讲中表示:“这是我们迄今最智能的AI模型,也是全球最佳模型。”他在另一条推文中提到,该模型在一个月内推动了Gemini使用量增加80%。
首次,Gemini的需求火爆。除了Gemini 2.5 Pro的原始智能外,其令人印象深刻的还有其可展示的推理能力。谷歌设计了一种“思考”能力,使模型能够执行多步骤推理、规划甚至自我反思,然后才最终确定响应。结构化、连贯的思考链(CoT)——使用编号步骤和子项目符号——避免了DeepSeek或OpenAI等其他模型输出的冗长或不透明特性。对于评估关键任务输出的技术团队来说,这种透明度提供了前所未有的验证、纠正和重新引导的信心。
但对企业用户来说更重要的是,Gemini 2.5 Pro在编码方面显著缩小了差距,编码是生成式AI的最大应用领域之一。在与VentureBeat的采访中,领先零售商Wayfair的首席技术官Fiona Tan表示,经过初步测试,公司发现其“进步相当大”,现在“与Anthropic的Claude 3.7 Sonnet相当”,后者此前是许多开发者的首选。
谷歌还为该模型添加了高达100万个令牌的上下文窗口,使其能够对整个代码库或冗长文档进行推理,远超OpenAI或Anthropic模型的能力。(OpenAI本周推出了具有类似大上下文窗口的模型,但基准测试表明Gemini 2.5 Pro在总体推理能力上仍保持优势)。这一优势支持复杂的多文件软件工程任务。
与Pro相辅相成的是Gemini 2.5 Flash,在Next '25上宣布并于昨日发布。同样是“思考”模型,Flash针对低延迟和成本效益进行了优化。你可以控制模型的推理程度,平衡性能与预算。这种分层方法进一步体现了谷歌高管倡导的“每美元智能”策略。
Velloso展示了一张图表,显示在整个智能范围内,谷歌模型提供最佳价值。“如果一年前我们有这场对话……我没有任何东西可展示,”Velloso坦言,强调了快速的转变。“现在,无论你想要哪种模型、哪种规模,如果你不是谷歌,你就是在亏钱。”类似的图表已更新以考虑OpenAI本周的最新模型发布,均显示相同结果:谷歌的模型提供最佳的每美元智能。见下文:

Wayfair的Tan还观察到2.5 Pro在延迟方面的显著改进:“Gemini 2.5的响应更快,”使其适用于“更多面向客户的功能”,她表示这在其他模型中尚属首次。她说,Gemini可能成为Wayfair用于这些客户交互的首个模型。
Gemini家族的功能扩展到多模态,与谷歌的其他领先模型无缝整合,如图像生成的Imagen 3、视频生成的Veo 2、音频的Chirp 3以及新宣布的文本到音乐的Lyria,所有这些都可通过谷歌的Vertex平台供企业用户使用。谷歌是唯一在其平台上提供所有模态自有生成媒体模型的公司。微软、AWS和OpenAI必须与其他公司合作才能做到这一点。
支柱二:基础设施实力——引擎的核心
快速迭代和高效服务这些强大模型的能力源于谷歌无与伦比的基础设施,这得益于数十年来运行全球规模服务的经验。其核心是张量处理单元(TPU)。
在Next '25上,谷歌推出了第七代TPU Ironwood,专为推理和“思考模型”的需求设计。其规模庞大,专为苛刻的AI工作负载定制:Ironwood pod包含超过9000个液冷芯片,据称提供42.5 exaflops的计算能力。谷歌机器学习系统副总裁Amin Vahdat在Next的舞台上表示,这比当前全球排名第一的超级计算机的计算能力“高出24倍以上”。
谷歌表示,Ironwood相对于上一代TPU Trillium提供2倍的每瓦性能。这很重要,因为企业客户越来越表示能源成本和可用性限制了大规模AI部署。
谷歌云首席技术官Will Grannis强调了这种进步的持续性。他在接受VentureBeat采访时表示,谷歌每年在处理器上实现10倍、8倍、9倍、10倍的改进,创造了AI加速器的“超摩尔定律”。他说,客户购买的是谷歌的路线图,而不仅仅是其技术。
谷歌的地位推动了这种持续的TPU投资。它需要高效地为超过20亿用户的搜索、YouTube和Gmail等大规模服务提供动力。这要求在当前生成式AI热潮之前,早就开发定制的优化硬件。虽然Meta在消费者规模上相似,但其他竞争对手缺乏这种长达十年的、垂直整合的AI硬件开发的内在动力。
现在,这些TPU投资正在获得回报,因为它们不仅为自身应用提供高效支持,还使谷歌能够以更好的每美元智能向其他用户提供Gemini。在同等条件下,谷歌的竞争对手为何不能从Nvidia购买高效处理器?确实,Nvidia的GPU处理器在LLM的预训练中占据主导地位。但市场需求推高了这些GPU的价格,Nvidia从中获取了丰厚的利润。这将显著成本转嫁给了使用其芯片的用户。此外,虽然预训练至今主导了AI芯片的使用,但随着企业实际部署这些应用,情况正在改变。这就是“推理”的用武之地,TPU在规模化工作负载中被认为比GPU更高效。
当你问谷歌高管他们的主要AI技术优势来自哪里时,他们通常会归结于TPU是最重要的。负责谷歌计算基础设施的副总裁Mark Lohmeyer明确表示:TPU是“我们所做的高度差异化部分……OpenAI没有这些能力。”
重要的是,谷歌并非孤立地展示TPU,而是作为更复杂的企业AI架构的一部分。对于技术业内人士来说,顶级性能取决于整合日益专业化的技术突破。在Next上详细介绍了许多更新。Vahdat将其描述为“超级计算系统”,集成了硬件(TPU、最新的Nvidia GPU如Blackwell和即将推出的Vera Rubin、高级存储如Hyperdisk Exapools、Anywhere Cache和Rapid Storage)与统一软件栈。这个软件包括用于管理加速器的Cluster Director、Gemini的分布式运行时Pathways(现已对客户开放),以及将vLLM等优化带到TPU,方便此前使用Nvidia/PyTorch堆栈的工作负载迁移。Vahdat认为,这种集成系统使Gemini 2.0 Flash实现了比GPT-4o高24倍的每美元智能。
谷歌还在扩展其物理基础设施的覆盖范围。Cloud WAN使谷歌的200万英里低延迟私有光纤网络对企业开放,承诺比客户管理的网络高40%的性能和低40%的总体拥有成本(TCO)。
此外,谷歌分布式云(GDC)允许Gemini和Nvidia硬件(通过与Dell的合作)在主权、内部或甚至隔离环境中运行——Nvidia首席执行官Jensen Huang称这一能力为“极其巨大”,为受监管行业和国家带来了最先进的AI。在Next上,Huang称谷歌的基础设施是全球最佳的:“没有哪家公司比谷歌和谷歌云在计算的每一层都更出色。”
支柱三:集成全栈——连接点滴
当考虑这些模型和基础设施组件如何编织成一个 cohesive 平台时,谷歌的战略优势得以显现。与通常依靠伙伴关系填补差距的竞争对手不同,谷歌几乎控制了每一层,实现了更紧密的整合和更快的创新周期。
那么,如果像微软这样的竞争对手可以通过与OpenAI合作来匹配基础设施广度与LLM模型实力,这种整合为何重要?我与谷歌员工的交谈表明,这产生了巨大差异,他们还提供了轶事支持。
以谷歌企业数据库BigQuery的显著改进为例。该数据库现提供知识图谱,使LLM能够更高效地搜索数据,客户数量是Snowflake和Databricks等竞争对手的五倍以上。谷歌云数据分析产品负责人Yasmeen Ahmad表示,这些巨大改进得益于谷歌数据团队与DeepMind团队的密切合作。他们共同解决了难以处理的用例,这使数据库在常见查询的准确性上提高了50%,至少根据谷歌的内部测试,优于最接近的竞争对手。Ahmad在接受VentureBeat采访时表示,这种跨技术栈的深度整合是谷歌“超越”行业的方式。
这种内部凝聚力与微软的“友敌”动态形成鲜明对比。虽然微软与OpenAI合作在Azure云上分发其模型,但微软也在开发自己的模型。现在领导谷歌AI开发者计划的高管Mat Velloso在微软时,因试图协调Windows Copilot计划与OpenAI模型产品而感到沮丧后离开。“你如何与一家实际上在与你竞争的公司分享你的产品计划……整个事情是矛盾的,”他回忆道。“在这里,我与构建模型的人并肩工作。”
这种整合体现了谷歌领导者认为的核心优势:其在从基础研究、模型构建到“全球规模”应用部署和基础设施设计的整个领域的独特深厚专业知识连接能力。
Vertex AI是谷歌企业AI努力的中央神经系统。整合不仅限于谷歌自身的产品。Vertex的模型花园提供超过200个精选模型,包括谷歌的、Meta的Llama 4以及众多开源选项。Vertex提供用于调优、评估(包括Grannis强调为关键加速器的AI驱动评估)、部署和监控的工具。其 grounding 能力利用内部AI-ready数据库,同时兼容外部向量数据库。此外,谷歌还推出了通过全球最佳搜索引擎Google Search进行模型 grounding 的新功能。
整合还扩展到谷歌Workspace。在Next '25上宣布的新功能,如Sheets中的“帮助我分析”(是的,Sheets现在有了“=AI”公式)、Docs和Workspace Flows中的音频概览,进一步将Gemini的能力嵌入日常工作流程,创建了一个强大的反馈循环,供谷歌用来改善体验。
在推动其集成技术栈的同时,谷歌也在生态系统服务于开放性的地方倡导开放。推动了Kubernetes的采用后,谷歌现在推广用于AI框架的JAX,以及代理通信的开放协议(A2A)以及对现有标准(MCP)的支持。谷歌还通过Agentspace(谷歌为员工查找和使用代理的统一新界面)提供数百个与外部平台的连接器。这个中心概念引人注目。主题演讲中展示的Agentspace(从51:40开始)说明了这一点。谷歌为用户提供预构建的代理,员工或开发者可以使用无代码AI功能构建自己的代理,或通过A2A连接器引入外部代理。它无缝集成到Chrome浏览器以便访问。
支柱四:聚焦企业价值与代理生态系统
谷歌最显著的转变可能是其聚焦于解决具体企业问题,特别是在AI代理的视角下。谷歌云首席执行官Thomas Kurian概述了客户选择谷歌的三个原因:AI优化的平台、开放的多云方法以连接现有IT,以及对安全、主权和合规性的企业级关注。
代理是这一战略的关键。除了AgentSpace外,还包括:
- 构建模块: 在Next上宣布的开源代理开发工具包(ADK)已受到开发者的极大关注。ADK简化了多代理系统的创建,而提议的Agent2Agent(A2A)协议旨在确保互操作性,允许使用不同工具(Gemini ADK、LangGraph、CrewAI等)构建的代理协作。谷歌的Grannis表示,A2A预见了未来可能有数十万交互代理的规模和安全挑战。
- 专用代理: 谷歌展示了集成到Agentspace的专家代理(如NotebookLM、创意生成、深度研究),并强调了五个获得牵引的关键类别:客户代理(为Reddit Answers、Verizon的支持助手、Wendy’s得来速提供动力)、创意代理(WPP、Brandtech、Sphere使用)、数据代理(在Mattel、Spotify、Bayer推动洞察)、编码代理(Gemini Code Assist)、安全代理(集成到新的谷歌统一安全平台)。
这一全面的代理战略似乎正在引起共鸣。上周与另外三家大型企业的匿名高管交谈也表达了对谷歌代理战略的热情。谷歌云首席运营官Francis DeSouza在采访中证实:“每一次对话都涉及AI。具体来说,每一次对话都涉及代理。”
Deloitte高管Kevin Laughridge是大用户,也是谷歌AI产品的分销商,形容代理市场为“圈地运动”,谷歌凭借协议和其集成平台的早期行动提供了显著优势。“谁先行动并拥有最多真正带来价值的代理,谁就将在这场竞赛中获胜,”Laughridge在采访中表示。他说谷歌的进展“令人震惊”,指出Deloitte一年前构建的定制代理现在可以通过Agentspace“开箱即用”复制。他表示,Deloitte正在平台上构建100个代理,针对财务、风险和工程等中台功能。
客户证明点正在增加。在Next上,谷歌提到“500多家客户在生产中使用生成式AI”,相比一年前的“几十个原型”。如果说一年前微软被认为遥遥领先,现在似乎并非如此明显。由于各方的公关战,很难明确说谁是真正的赢家。指标各异。谷歌的500个数字与微软宣传的400个案例研究不可直接比较(微软在新闻发布会上回应VentureBeat,表示计划很快将公开计数更新到600,凸显了激烈的营销)。如果说谷歌通过其应用的AI分发意义重大,微软通过其365产品分发的Copilot同样令人印象深刻。两者现在都通过API触及数百万开发者。
但谷歌的吸引力例子比比皆是:
- Wendy’s: 在短短一年内向数千个地点部署了AI得来速系统,改善了员工体验和订单准确性。谷歌云首席技术官Will Grannis指出,该AI系统能够理解俚语并过滤背景噪音,大大减轻了实时客户交互的压力。这让员工可以专注于食品准备和质量——Grannis称之为“AI优化现实世界运营的绝佳例子。”
- Salesforce: 宣布重大扩展,首次使其平台运行在谷歌云上(超越AWS),称赞谷歌帮助他们“创新和优化”的能力。
- Honeywell & Intuit: 此前分别与微软和AWS密切关联的公司,现在与谷歌云合作开展AI项目。
- 主要银行(德意志银行、富国银行): 利用代理和Gemini进行研究、分析和现代化客户服务。
- 零售商(沃尔玛、Mercado Libre、Lowe’s): 使用搜索、代理和数据平台。
这种企业吸引力推动了谷歌云的整体增长,在过去三个季度超过了AWS和Azure。谷歌云在2024年达到了440亿美元的年化运行率,相比2018年的50亿美元大幅增长。
应对竞争风浪
谷歌的崛起并不意味着竞争对手停滞不前。OpenAI本周快速发布的GPT-4.1(专注于编码和长上下文)和o系列(多模态推理、工具使用)展示了其持续创新。此外,OpenAI在GPT-4o中的新图像生成功能更新在过去一个月推动了巨大增长,帮助ChatGPT达到8亿用户。微软继续利用其庞大的企业足迹和与OpenAI的合作,而Anthropic在编码和注重安全的应用中仍是一个强大竞争者。
然而,无可争议的是,谷歌的叙事已显著改善。就在一年前,谷歌被视为一个迟缓、犹豫、失误的竞争者,或许即将失去领导AI的机会。然而,其独特的集成技术栈和企业坚定性揭示了另一面:谷歌在从芯片设计(TPU)、全球基础设施到基础模型研究(DeepMind)、应用开发(Workspace、搜索、YouTube)和企业云服务(Vertex AI、BigQuery、Agentspace)的整个领域拥有世界级能力。“我们是唯一参与基础模型对话的超大规模企业,”deSouza直截了当地说。这种端到端的所有权允许优化(如“每美元智能”)和整合深度,这是依赖伙伴关系的模型难以匹敌的。竞争对手往往需要拼接不同的部分,可能造成摩擦或限制创新速度。
谷歌的时刻已到
虽然AI竞赛依然充满活力,但谷歌在市场需求的精确时刻集齐了所有这些部分。正如Deloitte的Laughridge所说,谷歌的实力恰好与“市场需求”完美对齐。如果你一直在等待谷歌在企业AI中证明自己,你可能已经错过了这一刻——它已经做到了。这家发明了许多推动这场革命核心技术的公司似乎终于赶上了——不仅如此,它现在正在设定竞争对手需要追赶的步伐。
在下面的视频中,Next活动后录制的,AI专家Sam Witteveen和我分析了当前格局和新兴趋势,以及为何谷歌的AI生态系统感觉如此强大:
相关文章
谷歌发布面向生产环境的Gemini 2.5 AI模型,挑战企业市场中的OpenAI
谷歌周一加码其AI战略,推出面向企业使用的先进Gemini 2.5模型,并引入成本效益更高的变体,以在价格和性能上展开竞争。这家隶属于Alphabet的公司将其旗舰AI模型——Gemini 2.5 Pro和Gemini 2.5 Flash——从测试阶段提升至全面可用,展示其在关键业务应用中的准备就绪。同时,谷歌推出了Gemini 2.5 Flash-Lite,定位为高容量任务中最具预算友好性的选择
Meta为AI人才提供高薪,否认1亿美元签约奖金
Meta正以数百万美元的丰厚薪酬吸引AI研究人员加入其新的超级智能实验室。然而,一位被招募的研究人员和泄露的内部会议言论表示,关于1亿美元“签约奖金”的说法不实。据The Verge周四报道,在一次泄露的公司全体会议上,Meta高管回应了关于OpenAI首席执行官Sam Altman声称Meta向顶尖研究人员提供奖金的问题。Meta的首席技术官Andrew Bosworth表示,只有极少数高级领导
谷歌发布AI驱动的Simplify工具以简化网页阅读
谷歌的iOS应用现包含“Simplify”功能,利用AI将复杂的网页文本转化为清晰易懂的内容,无需离开页面。Simplify工具由谷歌研究团队开发,使用Gemini重新措辞复杂文本,同时保留关键细节。测试显示其提升了信息的理解和记忆。通过Simplify,谷歌旨在让用户在其生态系统中处理复杂主题,减少对外部工具如OpenAI的ChatGPT的依赖。要使用Simplify,在谷歌应用中选择网页文本,
评论 (12)
0/200
EdwardRamirez
2025-08-06 13:00:59
Google's AI comeback is wild! 😎 I thought they were out of the game, but their enterprise push is sneaky strong. Wonder if they’ll dominate the market soon?
0
ThomasBaker
2025-07-22 09:25:03
Google's quiet climb in enterprise AI is wild! 😎 I thought they were out of the game, but this Transformer legacy is no joke. Curious if they’ll outpace Microsoft soon?
0
RalphGarcia
2025-04-23 02:20:20
GoogleのエンタープライズAIへの進出は感動的だね。追いつくことから先頭に立つまで、彼らは本当にゲームを上げた。でもインターフェースはもう少し改善が必要だね;ちょっとぎこちない。でも、これからどこに向かうのか楽しみだよ!🚀
0
FredAnderson
2025-04-22 23:53:12
Google's move into enterprise AI is impressive. From playing catch-up to leading the pack, they've really stepped up their game. But the interface could use some work; it's a bit clunky. Still, I'm excited to see where they go from here! 🚀
0
JasonRoberts
2025-04-22 15:22:36
El movimiento sigiloso de Google en la IA empresarial es bastante genial. De ir a la zaga a liderar el grupo, realmente han dado la vuelta a la situación. La tecnología es sólida pero la interfaz podría ser más amigable para el usuario. Aún así, es impresionante lo rápido que se han movido! 🚀
0
CharlesMartinez
2025-04-22 14:10:16
A jogada furtiva do Google no AI empresarial é bem legal. De tentar alcançar a liderar o grupo, eles realmente mudaram as coisas. A tecnologia é sólida, mas a interface poderia ser mais amigável ao usuário. Ainda assim, é impressionante como eles se moveram rápido! 🚀
0
就在一年前,关于谷歌和企业AI的讨论似乎停滞不前。尽管谷歌开创了Transformer等技术,这家科技巨头似乎落后了,被OpenAI的病毒式成功、Anthropic的编码能力和微软在企业市场的激进推进所掩盖。
但快进到上周在拉斯维加斯举办的Google Cloud Next 2025,场景已截然不同。自信的谷歌,凭借顶尖的模型、强大的基础设施和明确的企业战略,宣布了戏剧性的转变。在与谷歌高管的闭门分析师会议中,一位分析师概括了现场气氛:“这感觉像是谷歌从‘追赶’变成了‘来追我们’的时刻。”
谷歌的飞跃
这种感觉——谷歌不仅赶上了OpenAI和微软,还在企业AI竞赛中一跃领先——在整个活动中显而易见。这不仅仅是营销炒作。在过去一年中,谷歌专注于执行,将其技术实力转化为高性能的集成平台,迅速赢得了企业决策者的青睐。从运行在高效定制芯片上的全球最强大AI模型,到为现实世界商业挑战量身定制的AI代理生态系统,谷歌正有力证明它从未真正迷失,而是在经历一段深层次的基础开发期。
随着其集成技术栈现已满负荷运行,谷歌似乎已准备好引领企业AI革命的下一阶段。在Next活动中与谷歌高管的访谈中,他们强调了谷歌在基础设施和模型整合方面的独特优势——这些优势是OpenAI、微软或AWS等竞争对手难以复制的。
疑虑的阴影:正视近期历史
要充分理解谷歌当前的势头,必须正视近期历史。谷歌发明了Transformer架构,引发了大型语言模型(LLM)的现代革命,并早在十年前就开始投资专用AI硬件(TPU),如今这些硬件推动了行业领先的效率。然而,令人费解的是,仅在两年半前,谷歌发现自己处于守势。
OpenAI的ChatGPT以惊人速度俘获了公众的想象力和企业兴趣,成为历史上增长最快的应用。Anthropic等竞争对手在编码等领域开辟了利基市场。与此同时,谷歌的公开举措往往显得犹豫或有瑕疵。2023年臭名昭著的Bard演示失误以及其图像生成器产生历史上不准确描绘的争议,助长了一种叙事:谷歌可能因内部官僚作风或对齐问题矫枉过正而受阻。谷歌似乎迷失了方向,呼应了其在云竞争中的最初缓慢步伐,市场份额远远落后于亚马逊和微软,位居第三。
转折点:有意识的领导决策
然而,在幕后,谷歌内部正在发生重大转变,这源于最高层有意识地决定重夺领导地位。谷歌DeepMind AI开发者平台产品副总裁Mat Velloso在2024年2月从微软加入谷歌时,感受到了这一关键时刻。“当我加入谷歌时,我与Sundar [Pichai]和其他几位领导交谈,感觉他们正在决定,好的,这个[生成式AI]是行业明显关心的东西。我们要让它实现,”Velloso在上周Next的采访中分享道。
这种新的推动力并未因外界担忧的“人才流失”而受阻。相反,谷歌在2024年初加倍努力执行,通过激进的招聘、内部整合和客户吸引力标志着这一阶段。尽管竞争对手进行了引人注目的招聘,谷歌保留了其核心AI领导团队,包括DeepMind首席执行官Demis Hassabis和谷歌云首席执行官Thomas Kurian,为公司提供了稳定性和深厚专业知识。
此外,人才开始向谷歌的专注使命流动。例如,Logan Kilpatrick从OpenAI回到谷歌,被在公司内部构建基础AI的机会所吸引。他加入Velloso,描述这是一个“从零到一的体验”,任务是从头为Gemini建立开发者吸引力。“第一天团队只有我……这个平台上没有用户,没有收入。当时没人对Gemini感兴趣,”Kilpatrick回忆起起点。像Josh Woodward(帮助启动AI Studio,现领导Gemini应用和实验室)以及Noam Shazeer(原始“Attention Is All You Need”Transformer论文的关键合著者)等领导也在2024年底回到公司,担任关键Gemini项目的技术联合负责人。
支柱一:Gemini 2.5与思考模型时代
虽然企业口号已转向“不仅仅是模型”,但拥有性能最佳的大型语言模型仍是一项重大成就,也是公司卓越研究和高效技术架构的有力验证。随着Next '25前几周Gemini 2.5 Pro的发布,谷歌果断夺得了这一桂冠。它迅速登上独立Chatbot Arena排行榜榜首,显著超越了OpenAI最新的GPT-4o变体,并在如Humanity’s Last Exam等极具挑战性的推理基准测试中表现出色。Pichai在主题演讲中表示:“这是我们迄今最智能的AI模型,也是全球最佳模型。”他在另一条推文中提到,该模型在一个月内推动了Gemini使用量增加80%。
首次,Gemini的需求火爆。除了Gemini 2.5 Pro的原始智能外,其令人印象深刻的还有其可展示的推理能力。谷歌设计了一种“思考”能力,使模型能够执行多步骤推理、规划甚至自我反思,然后才最终确定响应。结构化、连贯的思考链(CoT)——使用编号步骤和子项目符号——避免了DeepSeek或OpenAI等其他模型输出的冗长或不透明特性。对于评估关键任务输出的技术团队来说,这种透明度提供了前所未有的验证、纠正和重新引导的信心。
但对企业用户来说更重要的是,Gemini 2.5 Pro在编码方面显著缩小了差距,编码是生成式AI的最大应用领域之一。在与VentureBeat的采访中,领先零售商Wayfair的首席技术官Fiona Tan表示,经过初步测试,公司发现其“进步相当大”,现在“与Anthropic的Claude 3.7 Sonnet相当”,后者此前是许多开发者的首选。
谷歌还为该模型添加了高达100万个令牌的上下文窗口,使其能够对整个代码库或冗长文档进行推理,远超OpenAI或Anthropic模型的能力。(OpenAI本周推出了具有类似大上下文窗口的模型,但基准测试表明Gemini 2.5 Pro在总体推理能力上仍保持优势)。这一优势支持复杂的多文件软件工程任务。
与Pro相辅相成的是Gemini 2.5 Flash,在Next '25上宣布并于昨日发布。同样是“思考”模型,Flash针对低延迟和成本效益进行了优化。你可以控制模型的推理程度,平衡性能与预算。这种分层方法进一步体现了谷歌高管倡导的“每美元智能”策略。
Velloso展示了一张图表,显示在整个智能范围内,谷歌模型提供最佳价值。“如果一年前我们有这场对话……我没有任何东西可展示,”Velloso坦言,强调了快速的转变。“现在,无论你想要哪种模型、哪种规模,如果你不是谷歌,你就是在亏钱。”类似的图表已更新以考虑OpenAI本周的最新模型发布,均显示相同结果:谷歌的模型提供最佳的每美元智能。见下文:
Wayfair的Tan还观察到2.5 Pro在延迟方面的显著改进:“Gemini 2.5的响应更快,”使其适用于“更多面向客户的功能”,她表示这在其他模型中尚属首次。她说,Gemini可能成为Wayfair用于这些客户交互的首个模型。
Gemini家族的功能扩展到多模态,与谷歌的其他领先模型无缝整合,如图像生成的Imagen 3、视频生成的Veo 2、音频的Chirp 3以及新宣布的文本到音乐的Lyria,所有这些都可通过谷歌的Vertex平台供企业用户使用。谷歌是唯一在其平台上提供所有模态自有生成媒体模型的公司。微软、AWS和OpenAI必须与其他公司合作才能做到这一点。
支柱二:基础设施实力——引擎的核心
快速迭代和高效服务这些强大模型的能力源于谷歌无与伦比的基础设施,这得益于数十年来运行全球规模服务的经验。其核心是张量处理单元(TPU)。
在Next '25上,谷歌推出了第七代TPU Ironwood,专为推理和“思考模型”的需求设计。其规模庞大,专为苛刻的AI工作负载定制:Ironwood pod包含超过9000个液冷芯片,据称提供42.5 exaflops的计算能力。谷歌机器学习系统副总裁Amin Vahdat在Next的舞台上表示,这比当前全球排名第一的超级计算机的计算能力“高出24倍以上”。
谷歌表示,Ironwood相对于上一代TPU Trillium提供2倍的每瓦性能。这很重要,因为企业客户越来越表示能源成本和可用性限制了大规模AI部署。
谷歌云首席技术官Will Grannis强调了这种进步的持续性。他在接受VentureBeat采访时表示,谷歌每年在处理器上实现10倍、8倍、9倍、10倍的改进,创造了AI加速器的“超摩尔定律”。他说,客户购买的是谷歌的路线图,而不仅仅是其技术。
谷歌的地位推动了这种持续的TPU投资。它需要高效地为超过20亿用户的搜索、YouTube和Gmail等大规模服务提供动力。这要求在当前生成式AI热潮之前,早就开发定制的优化硬件。虽然Meta在消费者规模上相似,但其他竞争对手缺乏这种长达十年的、垂直整合的AI硬件开发的内在动力。
现在,这些TPU投资正在获得回报,因为它们不仅为自身应用提供高效支持,还使谷歌能够以更好的每美元智能向其他用户提供Gemini。在同等条件下,谷歌的竞争对手为何不能从Nvidia购买高效处理器?确实,Nvidia的GPU处理器在LLM的预训练中占据主导地位。但市场需求推高了这些GPU的价格,Nvidia从中获取了丰厚的利润。这将显著成本转嫁给了使用其芯片的用户。此外,虽然预训练至今主导了AI芯片的使用,但随着企业实际部署这些应用,情况正在改变。这就是“推理”的用武之地,TPU在规模化工作负载中被认为比GPU更高效。
当你问谷歌高管他们的主要AI技术优势来自哪里时,他们通常会归结于TPU是最重要的。负责谷歌计算基础设施的副总裁Mark Lohmeyer明确表示:TPU是“我们所做的高度差异化部分……OpenAI没有这些能力。”
重要的是,谷歌并非孤立地展示TPU,而是作为更复杂的企业AI架构的一部分。对于技术业内人士来说,顶级性能取决于整合日益专业化的技术突破。在Next上详细介绍了许多更新。Vahdat将其描述为“超级计算系统”,集成了硬件(TPU、最新的Nvidia GPU如Blackwell和即将推出的Vera Rubin、高级存储如Hyperdisk Exapools、Anywhere Cache和Rapid Storage)与统一软件栈。这个软件包括用于管理加速器的Cluster Director、Gemini的分布式运行时Pathways(现已对客户开放),以及将vLLM等优化带到TPU,方便此前使用Nvidia/PyTorch堆栈的工作负载迁移。Vahdat认为,这种集成系统使Gemini 2.0 Flash实现了比GPT-4o高24倍的每美元智能。
谷歌还在扩展其物理基础设施的覆盖范围。Cloud WAN使谷歌的200万英里低延迟私有光纤网络对企业开放,承诺比客户管理的网络高40%的性能和低40%的总体拥有成本(TCO)。
此外,谷歌分布式云(GDC)允许Gemini和Nvidia硬件(通过与Dell的合作)在主权、内部或甚至隔离环境中运行——Nvidia首席执行官Jensen Huang称这一能力为“极其巨大”,为受监管行业和国家带来了最先进的AI。在Next上,Huang称谷歌的基础设施是全球最佳的:“没有哪家公司比谷歌和谷歌云在计算的每一层都更出色。”
支柱三:集成全栈——连接点滴
当考虑这些模型和基础设施组件如何编织成一个 cohesive 平台时,谷歌的战略优势得以显现。与通常依靠伙伴关系填补差距的竞争对手不同,谷歌几乎控制了每一层,实现了更紧密的整合和更快的创新周期。
那么,如果像微软这样的竞争对手可以通过与OpenAI合作来匹配基础设施广度与LLM模型实力,这种整合为何重要?我与谷歌员工的交谈表明,这产生了巨大差异,他们还提供了轶事支持。
以谷歌企业数据库BigQuery的显著改进为例。该数据库现提供知识图谱,使LLM能够更高效地搜索数据,客户数量是Snowflake和Databricks等竞争对手的五倍以上。谷歌云数据分析产品负责人Yasmeen Ahmad表示,这些巨大改进得益于谷歌数据团队与DeepMind团队的密切合作。他们共同解决了难以处理的用例,这使数据库在常见查询的准确性上提高了50%,至少根据谷歌的内部测试,优于最接近的竞争对手。Ahmad在接受VentureBeat采访时表示,这种跨技术栈的深度整合是谷歌“超越”行业的方式。
这种内部凝聚力与微软的“友敌”动态形成鲜明对比。虽然微软与OpenAI合作在Azure云上分发其模型,但微软也在开发自己的模型。现在领导谷歌AI开发者计划的高管Mat Velloso在微软时,因试图协调Windows Copilot计划与OpenAI模型产品而感到沮丧后离开。“你如何与一家实际上在与你竞争的公司分享你的产品计划……整个事情是矛盾的,”他回忆道。“在这里,我与构建模型的人并肩工作。”
这种整合体现了谷歌领导者认为的核心优势:其在从基础研究、模型构建到“全球规模”应用部署和基础设施设计的整个领域的独特深厚专业知识连接能力。
Vertex AI是谷歌企业AI努力的中央神经系统。整合不仅限于谷歌自身的产品。Vertex的模型花园提供超过200个精选模型,包括谷歌的、Meta的Llama 4以及众多开源选项。Vertex提供用于调优、评估(包括Grannis强调为关键加速器的AI驱动评估)、部署和监控的工具。其 grounding 能力利用内部AI-ready数据库,同时兼容外部向量数据库。此外,谷歌还推出了通过全球最佳搜索引擎Google Search进行模型 grounding 的新功能。
整合还扩展到谷歌Workspace。在Next '25上宣布的新功能,如Sheets中的“帮助我分析”(是的,Sheets现在有了“=AI”公式)、Docs和Workspace Flows中的音频概览,进一步将Gemini的能力嵌入日常工作流程,创建了一个强大的反馈循环,供谷歌用来改善体验。
在推动其集成技术栈的同时,谷歌也在生态系统服务于开放性的地方倡导开放。推动了Kubernetes的采用后,谷歌现在推广用于AI框架的JAX,以及代理通信的开放协议(A2A)以及对现有标准(MCP)的支持。谷歌还通过Agentspace(谷歌为员工查找和使用代理的统一新界面)提供数百个与外部平台的连接器。这个中心概念引人注目。主题演讲中展示的Agentspace(从51:40开始)说明了这一点。谷歌为用户提供预构建的代理,员工或开发者可以使用无代码AI功能构建自己的代理,或通过A2A连接器引入外部代理。它无缝集成到Chrome浏览器以便访问。
支柱四:聚焦企业价值与代理生态系统
谷歌最显著的转变可能是其聚焦于解决具体企业问题,特别是在AI代理的视角下。谷歌云首席执行官Thomas Kurian概述了客户选择谷歌的三个原因:AI优化的平台、开放的多云方法以连接现有IT,以及对安全、主权和合规性的企业级关注。
代理是这一战略的关键。除了AgentSpace外,还包括:
- 构建模块: 在Next上宣布的开源代理开发工具包(ADK)已受到开发者的极大关注。ADK简化了多代理系统的创建,而提议的Agent2Agent(A2A)协议旨在确保互操作性,允许使用不同工具(Gemini ADK、LangGraph、CrewAI等)构建的代理协作。谷歌的Grannis表示,A2A预见了未来可能有数十万交互代理的规模和安全挑战。
- 专用代理: 谷歌展示了集成到Agentspace的专家代理(如NotebookLM、创意生成、深度研究),并强调了五个获得牵引的关键类别:客户代理(为Reddit Answers、Verizon的支持助手、Wendy’s得来速提供动力)、创意代理(WPP、Brandtech、Sphere使用)、数据代理(在Mattel、Spotify、Bayer推动洞察)、编码代理(Gemini Code Assist)、安全代理(集成到新的谷歌统一安全平台)。
这一全面的代理战略似乎正在引起共鸣。上周与另外三家大型企业的匿名高管交谈也表达了对谷歌代理战略的热情。谷歌云首席运营官Francis DeSouza在采访中证实:“每一次对话都涉及AI。具体来说,每一次对话都涉及代理。”
Deloitte高管Kevin Laughridge是大用户,也是谷歌AI产品的分销商,形容代理市场为“圈地运动”,谷歌凭借协议和其集成平台的早期行动提供了显著优势。“谁先行动并拥有最多真正带来价值的代理,谁就将在这场竞赛中获胜,”Laughridge在采访中表示。他说谷歌的进展“令人震惊”,指出Deloitte一年前构建的定制代理现在可以通过Agentspace“开箱即用”复制。他表示,Deloitte正在平台上构建100个代理,针对财务、风险和工程等中台功能。
客户证明点正在增加。在Next上,谷歌提到“500多家客户在生产中使用生成式AI”,相比一年前的“几十个原型”。如果说一年前微软被认为遥遥领先,现在似乎并非如此明显。由于各方的公关战,很难明确说谁是真正的赢家。指标各异。谷歌的500个数字与微软宣传的400个案例研究不可直接比较(微软在新闻发布会上回应VentureBeat,表示计划很快将公开计数更新到600,凸显了激烈的营销)。如果说谷歌通过其应用的AI分发意义重大,微软通过其365产品分发的Copilot同样令人印象深刻。两者现在都通过API触及数百万开发者。
但谷歌的吸引力例子比比皆是:
- Wendy’s: 在短短一年内向数千个地点部署了AI得来速系统,改善了员工体验和订单准确性。谷歌云首席技术官Will Grannis指出,该AI系统能够理解俚语并过滤背景噪音,大大减轻了实时客户交互的压力。这让员工可以专注于食品准备和质量——Grannis称之为“AI优化现实世界运营的绝佳例子。”
- Salesforce: 宣布重大扩展,首次使其平台运行在谷歌云上(超越AWS),称赞谷歌帮助他们“创新和优化”的能力。
- Honeywell & Intuit: 此前分别与微软和AWS密切关联的公司,现在与谷歌云合作开展AI项目。
- 主要银行(德意志银行、富国银行): 利用代理和Gemini进行研究、分析和现代化客户服务。
- 零售商(沃尔玛、Mercado Libre、Lowe’s): 使用搜索、代理和数据平台。
这种企业吸引力推动了谷歌云的整体增长,在过去三个季度超过了AWS和Azure。谷歌云在2024年达到了440亿美元的年化运行率,相比2018年的50亿美元大幅增长。
应对竞争风浪
谷歌的崛起并不意味着竞争对手停滞不前。OpenAI本周快速发布的GPT-4.1(专注于编码和长上下文)和o系列(多模态推理、工具使用)展示了其持续创新。此外,OpenAI在GPT-4o中的新图像生成功能更新在过去一个月推动了巨大增长,帮助ChatGPT达到8亿用户。微软继续利用其庞大的企业足迹和与OpenAI的合作,而Anthropic在编码和注重安全的应用中仍是一个强大竞争者。
然而,无可争议的是,谷歌的叙事已显著改善。就在一年前,谷歌被视为一个迟缓、犹豫、失误的竞争者,或许即将失去领导AI的机会。然而,其独特的集成技术栈和企业坚定性揭示了另一面:谷歌在从芯片设计(TPU)、全球基础设施到基础模型研究(DeepMind)、应用开发(Workspace、搜索、YouTube)和企业云服务(Vertex AI、BigQuery、Agentspace)的整个领域拥有世界级能力。“我们是唯一参与基础模型对话的超大规模企业,”deSouza直截了当地说。这种端到端的所有权允许优化(如“每美元智能”)和整合深度,这是依赖伙伴关系的模型难以匹敌的。竞争对手往往需要拼接不同的部分,可能造成摩擦或限制创新速度。
谷歌的时刻已到
虽然AI竞赛依然充满活力,但谷歌在市场需求的精确时刻集齐了所有这些部分。正如Deloitte的Laughridge所说,谷歌的实力恰好与“市场需求”完美对齐。如果你一直在等待谷歌在企业AI中证明自己,你可能已经错过了这一刻——它已经做到了。这家发明了许多推动这场革命核心技术的公司似乎终于赶上了——不仅如此,它现在正在设定竞争对手需要追赶的步伐。
在下面的视频中,Next活动后录制的,AI专家Sam Witteveen和我分析了当前格局和新兴趋势,以及为何谷歌的AI生态系统感觉如此强大:




Google's AI comeback is wild! 😎 I thought they were out of the game, but their enterprise push is sneaky strong. Wonder if they’ll dominate the market soon?




Google's quiet climb in enterprise AI is wild! 😎 I thought they were out of the game, but this Transformer legacy is no joke. Curious if they’ll outpace Microsoft soon?




GoogleのエンタープライズAIへの進出は感動的だね。追いつくことから先頭に立つまで、彼らは本当にゲームを上げた。でもインターフェースはもう少し改善が必要だね;ちょっとぎこちない。でも、これからどこに向かうのか楽しみだよ!🚀




Google's move into enterprise AI is impressive. From playing catch-up to leading the pack, they've really stepped up their game. But the interface could use some work; it's a bit clunky. Still, I'm excited to see where they go from here! 🚀




El movimiento sigiloso de Google en la IA empresarial es bastante genial. De ir a la zaga a liderar el grupo, realmente han dado la vuelta a la situación. La tecnología es sólida pero la interfaz podría ser más amigable para el usuario. Aún así, es impresionante lo rápido que se han movido! 🚀




A jogada furtiva do Google no AI empresarial é bem legal. De tentar alcançar a liderar o grupo, eles realmente mudaram as coisas. A tecnologia é sólida, mas a interface poderia ser mais amigável ao usuário. Ainda assim, é impressionante como eles se moveram rápido! 🚀












