DeepSeek促进了AI支出,与信念相反

股票市场在一月份的下跌,受到围绕中国人工智能突破DeepSeek AI及其成本效益高的计算方法的热议推动,可能会让人认为企业正在减少对人工智能芯片和系统的投资。然而,我在彭博智库于纽约组织的生成式人工智能会议上的经历描绘了一幅不同的画面。人们对扩大生成式人工智能使用的热情显而易见,表明这一领域的支出远未放缓。
另见:什么是DeepSeek AI?它安全吗?这里是你需要知道的一切
会议名为“生成式人工智能:DeepSeek后的规模法则”,充满了讨论,强调了对人工智能持续需求推动了投资的增加。
“我们今天举办了十个小组讨论,没有一个小组成员说我们的产能过剩,”彭博智库高级技术分析师兼活动组织者之一曼迪普·辛格(Mandeep Singh)评论道。
“而且没有人谈到基础设施的泡沫,”辛格补充说,强调了行业对人工智能未来的信心。
人工智能基础设施建设:我们处于何处?
辛格的同事、彭博智库高级IT服务和软件分析师阿努拉格·拉纳(Anurag Rana)提出了一个关键问题:“目前大家面前最重要的一个问题是人工智能基础设施建设。是的,我们在那个周期的哪个阶段?”
“没人能确定地知道,”拉纳承认。然而,DeepSeek AI激发的希望是,可以以更低的成本实现重大进展。
“DeepSeek震撼了很多人,”他说。“如果你不需要那么多GPU来运行模型,那么为什么我们需要为Stargate项目投入5000亿美元,”他观察到,提到了一项涉及日本软银集团、OpenAI和Oracle的计划中的美国人工智能项目。
拉纳指出,行业希望人工智能成本能大幅下降,就像云计算成本的快速下降一样。
另见:DeepSeek的新图像模型是成本更低的人工智能的又一次胜利吗?
“成本曲线的下降,大概花了六、七、八年时间,从Amazon AWS开始存储一太字节数据到今天,经济效益很好,”他说。“这就是大家的希望,在人工智能的推理端,如果成本曲线下降到那个水平,天哪,终端用户或企业端对人工智能的采用率将会非常惊人。”
辛格表示赞同,指出DeepSeek AI的出现“改变了所有人对实现效率的思维方式。”
全天,众多小组深入探讨了企业人工智能项目,从构思到部署。然而,一个反复出现的主题是:需要大幅降低人工智能成本以扩大其可及性。
“我认为DeepSeek的出现并不意外,”彭博首席技术官肖恩·爱德华兹(Shawn Edwards)在与彭博智库负责人戴维·德怀尔(David Dwyer)的采访中说。“这让我想到,如果能挥动魔法棒,让这些模型运行得极其高效,那将非常棒,”他说,设想了一个所有人工智能模型都能如此高效运行的未来。
人工智能模型的激增
许多小组成员预计人工智能基础设施投资将增加而非减少的一个原因是人工智能模型数量的增长。当天的一个关键收获是,不会有单一的人工智能模型统治一切。
“我们使用一系列模型,”爱德华兹解释说。“不存在所谓的最佳模型。”
小组成员一致认为,虽然“基础”或“前沿”大语言模型将继续发展,但单个企业可能会使用数百甚至数千个人工智能模型。
另见:人工智能PC的崛起:企业如何重塑技术以跟上步伐
这些模型可以在公司的专有数据上进行微调,这是一个在初始“预训练”通用数据后重新训练神经网络的过程。
“企业在代理中需要模型的选择性,”由风险投资支持的数据科学公司Dataiku的平台战略负责人杰德·多尔蒂(Jed Dougherty)说。“他们需要控制和创建的能力,以及对人工智能模型的可审计性。”
“我们希望将构建这些东西的工具交到人们手中,”他说。“我们不希望十个博士来构建所有代理。”
同样,设计工具领导者Adobe正押注于定制模型作为创意人士的关键用例。Adobe新业务负责人汉娜·埃尔萨克(Hannah Elsakr)在与彭博电视主播罗曼·博斯蒂克(Romaine Bostick)的讨论中表示:“我们可以为你的品牌训练定制模型扩展,这对新的广告活动会有所帮助。”
处理需求的增加
正如人工智能模型一样,许多发言人表示,公司内人工智能代理的激增正在推高处理需求。
“你不会把整个流程塞进一个代理,你会把它分成几部分,”微软Copilot Studio代理和自动化负责人雷·史密斯(Ray Smith)说。
史密斯预测,通过单一界面,如Copilot,“我们将与数百个代理互动——它们只是编程新世界中的应用程序。”
“我们会将业务流程交给代理,告诉它我们想完成什么,”代理将执行任务。“代理应用程序只是工作流程的一种新方式,”他说。
另见:Nvidia在生成式人工智能基准测试中占据主导地位,击败了两个竞争对手的人工智能芯片
史密斯指出,这种日常场景“在技术上都是可能的,只是我们构建的速度问题。”
ARM控股公司产品管理负责人詹姆斯·麦克尼文(James McNiven)在与彭博的Hyde交谈中表示,将人工智能“代理”推广到组织内更多人进一步需要降低成本。
“我们如何在更多设备上提供访问,”他提出。“我们看到模型在博士级别的任务能力,”他说。
麦克尼文建议,此类代理应作为人类的助手,类比于十年前通过移动电话向发展中国家引入支付系统:“我们如何将这种能力提供给可以使用它的人?”
基础模型的激增
即便是通用的基础模型也在以惊人的速度激增。
Amazon AWS有1800种不同的人工智能模型可用,AWS计算和网络负责人戴夫·布朗(Dave Brown)告诉彭博电视主播卡罗琳·海德(Caroline Hyde)。他说,公司“正在做很多事情来降低运行模型的成本”,包括开发定制人工智能芯片,如Trainium。
AWS“使用我们自己的处理器比其他公司的处理器更多,”布朗说,暗指Nvidia、AMD、Intel和其他通用芯片供应商。
另见:ChatGPT的新图像生成器超出了我的预期——现在可以免费试用
“如果成本更低,客户会做更多,”布朗说。
布朗指出,AWS每天与Claude语言模型家族的制造商Anthropic合作。Anthropic应用程序编程接口负责人迈克尔·格斯滕哈伯(Michael Gerstenhaber)在与海德的同一场交谈中指出,“思考模型会消耗大量容量”,指的是所谓推理模型的趋势,如DeepSeek R1和GPT-o1,会输出关于其最终答案的冗长陈述。
他表示,Anthropic正与AWS密切合作,寻找削减计算预算的方法,如“提示缓存”,存储之前答案的计算结果。
尽管如此,他说,“Anthropic需要数十万个加速器”,指的是人工智能专用芯片,“遍布多个数据中心”来运行其模型。
此外,布朗表示,人工智能供电的能源成本不断上升,没有减缓的迹象。他指出,当前的数据中心消耗数百兆瓦,最终将需要吉瓦。“它消耗的电力,”指的是人工智能,“很大,在许多数据中心中占地面积也很大。”
另见:到2026年,全球人工智能计算将使用“多个纽约市”量的电力,创始人说
经济不确定性与人工智能投资
尽管有雄心勃勃的场景,一个因素可能扰乱所有用例和投资计划:经济。
在周三晚上会议结束时,小组成员和嘉宾们正在关注盘后股市的暴跌。美国总统唐纳德·特朗普刚刚宣布了一项比华尔街大多数人预期的更大、更全面的全球关税计划。
彭博的拉纳表示,传统技术投资领域,如服务器和存储,而非人工智能,可能是经济收缩的首批受害者。
“我们关注的另一个大事是非人工智能技术支出,”他提到关税时说。“当我们看看IBM、Accenture、Microsoft等公司,暂时把人工智能放一边,这将是本财报季的一个挑战。”
拉纳建议,主要公司的首席财务官可能会优先考虑人工智能并转移资金,即使在经济不确定和潜在衰退中需要削减预算。
然而,这种乐观前景并非板上钉钉。
“我最感兴趣的是,如果所有这些大公司会保持他们的资本支出目标不变,”拉纳说,包括人工智能数据中心,“还是会说,你知道吗?太不确定了。”
相关文章
腾讯旗下“小龙虾”表现远超预期,团队将运力扩大10倍,并致歉及提供补偿
腾讯正式推出全场景AI智能助手“WorkBuddy”,凭借高度集成和低部署门槛,标志着大型模型应用层竞争进入新阶段。该产品在发布当天便引发了业界广泛关注。 用户流量远超预期,导致相关产品腾讯云代码助手(CodeBuddy)出现登录故障及服务不稳定。腾讯云团队随后发布致歉声明,表示技术团队已紧急将容量扩容十倍,目前服务已全面恢复。受影响用户获得了5,000腾讯云代金券作为补偿。业界观察人士将Work
Suno领投方:删除帖子无法填补版权诉讼的漏洞
备受瞩目的AI音乐生成平台Suno正面临一场艰难的版权诉讼,而其领投投资人的坦率言论,可能恰恰为对方提供了他们梦寐以求的证据。 Menlo Ventures(Suno的核心投资者)合伙人C.C. Gong近日删除了一个推文,该推文与公司当前的法律辩护策略直接相悖。在之前的版权诉讼中,Suno的辩护主要依赖“合理使用”的论点,声称AI生成的音乐仅仅是一种“工具”,既不会直接与受版权保护的原创作品竞争
Claude Opus 4.7 正式发布,将可靠性置于智能之上
Anthropic 今年保持着激进的开发节奏,几乎每隔一天就会推出新功能。备受期待的 Claude Opus 4.7 刚刚正式发布,有趣的是,Anthropic 在公告中直言不讳地表示:“这并非我们最强大的模型。” 传闻中更强大的 Claude Mythos Preview 仍处于待命状态。尽管如此,Opus 4.7 依然引发了广泛关注,因为它致力于解决“更可靠”而非“更智能”的问题。基准测试结果
相关专题推荐
评论 (2)
0/500
Interesting take! The market panicked but companies are actually doubling down on AI spending. Makes me wonder if the DeepSeek hype was just noise in the short term. 🧐

股票市场在一月份的下跌,受到围绕中国人工智能突破DeepSeek AI及其成本效益高的计算方法的热议推动,可能会让人认为企业正在减少对人工智能芯片和系统的投资。然而,我在彭博智库于纽约组织的生成式人工智能会议上的经历描绘了一幅不同的画面。人们对扩大生成式人工智能使用的热情显而易见,表明这一领域的支出远未放缓。
另见:什么是DeepSeek AI?它安全吗?这里是你需要知道的一切
会议名为“生成式人工智能:DeepSeek后的规模法则”,充满了讨论,强调了对人工智能持续需求推动了投资的增加。
“我们今天举办了十个小组讨论,没有一个小组成员说我们的产能过剩,”彭博智库高级技术分析师兼活动组织者之一曼迪普·辛格(Mandeep Singh)评论道。
“而且没有人谈到基础设施的泡沫,”辛格补充说,强调了行业对人工智能未来的信心。
人工智能基础设施建设:我们处于何处?
辛格的同事、彭博智库高级IT服务和软件分析师阿努拉格·拉纳(Anurag Rana)提出了一个关键问题:“目前大家面前最重要的一个问题是人工智能基础设施建设。是的,我们在那个周期的哪个阶段?”
“没人能确定地知道,”拉纳承认。然而,DeepSeek AI激发的希望是,可以以更低的成本实现重大进展。
“DeepSeek震撼了很多人,”他说。“如果你不需要那么多GPU来运行模型,那么为什么我们需要为Stargate项目投入5000亿美元,”他观察到,提到了一项涉及日本软银集团、OpenAI和Oracle的计划中的美国人工智能项目。
拉纳指出,行业希望人工智能成本能大幅下降,就像云计算成本的快速下降一样。
另见:DeepSeek的新图像模型是成本更低的人工智能的又一次胜利吗?
“成本曲线的下降,大概花了六、七、八年时间,从Amazon AWS开始存储一太字节数据到今天,经济效益很好,”他说。“这就是大家的希望,在人工智能的推理端,如果成本曲线下降到那个水平,天哪,终端用户或企业端对人工智能的采用率将会非常惊人。”
辛格表示赞同,指出DeepSeek AI的出现“改变了所有人对实现效率的思维方式。”
全天,众多小组深入探讨了企业人工智能项目,从构思到部署。然而,一个反复出现的主题是:需要大幅降低人工智能成本以扩大其可及性。
“我认为DeepSeek的出现并不意外,”彭博首席技术官肖恩·爱德华兹(Shawn Edwards)在与彭博智库负责人戴维·德怀尔(David Dwyer)的采访中说。“这让我想到,如果能挥动魔法棒,让这些模型运行得极其高效,那将非常棒,”他说,设想了一个所有人工智能模型都能如此高效运行的未来。
人工智能模型的激增
许多小组成员预计人工智能基础设施投资将增加而非减少的一个原因是人工智能模型数量的增长。当天的一个关键收获是,不会有单一的人工智能模型统治一切。
“我们使用一系列模型,”爱德华兹解释说。“不存在所谓的最佳模型。”
小组成员一致认为,虽然“基础”或“前沿”大语言模型将继续发展,但单个企业可能会使用数百甚至数千个人工智能模型。
另见:人工智能PC的崛起:企业如何重塑技术以跟上步伐
这些模型可以在公司的专有数据上进行微调,这是一个在初始“预训练”通用数据后重新训练神经网络的过程。
“企业在代理中需要模型的选择性,”由风险投资支持的数据科学公司Dataiku的平台战略负责人杰德·多尔蒂(Jed Dougherty)说。“他们需要控制和创建的能力,以及对人工智能模型的可审计性。”
“我们希望将构建这些东西的工具交到人们手中,”他说。“我们不希望十个博士来构建所有代理。”
同样,设计工具领导者Adobe正押注于定制模型作为创意人士的关键用例。Adobe新业务负责人汉娜·埃尔萨克(Hannah Elsakr)在与彭博电视主播罗曼·博斯蒂克(Romaine Bostick)的讨论中表示:“我们可以为你的品牌训练定制模型扩展,这对新的广告活动会有所帮助。”
处理需求的增加
正如人工智能模型一样,许多发言人表示,公司内人工智能代理的激增正在推高处理需求。
“你不会把整个流程塞进一个代理,你会把它分成几部分,”微软Copilot Studio代理和自动化负责人雷·史密斯(Ray Smith)说。
史密斯预测,通过单一界面,如Copilot,“我们将与数百个代理互动——它们只是编程新世界中的应用程序。”
“我们会将业务流程交给代理,告诉它我们想完成什么,”代理将执行任务。“代理应用程序只是工作流程的一种新方式,”他说。
另见:Nvidia在生成式人工智能基准测试中占据主导地位,击败了两个竞争对手的人工智能芯片
史密斯指出,这种日常场景“在技术上都是可能的,只是我们构建的速度问题。”
ARM控股公司产品管理负责人詹姆斯·麦克尼文(James McNiven)在与彭博的Hyde交谈中表示,将人工智能“代理”推广到组织内更多人进一步需要降低成本。
“我们如何在更多设备上提供访问,”他提出。“我们看到模型在博士级别的任务能力,”他说。
麦克尼文建议,此类代理应作为人类的助手,类比于十年前通过移动电话向发展中国家引入支付系统:“我们如何将这种能力提供给可以使用它的人?”
基础模型的激增
即便是通用的基础模型也在以惊人的速度激增。
Amazon AWS有1800种不同的人工智能模型可用,AWS计算和网络负责人戴夫·布朗(Dave Brown)告诉彭博电视主播卡罗琳·海德(Caroline Hyde)。他说,公司“正在做很多事情来降低运行模型的成本”,包括开发定制人工智能芯片,如Trainium。
AWS“使用我们自己的处理器比其他公司的处理器更多,”布朗说,暗指Nvidia、AMD、Intel和其他通用芯片供应商。
另见:ChatGPT的新图像生成器超出了我的预期——现在可以免费试用
“如果成本更低,客户会做更多,”布朗说。
布朗指出,AWS每天与Claude语言模型家族的制造商Anthropic合作。Anthropic应用程序编程接口负责人迈克尔·格斯滕哈伯(Michael Gerstenhaber)在与海德的同一场交谈中指出,“思考模型会消耗大量容量”,指的是所谓推理模型的趋势,如DeepSeek R1和GPT-o1,会输出关于其最终答案的冗长陈述。
他表示,Anthropic正与AWS密切合作,寻找削减计算预算的方法,如“提示缓存”,存储之前答案的计算结果。
尽管如此,他说,“Anthropic需要数十万个加速器”,指的是人工智能专用芯片,“遍布多个数据中心”来运行其模型。
此外,布朗表示,人工智能供电的能源成本不断上升,没有减缓的迹象。他指出,当前的数据中心消耗数百兆瓦,最终将需要吉瓦。“它消耗的电力,”指的是人工智能,“很大,在许多数据中心中占地面积也很大。”
另见:到2026年,全球人工智能计算将使用“多个纽约市”量的电力,创始人说
经济不确定性与人工智能投资
尽管有雄心勃勃的场景,一个因素可能扰乱所有用例和投资计划:经济。
在周三晚上会议结束时,小组成员和嘉宾们正在关注盘后股市的暴跌。美国总统唐纳德·特朗普刚刚宣布了一项比华尔街大多数人预期的更大、更全面的全球关税计划。
彭博的拉纳表示,传统技术投资领域,如服务器和存储,而非人工智能,可能是经济收缩的首批受害者。
“我们关注的另一个大事是非人工智能技术支出,”他提到关税时说。“当我们看看IBM、Accenture、Microsoft等公司,暂时把人工智能放一边,这将是本财报季的一个挑战。”
拉纳建议,主要公司的首席财务官可能会优先考虑人工智能并转移资金,即使在经济不确定和潜在衰退中需要削减预算。
然而,这种乐观前景并非板上钉钉。
“我最感兴趣的是,如果所有这些大公司会保持他们的资本支出目标不变,”拉纳说,包括人工智能数据中心,“还是会说,你知道吗?太不确定了。”
腾讯旗下“小龙虾”表现远超预期,团队将运力扩大10倍,并致歉及提供补偿
腾讯正式推出全场景AI智能助手“WorkBuddy”,凭借高度集成和低部署门槛,标志着大型模型应用层竞争进入新阶段。该产品在发布当天便引发了业界广泛关注。 用户流量远超预期,导致相关产品腾讯云代码助手(CodeBuddy)出现登录故障及服务不稳定。腾讯云团队随后发布致歉声明,表示技术团队已紧急将容量扩容十倍,目前服务已全面恢复。受影响用户获得了5,000腾讯云代金券作为补偿。业界观察人士将Work
Suno领投方:删除帖子无法填补版权诉讼的漏洞
备受瞩目的AI音乐生成平台Suno正面临一场艰难的版权诉讼,而其领投投资人的坦率言论,可能恰恰为对方提供了他们梦寐以求的证据。 Menlo Ventures(Suno的核心投资者)合伙人C.C. Gong近日删除了一个推文,该推文与公司当前的法律辩护策略直接相悖。在之前的版权诉讼中,Suno的辩护主要依赖“合理使用”的论点,声称AI生成的音乐仅仅是一种“工具”,既不会直接与受版权保护的原创作品竞争
Claude Opus 4.7 正式发布,将可靠性置于智能之上
Anthropic 今年保持着激进的开发节奏,几乎每隔一天就会推出新功能。备受期待的 Claude Opus 4.7 刚刚正式发布,有趣的是,Anthropic 在公告中直言不讳地表示:“这并非我们最强大的模型。” 传闻中更强大的 Claude Mythos Preview 仍处于待命状态。尽管如此,Opus 4.7 依然引发了广泛关注,因为它致力于解决“更可靠”而非“更智能”的问题。基准测试结果
Interesting take! The market panicked but companies are actually doubling down on AI spending. Makes me wonder if the DeepSeek hype was just noise in the short term. 🧐





首页






