选项
首页
新闻
DeepSeek摇动AI行业:下一个AI LEAP可能取决于推理时的计算增加,而不是更多的数据

DeepSeek摇动AI行业:下一个AI LEAP可能取决于推理时的计算增加,而不是更多的数据

2025-04-18
185

DeepSeek摇动AI行业:下一个AI LEAP可能取决于推理时的计算增加,而不是更多的数据

人工智能行业处于不断变化之中,2025年带来了一些改变游戏规则的发展,震撼了整个行业。一个重大变革来自中国人工智能实验室DeepSeek,他们发布了一个新模型,导致Nvidia股价下跌17%,并影响了其他人工智能数据中心股票。DeepSeek模型的热议之处在于?它以远低于美国竞争对手的成本提供了顶尖性能,引发了关于人工智能数据中心未来的激烈讨论。

但要真正理解DeepSeek的作为,我们需要放眼全局,审视更大的图景。人工智能领域正面临训练数据的稀缺问题。大公司已经耗尽了大部分公共互联网数据,这意味着我们在预训练改进方面遇到了瓶颈。因此,行业正在转向“测试时计算”(TTC)。可以将其想象为人工智能模型在回答前“思考”片刻,就像OpenAI的“o”系列。有希望认为TTC可以提供与预训练类似的规模改进,可能引领下一波人工智能突破。

这些转变预示着两大变化:首先,低预算实验室现在也加入了竞争,推出了尖端模型。其次,TTC正成为推动人工智能前进的新前沿。让我们来分析这些趋势及其对人工智能格局和市场的潜在意义。

对人工智能行业的影响

我们认为,向TTC的转变以及推理模型竞争的加剧可能在多个方面重塑人工智能格局:硬件、云平台、基础模型和企业软件。

1. 硬件(GPU、专用芯片和计算基础设施)

TTC的转变可能改变人工智能公司所需的硬件及其管理方式。他们可能不再将资金投入于越来越大的GPU集群进行训练,而是更专注于增强推理能力以应对TTC需求。虽然GPU对推理仍至关重要,但训练与推理工作负载的差异可能影响这些芯片的配置和使用方式。由于推理工作负载更不可预测且“波动性”更大,容量规划可能变得更具挑战性。

我们还认为,这一转变可能推动专为低延迟推理设计的硬件市场,例如ASIC。随着TTC变得比训练容量更重要,通用GPU的主导地位可能开始减弱,为专用推理芯片制造商打开了大门。

2. 云平台:超大规模云(AWS、Azure、GCP)与云计算

企业在采用人工智能时,除了准确性问题外,推理API的不可靠性是一个主要障碍。响应时间不一致、速率限制以及并发请求的困难可能令人头疼。TTC可能会使这些问题进一步恶化。在这种情况下,能够保证高质量服务(QoS)的云提供商将具有显著优势。

有趣的是,尽管新方法可能使人工智能更高效,但它们可能不会减少对硬件的需求。根据Jevons悖论,更高的效率会导致更多的消费,更高效的推理模型可能会吸引更多开发者使用推理模型,从而增加对计算能力的需求。我们认为,近期模型的改进可能会刺激对云人工智能计算的需求,无论是用于推理还是更小、专门化的模型训练。

3. 基础模型提供商(OpenAI、Anthropic、Cohere、DeepSeek、Mistral)

如果像DeepSeek这样的新进入者能够以低得多的成本与巨头竞争,专有预训练模型的壁垒可能会开始瓦解。我们还可以期待Transformer模型在TTC方面的更多创新,正如DeepSeek所示,这些创新可能来自人工智能领域之外的意想不到之处。

4. 企业人工智能采用与SaaS(应用层)

鉴于DeepSeek起源于中国,其产品在安全和隐私方面必然会持续受到审查。他们的基于中国的API和聊天机器人服务不太可能在美国、加拿大或其他西方国家的企业人工智能客户中流行。许多公司已经屏蔽了DeepSeek的网站和应用程序。即使在西方数据中心由第三方托管,DeepSeek的模型也可能面临审查,这可能限制其在企业的采用。研究人员指出了一些问题,如越狱、偏见和有害内容生成。虽然一些企业可能尝试使用DeepSeek的模型,但由于这些担忧,广泛采用似乎不太可能。

另一方面,垂直专业化正在兴起。过去,基于基础模型的垂直应用主要集中在创建定制化工作流程上。检索增强生成(RAG)、模型路由、函数调用和护栏等技术在调整通用模型以适应特定用例方面发挥了关键作用。但人们一直担心基础模型的重大改进可能使这些应用过时。Sam Altman曾警告,模型能力的重大飞跃可能“碾压”这些创新。

然而,如果我们在训练时计算增益上看到一个平台期,被迅速超越的威胁就会减少。在模型性能改进来源于TTC优化的世界中,应用层玩家可能会出现新的机会。结构化提示优化、延迟感知推理策略和高效采样技术等创新可能在特定垂直领域提供显著的性能提升。

这些改进对专注于推理的模型尤其重要,如OpenAI的GPT-4o和DeepSeek-R1,这些模型可能需要几秒钟才能响应。在实时应用中,降低延迟并提升特定领域的推理质量可能带来竞争优势。因此,拥有深厚领域知识的公司可能在优化推理效率和微调输出方面发挥关键作用。

DeepSeek的工作表明,我们正在摆脱仅依靠更多预训练来提高模型质量的依赖。相反,TTC变得越来越重要。虽然DeepSeek的模型因审查问题是否会在企业软件中广泛采用尚不清楚,但它们对改进其他模型的影响正变得更加明显。

我们认为,DeepSeek的创新正在推动老牌人工智能实验室采用类似技术,补充它们现有的硬件优势。模型成本的预计下降似乎正在推动更多模型使用,符合Jevons悖论的模式。

Pashootan Vaezipoor 是 Georgian 的技术负责人。

相关文章
DeepSeek-V3发布:硬件感知AI设计如何降低成本并提升性能 DeepSeek-V3发布:硬件感知AI设计如何降低成本并提升性能 DeepSeek-V3:AI开发的高效成本突破AI行业正处于十字路口。大型语言模型(LLMs)功能日益强大,但计算需求激增,使尖端AI开发对大多数组织而言成本高昂。DeepSeek-V3通过证明智能硬件-软件协同设计——而非单纯的暴力扩展——能以极低成本实现顶尖性能,挑战这一趋势。仅用2,048 NVIDIA H800 GPUs训练,DeepSeek-V3利用了多头潜在注意力(MLA)、专家混合(
DeepSeek-GRM:为企业打造可扩展、高性价比的AI解决方案 DeepSeek-GRM:为企业打造可扩展、高性价比的AI解决方案 深寻-GRM 如果你经营一家企业,你一定知道将人工智能(AI)整合到业务运营中的难度有多大。高昂的成本和技术复杂性常常使先进的AI模型超出小型企业的承受范围。但这就是深寻-GRM 发挥作用的地方,它旨在让AI变得更高效、更易获取,缩小大型科技公司与小型企业之间的差距。深寻-GRM 使用一种名为生成式奖励建模(GRM)的聪明技术来引导AI响应符合人类的实际需求
新技术使DeepSeek和其他模型能够响应敏感的查询 新技术使DeepSeek和其他模型能够响应敏感的查询 从中国的DeepSeek等大型语言模型(LLM)中消除偏见和审查是一个复杂的挑战,引起了美国决策者和商业领袖的关注,他们认为这是潜在的国家安全威胁。美国国会选拔委员会的最新报告标记为深层
评论 (35)
0/200
DonaldAdams
DonaldAdams 2025-09-24 04:30:31

DeepSeek這波真的猛!直接讓NVIDIA股價跳水17%...不過我比較好奇的是,如果推理運算才是重點,那我們這些小公司是不是根本玩不起這場遊戲?硬體成本感覺會是個無底洞啊 😅

EdwardYoung
EdwardYoung 2025-08-15 19:00:59

DeepSeek's new model sounds like a real game-changer! A 17% drop in Nvidia's stock is wild—makes me wonder how much compute power is actually driving these AI leaps. Curious to see if this sparks a race for better inference tech! 🚀

WillieRoberts
WillieRoberts 2025-08-13 13:00:59

DeepSeek's new model sounds like a game-changer! 🤯 I'm curious how this shift to more compute at inference will play out—could it make AI more accessible or just widen the gap between big players?

HenryDavis
HenryDavis 2025-07-31 19:35:39

DeepSeek's new model sounds like a game-changer! A 17% Nvidia stock dip is wild—wonder how this’ll shift the AI race. More compute at inference? Mind blown! 🤯

JoseGonzalez
JoseGonzalez 2025-07-29 20:25:16

Wow, DeepSeek's new model sounds like a game-changer! That 17% Nvidia stock dip is wild—makes me wonder if we're hitting a compute bottleneck. Anyone else curious how this shifts the AI race? 🤔

BrianMartinez
BrianMartinez 2025-04-27 09:02:24

¡El nuevo modelo de DeepSeek está sacudiendo la industria de la IA! Es increíble ver cómo baja la acción de Nvidia por esto. Me pregunto si más capacidad de cómputo en la inferencia será realmente la próxima gran cosa o solo un hype. De cualquier manera, es emocionante ver cómo evoluciona la industria! 🚀

返回顶部
OR