英伟达的人工智能炒作遭遇现实,70%的利润率在推理大战中备受质疑

人工智能芯片大战在 VB Transform 2025 上爆发
在 VB Transform 2025 的一场激烈的小组讨论中,战线已经拉开,崛起的挑战者直接瞄准了 Nvidia 的市场主导地位。核心问题暴露了一个明显的矛盾:人工智能推理如何既能被称为商品化的 "工厂",又能带来 70% 的巨大毛利率?
挑战者大声疾呼
Groq 首席执行官乔纳森-罗斯(Jonathan Ross)一针见血地指出了业界的言论:"'人工智能工厂'只是市场营销的花言巧语,目的是让人工智能看起来不那么可怕"。Cerebras 首席技术官肖恩-列(Sean Lie)也提出了尖锐的批评:"Nvidia乐于看着服务提供商争夺残羹剩饭,同时维持他们舒适的利润率。"
在数万亿基础设施投资岌岌可危的情况下,这些言论揭示了企业人工智能计划持续面临意想不到的瓶颈的真相。
隐藏的容量危机
SemiAnalysis 创始人迪伦-帕特尔(Dylan Patel)揭露了形势的严重性:"主要的人工智能用户不断谈判以获得更多容量--首先是与模型提供商谈判,然后他们必须乞求硬件供应商提供额外资源"。这种供应链分解揭示了工厂式人工智能经济学的根本缺陷。
制造业隐喻落空
传统制造业可随需求扩展,而人工智能基础设施则不同,它面临着严格的限制:
- GPU 采购需要 24 个月的准备时间
- 数据中心的建设取决于许可和电力协议
- 当前的基础设施无法满足指数级增长的需求
市场数据证实了急剧增长却缺乏足够的支持:
- Anthropic 在六个月内净资产收益率跃升 10 亿美元
- Cursor 从零飙升至 5 亿美元 ARR
- OpenAI 突破 100 亿美元,但用户仍面临代币短缺问题
人工智能工厂 "逻辑的三个致命缺陷
1.非标准性能
"帕特尔指出:"不同供应商之间的推理速度相差悬殊。"有些提供商的预算速度仅为 20 个令牌/秒,比人类说话还慢。"
2.质量不一致
罗斯将其与早期的石油市场相提并论:"就像原油质量的危险变化一样,目前的人工智能产出也会根据成本削减技术而波动"。量化和剪枝等常见优化往往会降低模型性能。
3.颠倒的经济学
罗斯解释了这一悖论:"通常情况下,在托管上花费更多并不会提高软件质量。而对于人工智能,预算直接影响到输出保真度。这就产生了与商品假设相矛盾的溢价定价层级。
元验证
马克-扎克伯格(Mark Zuckerberg)称赞 Groq 提供了 "高质量 "的输出,这暴露了整个行业的质量危机。供应商的偷工减料造成了无形的性能下降,只有资深用户才能发现。
企业的当务之急
- 建立严格的质量基准
- 对现有提供商进行审计,以发现未披露的优化情况
- 接受溢价以保证模型的真实性
100 万美元代币悖论
Lie 强调了行业定价的脱节:"如果人工智能代币能提供像法律工作一样的变革性价值,我们为什么还要竞相追求低于 1.5 美元的价格?目前 1:1 的代币支出与收入比揭示了被工厂叙事所掩盖的不可持续的经济性。
性能突破
新一代硬件实现了阶跃式功能改进。"Lie说:"我们的晶圆级技术比GPU的速度提高了10-50倍。这些改进实现了以前不可能实现的实时代理工作流程,而不是隔夜批量处理。
真正的瓶颈
"帕特尔透露:"危机不是芯片供应,而是数据中心的容量和功率。全球对资源的争夺说明了为什么企业纷纷涌向中东等电力资源丰富的地区寻求解决方案。
谷歌的警示故事
罗斯提到了谷歌的 "成功灾难 "现象:"当人工智能的性能突然超过人类时,需求就会爆炸性增长,超出基础设施的容量。现在,这种模式在企业中重复出现,没有平滑的扩展曲线。
企业战略需要转变
- 用动态容量管理取代线性预测
- 在速度重要的地方为性能溢价做好预算
- 优先考虑架构优势,而不是逐步优化
- 提前数年确保电力容量和数据中心空间
新的市场现实
工厂隐喻错误地描述了当今的人工智能基础设施状况,这是非常危险的。企业必须正视三个残酷的事实:
- 供应商市场:容量稀缺赋予了供应商所有的谈判能力
- 质量差异:5% 的性能差距决定了应用的成败
- 物理限制:千瓦和冷却能力设置了硬性限制
前进的道路需要放弃商品化的幻想。战略重点必须包括
- 不惜一切代价确保优质容量
- 严格的质量验证流程
- 长期基础设施投资
- 针对特定工作负载的硬件匹配
专家小组的结论是一致的:在人工智能军备竞赛中,质量和性能要求溢价,而工厂思维则直接导致容量限制和妥协。
相关文章
OpenAI 将 ChatGPT Pro 升级到 o3,提升 200 美元月费的价值
本周,微软(Microsoft)、谷歌(Google)和人类学(Anthropic)等科技巨头都发布了重要的人工智能发展成果。OpenAI 以自己的突破性更新结束了这一轮的公告发布--除了高调斥资 65 亿美元收购 Jony Ive 的设计公司,还推出了代号为 "io "的雄心勃勃的硬件计划。公司大幅增强了 ChatGPT 中的 Operator 自主网络导航系统,从以前的 GPT-4o 框架过渡
非营利组织利用人工智能代理促进慈善筹款工作
当大型科技公司将人工智能 "代理 "作为企业生产力的助推器进行推广时,一家非营利组织正在展示它们在社会公益方面的潜力。由开放慈善组织(Open Philanthropy)支持的慈善研究机构赛智未来(Sage Future)最近进行了一项创新实验,展示了人工智能模型如何在慈善筹款方面进行合作。该非营利组织在一个模拟数字环境中设置了四个先进的人工智能模型--OpenAI 的 GPT-4o 和 o1
顶级人工智能实验室警告人类正在失去理解人工智能系统的能力
来自 OpenAI、谷歌 DeepMind、Anthropic 和 Meta 的研究人员前所未有地团结起来,搁置竞争分歧,就负责任的人工智能发展发出集体警告。来自这些通常相互竞争的组织的 40 多名顶尖科学家共同撰写了一篇开创性的研究论文,强调确保人工智能决策过程透明度的窗口正在迅速关闭。这次合作的重点是现代人工智能系统的一个关键发展--它们在生成最终输出之前,能够以人类可读的语言阐明推理过程的新
评论 (0)
0/200
人工智能芯片大战在 VB Transform 2025 上爆发
在 VB Transform 2025 的一场激烈的小组讨论中,战线已经拉开,崛起的挑战者直接瞄准了 Nvidia 的市场主导地位。核心问题暴露了一个明显的矛盾:人工智能推理如何既能被称为商品化的 "工厂",又能带来 70% 的巨大毛利率?
挑战者大声疾呼
Groq 首席执行官乔纳森-罗斯(Jonathan Ross)一针见血地指出了业界的言论:"'人工智能工厂'只是市场营销的花言巧语,目的是让人工智能看起来不那么可怕"。Cerebras 首席技术官肖恩-列(Sean Lie)也提出了尖锐的批评:"Nvidia乐于看着服务提供商争夺残羹剩饭,同时维持他们舒适的利润率。"
在数万亿基础设施投资岌岌可危的情况下,这些言论揭示了企业人工智能计划持续面临意想不到的瓶颈的真相。
隐藏的容量危机
SemiAnalysis 创始人迪伦-帕特尔(Dylan Patel)揭露了形势的严重性:"主要的人工智能用户不断谈判以获得更多容量--首先是与模型提供商谈判,然后他们必须乞求硬件供应商提供额外资源"。这种供应链分解揭示了工厂式人工智能经济学的根本缺陷。
制造业隐喻落空
传统制造业可随需求扩展,而人工智能基础设施则不同,它面临着严格的限制:
- GPU 采购需要 24 个月的准备时间
- 数据中心的建设取决于许可和电力协议
- 当前的基础设施无法满足指数级增长的需求
市场数据证实了急剧增长却缺乏足够的支持:
- Anthropic 在六个月内净资产收益率跃升 10 亿美元
- Cursor 从零飙升至 5 亿美元 ARR
- OpenAI 突破 100 亿美元,但用户仍面临代币短缺问题
人工智能工厂 "逻辑的三个致命缺陷
1.非标准性能
"帕特尔指出:"不同供应商之间的推理速度相差悬殊。"有些提供商的预算速度仅为 20 个令牌/秒,比人类说话还慢。"
2.质量不一致
罗斯将其与早期的石油市场相提并论:"就像原油质量的危险变化一样,目前的人工智能产出也会根据成本削减技术而波动"。量化和剪枝等常见优化往往会降低模型性能。
3.颠倒的经济学
罗斯解释了这一悖论:"通常情况下,在托管上花费更多并不会提高软件质量。而对于人工智能,预算直接影响到输出保真度。这就产生了与商品假设相矛盾的溢价定价层级。
元验证
马克-扎克伯格(Mark Zuckerberg)称赞 Groq 提供了 "高质量 "的输出,这暴露了整个行业的质量危机。供应商的偷工减料造成了无形的性能下降,只有资深用户才能发现。
企业的当务之急
- 建立严格的质量基准
- 对现有提供商进行审计,以发现未披露的优化情况
- 接受溢价以保证模型的真实性
100 万美元代币悖论
Lie 强调了行业定价的脱节:"如果人工智能代币能提供像法律工作一样的变革性价值,我们为什么还要竞相追求低于 1.5 美元的价格?目前 1:1 的代币支出与收入比揭示了被工厂叙事所掩盖的不可持续的经济性。
性能突破
新一代硬件实现了阶跃式功能改进。"Lie说:"我们的晶圆级技术比GPU的速度提高了10-50倍。这些改进实现了以前不可能实现的实时代理工作流程,而不是隔夜批量处理。
真正的瓶颈
"帕特尔透露:"危机不是芯片供应,而是数据中心的容量和功率。全球对资源的争夺说明了为什么企业纷纷涌向中东等电力资源丰富的地区寻求解决方案。
谷歌的警示故事
罗斯提到了谷歌的 "成功灾难 "现象:"当人工智能的性能突然超过人类时,需求就会爆炸性增长,超出基础设施的容量。现在,这种模式在企业中重复出现,没有平滑的扩展曲线。
企业战略需要转变
- 用动态容量管理取代线性预测
- 在速度重要的地方为性能溢价做好预算
- 优先考虑架构优势,而不是逐步优化
- 提前数年确保电力容量和数据中心空间
新的市场现实
工厂隐喻错误地描述了当今的人工智能基础设施状况,这是非常危险的。企业必须正视三个残酷的事实:
- 供应商市场:容量稀缺赋予了供应商所有的谈判能力
- 质量差异:5% 的性能差距决定了应用的成败
- 物理限制:千瓦和冷却能力设置了硬性限制
前进的道路需要放弃商品化的幻想。战略重点必须包括
- 不惜一切代价确保优质容量
- 严格的质量验证流程
- 长期基础设施投资
- 针对特定工作负载的硬件匹配
专家小组的结论是一致的:在人工智能军备竞赛中,质量和性能要求溢价,而工厂思维则直接导致容量限制和妥协。












