選項
首頁
新聞
Nvidia 的人工智慧炒作遭遇現實,70% 的邊際利潤在推理戰中備受審查

Nvidia 的人工智慧炒作遭遇現實,70% 的邊際利潤在推理戰中備受審查

2025-10-02
1

Nvidia 的人工智慧炒作遭遇現實,70% 的邊際利潤在推理戰中備受審查

人工智慧晶片大戰在 VB Transform 2025 上爆發

在 VB Transform 2025 的一場火熱的專題討論中,戰線已經劃下,崛起的挑戰者直接針對 Nvidia 的市場主導地位。中心問題暴露了一個明顯的矛盾:AI 推理如何能同時被形容為商品化的「工廠」,同時又能提供 70% 的龐大毛利率?

挑戰者發聲

Groq 執行長 Jonathan Ross 一語道破業界的玄機:"「AI工廠」只是行銷手法,讓AI看起來不那麼可怕"。Cerebras CTO Sean Lie 補充了尖銳的批評:「Nvidia樂於看著服務供應商爭奪殘羹剩菜,同時維持他們舒適的利潤率。」

在數萬億的基礎建設投資懸而未決的情況下,這些言論揭露了企業 AI 計畫持續面臨意料之外瓶頸的真相。

隱藏的容量危機

SemiAnalysis 創辦人 Dylan Patel 揭露了情況的嚴重性:「主要的 AI 使用者不斷洽談更多的容量 - 首先是與模型提供者洽談,然後他們必須向硬體廠商乞求額外的資源」。這種供應鏈的細分揭示了工廠式 AI 經濟學的根本缺陷。

製造業隱喻不足

傳統製造業可隨需求調整規模,但 AI 基礎建設則不同,它面臨著嚴格的限制:

  • GPU 採購需要 24 個月的前置時間
  • 資料中心建置取決於許可與電力協議
  • 目前的基礎建設無法處理指數級的成長需求

市場數據證實急速成長卻支援不足:

  • Anthropic 在六個月內總收入躍升 10 億美元
  • Cursor 的 ARR 從零躍升至 5 億美元
  • OpenAI 突破 100 億美元,但使用者仍面臨代用幣短缺的問題

AI 工廠」邏輯的三個致命缺陷

1.非標準性

「不同提供商的推理速度千差萬別,」Patel 指出。「有些提供的預算速率僅為 20 代幣/秒 - 比人類說話還慢。」

2.品質不一致

Ross 與早期的石油市場作了類比:「就像原油品質的危險變化一樣,目前的 AI 輸出也會根據成本削減技術而波動」。量化和剪枝等常見的優化方法通常會降低模型性能。

3.倒置經濟學

Ross 解釋了這個悖論:"通常花更多錢在託管上並不會提高軟體品質。對於人工智能,預算會直接影響輸出保真度"。這創造了與商品假設相矛盾的溢價定價層級。

元驗證

當 Mark Zuckerberg 挑出 Groq 提供「全品質」輸出時,這暴露了整個產業的品質危機。供應商偷工減料造成隱形的效能降低,只有老練的使用者才能發現。

企業要務

  1. 建立嚴格的品質基準
  2. 審核現有提供商是否有未公開的優化措施
  3. 接受保證模型真實性的溢價定價

100 萬美元代幣的悖論

Lie 強調了業界的定價斷層:「如果人工智能代幣能提供像法律工作一樣的轉型價值,為什麼我們要競相追求 1.5 美元以下的價格?」目前 1:1 的代幣支出與收入比率揭示了被工廠敘述所掩蓋的不可持續的經濟學。

效能突破

下一代硬體可實現階級功能改善。"Lie 表示:「我們的晶圓級技術比 GPU 的速度提升了 10-50 倍。這些進步讓以前不可能實現的即時代理工作流程得以實現,而非隔夜的批次處理。

真正的瓶頸

"危機不是晶片供應,而是資料中心的容量和電力,」Patel 透露。全球對於資源的爭奪,解釋了為什麼企業都紛紛到中東等電力豐富的地區尋找解決方案。

谷歌的警示故事

Ross 提到了 Google 的「成功災難」現象:「當 AI 的表現突然超越人類時,需求的爆炸性增長就會超越基礎設施的容量。這種模式現在在各家企業中重演,沒有平滑的擴充曲線可供使用。

企業策略需要轉移

  1. 以動態容量管理取代線性預測
  2. 在速度重要的地方為效能溢價做好預算
  3. 優先考慮架構優勢,而非逐步優化
  4. 提前數年確保電源容量和資料中心空間

新的市場現實

工廠的隱喻嚴重誤導了今日的 AI 基礎架構現況。企業必須正視三個殘酷的事實:

  1. 供應商市場:容量的稀缺性賦予廠商所有的談判能力
  2. 品質差異:5% 的效能差距會影響應用程式的成敗
  3. 物理限制:千瓦和冷卻能力設定了硬性限制

前進的道路需要放棄商品化的幻想。策略優先順序必須包括

  • 不惜代價確保優質容量
  • 嚴格的品質驗證程序
  • 長期的基礎架構投資
  • 特定工作負載的硬體匹配

小組的結論是一致的:在人工智慧的軍備競賽中,品質和效能需要高價,而工廠思維則直接導致容量限制和妥協。

相關文章
OpenAI 將 ChatGPT Pro 升級至 o3,提升每月 200 美元訂閱的價值 OpenAI 將 ChatGPT Pro 升級至 o3,提升每月 200 美元訂閱的價值 本週,包括 Microsoft、Google 和 Anthropic 在內的科技巨擘都發表了重要的 AI 發展。OpenAI 以自己的突破性更新結束了這一連串的公告 - 除了高調地以 65 億美元收購 Jony Ive 的設計公司,推出代號為「io」的雄心勃勃的硬體計畫之外。該公司已大幅強化 ChatGPT 內的 Operator 自主網頁導覽系統,從先前的 GPT-4o 架構過渡到先進的 o3
非營利組織利用 AI 代理提升慈善募款工作 非營利組織利用 AI 代理提升慈善募款工作 當各大科技公司將人工智慧「代理」推廣為企業生產力的助推器時,一家非營利組織正在展示人工智慧在社會公益方面的潛力。由 Open Philanthropy 支持的慈善研究組織 Sage Future 最近進行了一項創新實驗,展示 AI 模型如何協同進行慈善募款。該非營利組織將 OpenAI 的 GPT-4o 與 o1,以及 Anthropic 的 Claude 3.6 與 3.7 Sonnet 等
頂尖 AI 實驗室警告人類正在失去理解 AI 系統的能力 頂尖 AI 實驗室警告人類正在失去理解 AI 系統的能力 來自 OpenAI、Google DeepMind、Anthropic 和 Meta 的研究人員,史無前例地展現團結,擱置競爭分歧,就負責任的 AI 開發發出集體警告。來自這些典型競爭組織的 40 多位頂尖科學家共同撰寫了一份突破性的研究論文,強調確保 AI 決策過程透明化的窗口正在快速關閉。此次合作的重點在於現代人工智能系統的一項關鍵發展 - 在產生最終輸出之前,以人類可讀的語言闡明推理過程的新
評論 (0)
0/200
回到頂部
OR