Nvidia 的人工智慧炒作遭遇現實,70% 的邊際利潤在推理戰中備受審查

人工智慧晶片大戰在 VB Transform 2025 上爆發
在 VB Transform 2025 的一場火熱的專題討論中,戰線已經劃下,崛起的挑戰者直接針對 Nvidia 的市場主導地位。中心問題暴露了一個明顯的矛盾:AI 推理如何能同時被形容為商品化的「工廠」,同時又能提供 70% 的龐大毛利率?
挑戰者發聲
Groq 執行長 Jonathan Ross 一語道破業界的玄機:"「AI工廠」只是行銷手法,讓AI看起來不那麼可怕"。Cerebras CTO Sean Lie 補充了尖銳的批評:「Nvidia樂於看著服務供應商爭奪殘羹剩菜,同時維持他們舒適的利潤率。」
在數萬億的基礎建設投資懸而未決的情況下,這些言論揭露了企業 AI 計畫持續面臨意料之外瓶頸的真相。
隱藏的容量危機
SemiAnalysis 創辦人 Dylan Patel 揭露了情況的嚴重性:「主要的 AI 使用者不斷洽談更多的容量 - 首先是與模型提供者洽談,然後他們必須向硬體廠商乞求額外的資源」。這種供應鏈的細分揭示了工廠式 AI 經濟學的根本缺陷。
製造業隱喻不足
傳統製造業可隨需求調整規模,但 AI 基礎建設則不同,它面臨著嚴格的限制:
- GPU 採購需要 24 個月的前置時間
- 資料中心建置取決於許可與電力協議
- 目前的基礎建設無法處理指數級的成長需求
市場數據證實急速成長卻支援不足:
- Anthropic 在六個月內總收入躍升 10 億美元
- Cursor 的 ARR 從零躍升至 5 億美元
- OpenAI 突破 100 億美元,但使用者仍面臨代用幣短缺的問題
AI 工廠」邏輯的三個致命缺陷
1.非標準性
「不同提供商的推理速度千差萬別,」Patel 指出。「有些提供的預算速率僅為 20 代幣/秒 - 比人類說話還慢。」
2.品質不一致
Ross 與早期的石油市場作了類比:「就像原油品質的危險變化一樣,目前的 AI 輸出也會根據成本削減技術而波動」。量化和剪枝等常見的優化方法通常會降低模型性能。
3.倒置經濟學
Ross 解釋了這個悖論:"通常花更多錢在託管上並不會提高軟體品質。對於人工智能,預算會直接影響輸出保真度"。這創造了與商品假設相矛盾的溢價定價層級。
元驗證
當 Mark Zuckerberg 挑出 Groq 提供「全品質」輸出時,這暴露了整個產業的品質危機。供應商偷工減料造成隱形的效能降低,只有老練的使用者才能發現。
企業要務
- 建立嚴格的品質基準
- 審核現有提供商是否有未公開的優化措施
- 接受保證模型真實性的溢價定價
100 萬美元代幣的悖論
Lie 強調了業界的定價斷層:「如果人工智能代幣能提供像法律工作一樣的轉型價值,為什麼我們要競相追求 1.5 美元以下的價格?」目前 1:1 的代幣支出與收入比率揭示了被工廠敘述所掩蓋的不可持續的經濟學。
效能突破
下一代硬體可實現階級功能改善。"Lie 表示:「我們的晶圓級技術比 GPU 的速度提升了 10-50 倍。這些進步讓以前不可能實現的即時代理工作流程得以實現,而非隔夜的批次處理。
真正的瓶頸
"危機不是晶片供應,而是資料中心的容量和電力,」Patel 透露。全球對於資源的爭奪,解釋了為什麼企業都紛紛到中東等電力豐富的地區尋找解決方案。
谷歌的警示故事
Ross 提到了 Google 的「成功災難」現象:「當 AI 的表現突然超越人類時,需求的爆炸性增長就會超越基礎設施的容量。這種模式現在在各家企業中重演,沒有平滑的擴充曲線可供使用。
企業策略需要轉移
- 以動態容量管理取代線性預測
- 在速度重要的地方為效能溢價做好預算
- 優先考慮架構優勢,而非逐步優化
- 提前數年確保電源容量和資料中心空間
新的市場現實
工廠的隱喻嚴重誤導了今日的 AI 基礎架構現況。企業必須正視三個殘酷的事實:
- 供應商市場:容量的稀缺性賦予廠商所有的談判能力
- 品質差異:5% 的效能差距會影響應用程式的成敗
- 物理限制:千瓦和冷卻能力設定了硬性限制
前進的道路需要放棄商品化的幻想。策略優先順序必須包括
- 不惜代價確保優質容量
- 嚴格的品質驗證程序
- 長期的基礎架構投資
- 特定工作負載的硬體匹配
小組的結論是一致的:在人工智慧的軍備競賽中,品質和效能需要高價,而工廠思維則直接導致容量限制和妥協。
相關文章
OpenAI 收購人工智慧個人理財新創公司 Hiro
OpenAI 已收購個人理財新創公司 Hiro Finance,創辦人伊森·布洛克(Ethan Bloch)於週一宣布此消息,OpenAI 也向 TechCrunch 證實了這筆交易。這家新創公司曾獲得頂尖金融科技創投公司 Ribbit,以及 General Catalyst 和 Restive 的投資。收購條款未予披露,且 Hiro 從未透露其募資金額。鑑於 Hiro 已宣布將於 4 月 20
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
相關專題推薦
評論 (1)
0/500

人工智慧晶片大戰在 VB Transform 2025 上爆發
在 VB Transform 2025 的一場火熱的專題討論中,戰線已經劃下,崛起的挑戰者直接針對 Nvidia 的市場主導地位。中心問題暴露了一個明顯的矛盾:AI 推理如何能同時被形容為商品化的「工廠」,同時又能提供 70% 的龐大毛利率?
挑戰者發聲
Groq 執行長 Jonathan Ross 一語道破業界的玄機:"「AI工廠」只是行銷手法,讓AI看起來不那麼可怕"。Cerebras CTO Sean Lie 補充了尖銳的批評:「Nvidia樂於看著服務供應商爭奪殘羹剩菜,同時維持他們舒適的利潤率。」
在數萬億的基礎建設投資懸而未決的情況下,這些言論揭露了企業 AI 計畫持續面臨意料之外瓶頸的真相。
隱藏的容量危機
SemiAnalysis 創辦人 Dylan Patel 揭露了情況的嚴重性:「主要的 AI 使用者不斷洽談更多的容量 - 首先是與模型提供者洽談,然後他們必須向硬體廠商乞求額外的資源」。這種供應鏈的細分揭示了工廠式 AI 經濟學的根本缺陷。
製造業隱喻不足
傳統製造業可隨需求調整規模,但 AI 基礎建設則不同,它面臨著嚴格的限制:
- GPU 採購需要 24 個月的前置時間
- 資料中心建置取決於許可與電力協議
- 目前的基礎建設無法處理指數級的成長需求
市場數據證實急速成長卻支援不足:
- Anthropic 在六個月內總收入躍升 10 億美元
- Cursor 的 ARR 從零躍升至 5 億美元
- OpenAI 突破 100 億美元,但使用者仍面臨代用幣短缺的問題
AI 工廠」邏輯的三個致命缺陷
1.非標準性
「不同提供商的推理速度千差萬別,」Patel 指出。「有些提供的預算速率僅為 20 代幣/秒 - 比人類說話還慢。」
2.品質不一致
Ross 與早期的石油市場作了類比:「就像原油品質的危險變化一樣,目前的 AI 輸出也會根據成本削減技術而波動」。量化和剪枝等常見的優化方法通常會降低模型性能。
3.倒置經濟學
Ross 解釋了這個悖論:"通常花更多錢在託管上並不會提高軟體品質。對於人工智能,預算會直接影響輸出保真度"。這創造了與商品假設相矛盾的溢價定價層級。
元驗證
當 Mark Zuckerberg 挑出 Groq 提供「全品質」輸出時,這暴露了整個產業的品質危機。供應商偷工減料造成隱形的效能降低,只有老練的使用者才能發現。
企業要務
- 建立嚴格的品質基準
- 審核現有提供商是否有未公開的優化措施
- 接受保證模型真實性的溢價定價
100 萬美元代幣的悖論
Lie 強調了業界的定價斷層:「如果人工智能代幣能提供像法律工作一樣的轉型價值,為什麼我們要競相追求 1.5 美元以下的價格?」目前 1:1 的代幣支出與收入比率揭示了被工廠敘述所掩蓋的不可持續的經濟學。
效能突破
下一代硬體可實現階級功能改善。"Lie 表示:「我們的晶圓級技術比 GPU 的速度提升了 10-50 倍。這些進步讓以前不可能實現的即時代理工作流程得以實現,而非隔夜的批次處理。
真正的瓶頸
"危機不是晶片供應,而是資料中心的容量和電力,」Patel 透露。全球對於資源的爭奪,解釋了為什麼企業都紛紛到中東等電力豐富的地區尋找解決方案。
谷歌的警示故事
Ross 提到了 Google 的「成功災難」現象:「當 AI 的表現突然超越人類時,需求的爆炸性增長就會超越基礎設施的容量。這種模式現在在各家企業中重演,沒有平滑的擴充曲線可供使用。
企業策略需要轉移
- 以動態容量管理取代線性預測
- 在速度重要的地方為效能溢價做好預算
- 優先考慮架構優勢,而非逐步優化
- 提前數年確保電源容量和資料中心空間
新的市場現實
工廠的隱喻嚴重誤導了今日的 AI 基礎架構現況。企業必須正視三個殘酷的事實:
- 供應商市場:容量的稀缺性賦予廠商所有的談判能力
- 品質差異:5% 的效能差距會影響應用程式的成敗
- 物理限制:千瓦和冷卻能力設定了硬性限制
前進的道路需要放棄商品化的幻想。策略優先順序必須包括
- 不惜代價確保優質容量
- 嚴格的品質驗證程序
- 長期的基礎架構投資
- 特定工作負載的硬體匹配
小組的結論是一致的:在人工智慧的軍備競賽中,品質和效能需要高價,而工廠思維則直接導致容量限制和妥協。
OpenAI 收購人工智慧個人理財新創公司 Hiro
OpenAI 已收購個人理財新創公司 Hiro Finance,創辦人伊森·布洛克(Ethan Bloch)於週一宣布此消息,OpenAI 也向 TechCrunch 證實了這筆交易。這家新創公司曾獲得頂尖金融科技創投公司 Ribbit,以及 General Catalyst 和 Restive 的投資。收購條款未予披露,且 Hiro 從未透露其募資金額。鑑於 Hiro 已宣布將於 4 月 20
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程





首頁






