選項
首頁
新聞
DeepSeek搖動AI行業:下一個AI LEAP可能取決於推理時的計算增加,而不是更多的數據

DeepSeek搖動AI行業:下一個AI LEAP可能取決於推理時的計算增加,而不是更多的數據

2025-04-18
151

DeepSeek搖動AI行業:下一個AI LEAP可能取決於推理時的計算增加,而不是更多的數據

人工智慧產業正處於持續變動的狀態,2025年帶來了一些改變遊戲規則的發展,震撼了整個行業。一個重大變動發生在中國人工智慧實驗室DeepSeek發布了一款新模型,導致Nvidia股價下跌17%,並影響了其他人工智慧數據中心股票。圍繞DeepSeek模型的熱議是什麼?它以相較於美國競爭對手低得多的成本提供了頂尖性能,引發了關於人工智慧數據中心未來走向的熱烈討論。

但要真正理解DeepSeek的作為,我們需要拉遠視角,看看更大的圖景。人工智慧世界正面臨訓練數據稀缺的挑戰。大型企業已經用盡了大部分公開網路數據,這意味著我們在預訓練改進方面正面臨瓶頸。因此,產業正轉向「測試時計算」(TTC)。可以將其想像為人工智慧模型在回答前「思考」片刻,就像OpenAI的「o」系列。業界希望TTC能提供與預訓練相同的擴展改進潛力,或許將迎來人工智慧突破的下一波浪潮。

這些轉變預示著兩個重大變化:首先,低預算實驗室現在也能參與競爭,推出尖端模型。其次,TTC正成為推動人工智慧進步的新前沿。讓我們來分析這些趨勢以及它們對人工智慧格局和市場的可能影響。

對人工智慧產業的影響

我們相信,轉向TTC以及推理模型間競爭的加劇,可能在多個面向重塑人工智慧格局:硬體、雲端平台、基礎模型和企業軟體。

1. 硬體(GPU、專用晶片和計算基礎設施)

轉向TTC可能改變人工智慧公司所需的硬體以及管理方式。他們可能不再將資金投入於越來越大的GPU集群用於訓練,而是更專注於增強推理能力以應對TTC需求。雖然GPU對於推理仍至關重要,但訓練與推理工作負載的差異可能影響這些晶片的設置和使用方式。由於推理工作負載更不可預測且呈「尖峰」特性,容量規劃可能變得更具挑戰性。

我們也認為,這一轉變可能推動專為低延遲推理設計的硬體市場,例如ASIC。隨著TTC比訓練容量更為關鍵,通用GPU的霸主地位可能開始動搖,為專用推理晶片製造商開啟機會。

2. 雲端平台:超大規模雲(AWS、Azure、GCP)與雲端計算

企業採用人工智慧的一大障礙,除了準確性問題外,是推理API的不可靠性。諸如響應時間不一致、速率限制以及並發請求的問題可能令人頭痛。TTC可能使這些問題更嚴重。在這種情況下,能保證高服務品質(QoS)的雲端供應商將具有顯著優勢。

有趣的是,即使新方法可能使人工智慧更有效率,卻不一定會降低對硬體的需求。根據Jevons悖論,效率提升會導致更多消費,更高效的推理模型可能吸引更多開發者使用推理模型,從而增加對計算能力的需求。我們認為,最近的模型改進可能刺激對雲端人工智慧計算的需求,無論是用於推理還是較小型、專業化的模型訓練。

3. 基礎模型提供商(OpenAI、Anthropic、Cohere、DeepSeek、Mistral)

如果像DeepSeek這樣的新進者能以低成本與巨頭競爭,專有預訓練模型的霸權可能開始崩解。我們也可以期待變壓器模型在TTC方面的更多創新,正如DeepSeek所示,這些創新可能來自人工智慧領域中意想不到的地方,而非傳統大廠。

4. 企業人工智慧採用與SaaS(應用層)

鑑於DeepSeek的中國背景,其產品可能會持續受到安全與隱私方面的審查。其基於中國的API和聊天機器人服務不太可能在美國、加拿大或其他西方國家的企業人工智慧客戶中流行。許多公司已封鎖DeepSeek的網站和應用程式。即使由第三方在西方數據中心託管,DeepSeek的模型仍可能面臨審查,這可能限制其在企業中的採用。研究人員已指出諸如越獄、偏見和有害內容生成等問題。雖然一些企業可能會嘗試使用DeepSeek的模型,但由於這些顧慮,廣泛採用似乎不太可能。

另一方面,垂直專業化正逐漸興起。過去,基於基礎模型的垂直應用主要專注於打造量身定制的工作流程。諸如檢索增強生成(RAG)、模型路由、函數調用和防護措施等技術,一直是為特定用例調整通用模型的關鍵。但始終存在一個隱憂,即基礎模型的重大改進可能使這些應用過時。Sam Altman曾警告,模型能力的巨大飛躍可能「碾壓」這些創新。

然而,如果訓練時計算增益已達高原,被迅速超越的威脅將減輕。在模型性能改進來自TTC優化的世界中,應用層玩家可能迎來新機遇。諸如結構化提示優化、延遲感知推理策略和高效抽樣技術等創新,可能在特定垂直領域提供顯著的性能提升。

這些改進對於專注於推理的模型尤其重要,例如OpenAI的GPT-4o和DeepSeek-R1,這些模型可能需要數秒鐘才能回應。在即時應用中,降低延遲並提升特定領域內的推理品質可能帶來競爭優勢。因此,擁有深厚領域知識的公司可能在優化推理效率和微調輸出方面扮演關鍵角色。

DeepSeek的工作表明,我們正在遠離僅依賴更多預訓練來提升模型品質。相反,TTC正變得越來越重要。雖然DeepSeek的模型是否會在企業軟體中被廣泛採用尚不清楚,但它們對其他模型改進的影響正變得更加顯著。

我們相信,DeepSeek的創新正推動既有的人工智慧實驗室採用類似技術,補充其現有的硬體優勢。預測的模型成本下降似乎正在推動更多模型使用,符合Jevons悖論的模式。

Pashootan Vaezipoor 是 Georgian 的技術負責人。

相關文章
DeepSeek-V3揭曉:硬體感知AI設計如何降低成本並提升效能 DeepSeek-V3揭曉:硬體感知AI設計如何降低成本並提升效能 DeepSeek-V3:AI發展的成本效益飛躍AI產業正處於十字路口。雖然大型語言模型(LLMs)日益強大,其運算需求卻急劇上升,使尖端AI開發對大多數組織而言成本過高。DeepSeek-V3透過證明智慧硬體-軟體協同設計—而非僅靠暴力擴展—能在成本僅為一小部分的情況下實現頂尖效能,挑戰此趨勢。僅在2,048 NVIDIA H800 GPUs上訓練,DeepSeek-V3利用多頭潛在注意力(MLA
DeepSeek-GRM:為企業打造可擴展、高性價比的AI解決方案 DeepSeek-GRM:為企業打造可擴展、高性價比的AI解決方案 如果你經營著一家企業,你就知道將人工智慧(AI)整合到你的營運中有多麼艱難。高昂的成本和技術複雜性往往使先進的AI模型超出小型公司的能力範圍。但這就是DeepSeek-GRM的切入點,旨在使AI更加高效且易於取得,縮小大型科技公司與小型企業之間的差距。DeepSeek-GRM 使用一種稱為生成式獎勵建模(GRM)的聰明技術來引導AI回應更符合人類的需求。這一
新技術使DeepSeek和其他模型能夠響應敏感的查詢 新技術使DeepSeek和其他模型能夠響應敏感的查詢 從中國的DeepSeek等大型語言模型(LLM)中消除偏見和審查是一個複雜的挑戰,引起了美國決策者和商業領袖的關注,他們認為這是潛在的國家安全威脅。美國國會選拔委員會的最新報告標記為深層
評論 (32)
0/200
HenryDavis
HenryDavis 2025-07-31 19:35:39

DeepSeek's new model sounds like a game-changer! A 17% Nvidia stock dip is wild—wonder how this’ll shift the AI race. More compute at inference? Mind blown! 🤯

JoseGonzalez
JoseGonzalez 2025-07-29 20:25:16

Wow, DeepSeek's new model sounds like a game-changer! That 17% Nvidia stock dip is wild—makes me wonder if we're hitting a compute bottleneck. Anyone else curious how this shifts the AI race? 🤔

BrianMartinez
BrianMartinez 2025-04-27 09:02:24

¡El nuevo modelo de DeepSeek está sacudiendo la industria de la IA! Es increíble ver cómo baja la acción de Nvidia por esto. Me pregunto si más capacidad de cómputo en la inferencia será realmente la próxima gran cosa o solo un hype. De cualquier manera, es emocionante ver cómo evoluciona la industria! 🚀

GeorgeKing
GeorgeKing 2025-04-25 10:22:57

DeepSeek's new model is shaking up the AI industry! It's wild to see Nvidia's stock dip because of this. I'm curious if more compute at inference will really be the next big thing or if it's just hype. Either way, it's exciting to watch the industry evolve! 🚀

GeorgeNelson
GeorgeNelson 2025-04-23 22:51:14

O novo modelo da DeepSeek está abalando a indústria de IA! É louco ver a queda das ações da Nvidia por causa disso. Estou curioso se mais poder de computação na inferência será realmente a próxima grande coisa ou se é apenas hype. De qualquer forma, é emocionante ver a evolução da indústria! 🚀

GeorgeWilson
GeorgeWilson 2025-04-23 22:44:57

DeepSeek의 새로운 모델이 AI 산업을 흔들고 있어요! Nvidia의 주식이 이 때문에 떨어지는 걸 보니 정말 놀랍네요. 추론 시 더 많은 계산 능력이 정말 다음 큰 변화가 될지, 아니면 그냥 과대광고일지 궁금해요. 어쨌든 산업이 진화하는 걸 보는 건 흥미로워요! 🚀

回到頂部
OR