選項
首頁 消息 DeepSeek搖動AI行業:下一個AI LEAP可能取決於推理時的計算增加,而不是更多的數據

DeepSeek搖動AI行業:下一個AI LEAP可能取決於推理時的計算增加,而不是更多的數據

發布日期 發布日期 2025年04月17日
作者 作者 AlbertWalker
視圖 視圖 48

DeepSeek搖動AI行業:下一個AI LEAP可能取決於推理時的計算增加,而不是更多的數據

AI行業處於不斷變化的狀態,2025年帶來了一些改變遊戲規則的發展,這些發展正在震撼。當中國人工智能實驗室DeepSeek以新型號降低了重磅炸彈,導致NVIDIA股票下跌17%並影響了其他AI數據中心股票時,一次重大改組。 DeepSeek模型的嗡嗡聲?它以其他競爭對手為代價的一小部分提供一流的表現,激發了這對AI數據中心未來意味著什麼的風暴。

但是,要真正了解DeepSeek的所作所為,我們需要縮小並查看更大的情況。人工智能世界正在努力解決培訓數據的稀缺性。大型玩家已經在大多數公共互聯網數據中咀嚼,這意味著我們正在訓練前的改進。結果,該行業向“測試時間計算”(TTC)轉移了齒輪。將其視為AI模型花點時間“思考”之前,就像Openai的“ O”系列一樣。希望TTC能夠提供與曾經預先培訓相同的擴展改進,可能會帶來下一個大浪潮的AI突破。

這些轉變標誌著兩個重大變化:首先,較小的預算實驗室正在遊戲中,推出了尖端的型號。其次,TTC已成為推動AI向前發展的新領域。讓我們分解這些趨勢以及它們對AI景觀和市場的意義。

對AI行業的影響

我們認為,轉移到TTC的轉移以及推理模型之間的競爭中的競爭可以重塑多個方面的AI景觀:硬件,雲平台,基礎模型和企業軟件。

1。硬件(GPU,專用芯片和計算基礎架構)

向TTC的轉變可能會改變硬件AI公司的需求以及如何管理它。他們沒有將資金投入到越來越多的GPU集群中進行培訓,而是開始專注於加強其應對TTC需求的推理能力。儘管GPU對於推斷仍然至關重要,但訓練和推理工作負載之間的差異可能會影響這些芯片的設置和使用方式。由於推理工作負載更加不可預測和“尖峰”,因此為容量計劃的計劃可能會變得更加棘手。

我們還認為,這種轉變可以推動專門為低延遲推斷(例如ASIC)設計的硬件市場。隨著TTC比訓練能力更為重要,通用GPU的統治可能開始減少,為專門推理芯片製造商打開了大門。

2。雲平台:高標準(AWS,Azure,GCP)和雲計算

除準確性問題外,在企業中採用AI的一個主要障礙是推論API的不可靠性。響應時間不一致,速率限制和並發請求的麻煩可能是一個真正的頭痛。 TTC可以使這些問題變得更糟。在這種情況下,可以保證要解決這些問題的高質量服務(QoS)的雲提供商可能會大大增加。

有趣的是,即使新方法可能會提高AI效率,但它們可能不會降低對硬件的需求。遵循傑文斯(Jevons)的悖論,在更高的效率中導致更多的消耗,更有效的推理模型可以推動更多的開發人員使用推理模型,從而提高了計算能力的需求。我們認為,最近的模型改進可能會促使人們對雲AI計算的需求更多,包括推理和較小的專業模型培訓。

3。基礎模型提供商(OpenAI,人類,cohere,Deepseek,Mistral)

如果像DeepSeek這樣的新進入者可以以一小部分成本與大型槍支對手,那麼專​​有的預訓練模型的據點可能會開始崩潰。我們還可以期望TTC在變壓器模型中有更多的創新,正如DeepSeek所表明的那樣,這些創新可能來自AI通常的嫌疑犯以外的意外地方。

4。企業AI採用和SaaS(應用程序層)

鑑於DeepSeek在中國的根源,從安全性和隱私的角度來看,他們的產品肯定會進行審查。他們的中國API和聊天機器人服務不太可能與美國,加拿大或其他西方國家的企業AI客戶相處。許多公司已經在阻止DeepSeek的網站和應用程序。即使由西方數據中心的第三方主持,DeepSeek的模型也可能面臨審查,這可能會限制其在企業中的採用。研究人員正在標記諸如越獄,偏見和有害內容產生的問題。儘管某些企業可能會嘗試使用DeepSeek的模型,但由於這些擔憂,廣泛採用似乎不太可能。

另一方面,垂直專業化正在獲得地面。過去,建立在基礎模型上的垂直應用都是關於創建量身定制的工作流程。在調整這些特定用例的通用模型中,諸如檢索型生成(RAG),模型路由,功能調用和護欄之類的技術一直是關鍵。但是一直擔心,基礎模型的重大改進可能會使這些應用程序過時。山姆·奧特曼(Sam Altman)曾警告說,模型能力的巨大飛躍可以“蒸蒸日上”這些創新。

但是,如果我們看到火車時間計算的平穩性,那麼快速超越的威脅就會減少。在TTC優化的模型性能改進的世界中,可能會出現新的機會,即應用程序層玩家。諸如結構化迅速優化,潛伏感知的推理策略和有效抽樣技術之類的創新可以在特定的垂直領域提供巨大的性能。

這些改進與以推理為重點的模型(如OpenAI的GPT-4O和DeepSeek-R1)特別相關,這些模型可能需要幾秒鐘才能做出回應。在實時應用中,降低特定領域內的潛伏期和提高推理質量可能會帶來競爭優勢。結果,具有深層領域知識的公司可能在優化推論效率和微調產出方面發揮著至關重要的作用。

DeepSeek的工作表明,我們正不再依靠更多的預培訓來提高模型質量。相反,TTC變得越來越重要。雖然尚不清楚由於審查而在企業軟件中是否會廣泛採用DeepSeek的模型,但它們對改善其他模型的影響越來越明顯。

我們認為,DeepSeek的創新正在推動已建立的AI實驗室採用類似的技術,從而補充了他們現有的硬件優勢。預測的模型成本下降似乎在推動更多的模型使用情況,這符合Jevons悖論模式。

Pashootan Vaezipoor是喬治亞語的技術負責人。

相關文章
前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen 前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen 人工智能代理年度:仔細研究2025年的期望和現實2025年被許多專家預示為當年的AI代理商(由高級大型語言和多式聯運公司提供支持的AI代理商),來自OpenAI,Anthropic,Google和Google和Deepseek等公司,最終將帶上中心中心中心中心。
DeepSeek的AIS發現了真正的人類慾望 DeepSeek的AIS發現了真正的人類慾望 DeepSeek在AI獎勵模型中的突破性:加強AI推理和響應中國AI初創公司DeepSeek與Tsinghua University合作,在AI研究中取得了重要的里程碑。他們對AI獎勵模型的創新方法有望徹底改變AI系統的學習方式
研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手 研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手 上週五,斯坦福大學和華盛頓大學的AI專家的一份開創性的研究論文襲擊了現場,透露,他們設法開發了一種被稱為S1的AI“推理”模型,以低於50美元的雲計算學分。 S1擁有自己的AI世界,這種啟示正在震撼AI世界
評論 (30)
0/200
JohnRoberts
JohnRoberts 2025年04月18日 12:09:37

DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻

WalterWhite
WalterWhite 2025年04月18日 12:09:37

DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻

RogerPerez
RogerPerez 2025年04月18日 12:09:37

DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻

PatrickMartinez
PatrickMartinez 2025年04月18日 12:09:37

O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻

ScottPerez
ScottPerez 2025年04月18日 12:09:37

El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻

SophiaCampbell
SophiaCampbell 2025年04月18日 17:57:57

DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀

回到頂部
OR