विकल्प
घर
समाचार
दीपसेक शेक एआई उद्योग: अगला एआई लीप अनुमान में बढ़ी हुई गणना पर निर्भर हो सकता है, अधिक डेटा नहीं

दीपसेक शेक एआई उद्योग: अगला एआई लीप अनुमान में बढ़ी हुई गणना पर निर्भर हो सकता है, अधिक डेटा नहीं

18 अप्रैल 2025
107

दीपसेक शेक एआई उद्योग: अगला एआई लीप अनुमान में बढ़ी हुई गणना पर निर्भर हो सकता है, अधिक डेटा नहीं

एआई उद्योग निरंतर प्रवाह की स्थिति में है, 2025 के साथ कुछ गेम-चेंजिंग घटनाक्रम ला रहे हैं जो चीजों को हिला रहे हैं। एक प्रमुख शेकअप तब आया जब चीनी एआई लैब, डीपसेक ने एक नए मॉडल के साथ एक बमबारी को गिरा दिया, जिसने एनवीडिया के स्टॉक में 17% डुबकी लगाई और अन्य एआई डेटा सेंटर के शेयरों को प्रभावित किया। दीपसेक के मॉडल के चारों ओर चर्चा? यह एआई डेटा केंद्रों के भविष्य के लिए इसका क्या मतलब है, इस बारे में एक तूफान को हिलाकर, अन्य अमेरिकी प्रतियोगियों के एक अंश पर शीर्ष-पायदान प्रदर्शन प्रदान कर रहा है।

लेकिन वास्तव में दीपसेक का क्या कर रहा है, हमें ज़ूम आउट करने और बड़ी तस्वीर को देखने की जरूरत है। एआई दुनिया प्रशिक्षण डेटा की कमी के साथ जूझ रही है। बड़े खिलाड़ियों ने पहले ही सार्वजनिक इंटरनेट डेटा के माध्यम से चबाया है, जिसका अर्थ है कि हम पूर्व-प्रशिक्षण सुधारों में एक दीवार को मार रहे हैं। नतीजतन, उद्योग के शिफ्टिंग गियर "टेस्ट-टाइम कंप्यूट" (टीटीसी) की ओर। इसे AI मॉडल के रूप में सोचें, जवाब देने से पहले "सोचने" के लिए एक पल ले रहे हैं, जैसे कि Openai की "O" श्रृंखला के साथ। वहाँ आशा है कि TTC एक ही तरह के स्केलिंग सुधार की पेशकश कर सकता है जो एक बार पूर्व-प्रशिक्षण, संभावित रूप से AI सफलताओं की अगली बड़ी लहर में शुरू किया गया था।

ये शिफ्ट दो बड़े बदलावों का संकेत दे रहे हैं: पहले, छोटे-बजट की प्रयोगशालाएं अब खेल में हैं, अत्याधुनिक मॉडल डाल रहे हैं। दूसरा, TTC AI को आगे बढ़ाने के लिए नया फ्रंटियर बन रहा है। आइए इन रुझानों को तोड़ते हैं और एआई परिदृश्य और बाजार के लिए वे क्या कर सकते हैं।

एआई उद्योग के लिए निहितार्थ

हमारा मानना ​​है कि तर्क मॉडल के बीच प्रतिस्पर्धा में टीटीसी और रैंप-अप का कदम कई मोर्चों में एआई परिदृश्य को फिर से खोल सकता है: हार्डवेयर, क्लाउड प्लेटफॉर्म, फाउंडेशन मॉडल और एंटरप्राइज सॉफ्टवेयर।

1। हार्डवेयर (जीपीयू, समर्पित चिप्स, और बुनियादी ढांचे की गणना)

TTC में बदलाव से पता चल सकता है कि AI कंपनियों को क्या चाहिए और वे इसे कैसे प्रबंधित करते हैं। प्रशिक्षण के लिए कभी-कभी बड़े GPU समूहों में पैसा डालने के बजाय, वे TTC मांगों को संभालने के लिए अपनी अनुमान क्षमताओं को बढ़ाने पर अधिक ध्यान केंद्रित करना शुरू कर सकते हैं। जबकि जीपीयू अभी भी अनुमान के लिए महत्वपूर्ण होगा, प्रशिक्षण और अनुमान के बीच का अंतर वर्कलोड को प्रभावित कर सकता है कि इन चिप्स को कैसे स्थापित और उपयोग किया जाता है। इंट्रेंस वर्कलोड के साथ अधिक अप्रत्याशित और "स्पाइकी" होने के साथ, क्षमता के लिए योजना मुश्किल हो सकती है।

हमें यह भी लगता है कि यह बदलाव हार्डवेयर के लिए बाजार को बढ़ावा दे सकता है, विशेष रूप से ASICs की तरह कम विलंबता के लिए डिज़ाइन किया गया है। चूंकि टीटीसी प्रशिक्षण क्षमता की तुलना में अधिक महत्वपूर्ण हो जाता है, इसलिए सामान्य-उद्देश्य जीपीयू का शासन व्यतीत हो सकता है, विशेष अनुमान चिप निर्माताओं के लिए दरवाजे खोलना।

2। क्लाउड प्लेटफ़ॉर्म: हाइपरस्केलर्स (AWS, Azure, GCP) और क्लाउड कंप्यूट

व्यवसायों में एआई गोद लेने के लिए एक बड़ी बाधा, सटीकता के मुद्दों से अलग, अनुमान एपीआई की अविश्वसनीयता है। असंगत प्रतिक्रिया समय, दर सीमा और समवर्ती अनुरोधों के साथ परेशानी जैसी चीजें एक वास्तविक सिरदर्द हो सकती हैं। TTC इन समस्याओं को और भी बदतर बना सकता है। इस परिदृश्य में, एक क्लाउड प्रदाता जो इन मुद्दों से निपटने के लिए उच्च गुणवत्ता वाली सेवा (QoS) की गारंटी दे सकता है, एक बड़ा पैर ऊपर हो सकता है।

दिलचस्प बात यह है कि भले ही नए तरीके एआई को अधिक कुशल बना सकते हैं, लेकिन वे हार्डवेयर की मांग को कम नहीं कर सकते हैं। Jevons विरोधाभास के बाद, जहां अधिक दक्षता अधिक खपत की ओर ले जाती है, अधिक कुशल निष्कर्ष मॉडल अधिक डेवलपर्स को तर्क मॉडल का उपयोग करने के लिए ड्राइव कर सकते हैं, कंप्यूटिंग शक्ति की आवश्यकता को बढ़ाते हैं। हमें लगता है कि हाल के मॉडल सुधार क्लाउड एआई गणना के लिए अधिक मांग को बढ़ा सकते हैं, दोनों के लिए और छोटे, विशेष मॉडल प्रशिक्षण के लिए।

3। फाउंडेशन मॉडल प्रदाता (Openai, एन्थ्रोप्रोपिक, Cohere, DeepSeek, Mistral)

यदि डीपसेक जैसे नए प्रवेशकों को लागत के एक अंश पर बड़ी बंदूकों के साथ पैर की अंगुली हो सकती है, तो मालिकाना पूर्व-प्रशिक्षित मॉडल का गढ़ उखड़ सकता है। हम ट्रांसफॉर्मर मॉडल के लिए टीटीसी में अधिक नवाचारों की भी उम्मीद कर सकते हैं, और जैसा कि दीपसेक ने दिखाया है, ये नवाचार एआई में सामान्य संदिग्धों के बाहर अप्रत्याशित स्थानों से आ सकते हैं।

4। एंटरप्राइज एआई गोद लेने और सास (आवेदन परत)

चीन में दीपसेक की जड़ों को देखते हुए, सुरक्षा और गोपनीयता के दृष्टिकोण से उनके उत्पादों की जांच चल रही है। उनकी चीन-आधारित एपीआई और चैटबॉट सेवाएं अमेरिका, कनाडा या अन्य पश्चिमी देशों में एंटरप्राइज एआई ग्राहकों के साथ पकड़ने की संभावना नहीं है। कई कंपनियां पहले से ही दीपसेक की वेबसाइट और ऐप्स को अवरुद्ध कर रही हैं। यहां तक ​​कि जब पश्चिमी डेटा केंद्रों में तृतीय पक्षों द्वारा होस्ट किया जाता है, तो दीपसेक के मॉडल जांच का सामना कर सकते हैं, जो उद्यम में उनके गोद लेने को सीमित कर सकता है। शोधकर्ता जेलब्रेकिंग, पूर्वाग्रह और हानिकारक सामग्री पीढ़ी जैसे मुद्दों को चिह्नित कर रहे हैं। हालांकि कुछ व्यवसाय डीपसेक के मॉडल के साथ प्रयोग कर सकते हैं, इन चिंताओं के कारण व्यापक रूप से गोद लेने की संभावना नहीं है।

एक अन्य नोट पर, ऊर्ध्वाधर विशेषज्ञता जमीन हासिल कर रही है। अतीत में, नींव मॉडल पर निर्मित ऊर्ध्वाधर अनुप्रयोग सभी सिलवाया वर्कफ़्लो बनाने के बारे में थे। इन विशिष्ट उपयोग के मामलों के लिए सामान्यीकृत मॉडल को ट्विक करने में पुनर्प्राप्ति-अनुमानित पीढ़ी (RAG), मॉडल रूटिंग, फ़ंक्शन कॉलिंग और रेलिंग जैसी तकनीकें महत्वपूर्ण हैं। लेकिन हमेशा चिंता होती रही है कि अंतर्निहित मॉडल में बड़े सुधार इन अनुप्रयोगों को अप्रचलित कर सकते हैं। सैम अल्टमैन ने एक बार चेतावनी दी थी कि मॉडल क्षमताओं में एक बड़ी छलांग इन नवाचारों को "स्टीमर" कर सकती है।

हालांकि, अगर हम ट्रेन-टाइम कम्प्यूट लाभ में एक पठार देख रहे हैं, तो जल्दी से आगे निकलने का खतरा। एक ऐसी दुनिया में जहां मॉडल प्रदर्शन में सुधार टीटीसी अनुकूलन से आते हैं, नए अवसर एप्लिकेशन-लेयर खिलाड़ियों के लिए उभर सकते हैं। संरचित शीघ्र अनुकूलन, विलंबता-जागरूक तर्क रणनीतियों, और कुशल नमूनाकरण तकनीक जैसे नवाचार विशिष्ट ऊर्ध्वाधर में बड़े प्रदर्शन को बढ़ावा दे सकते हैं।

ये सुधार विशेष रूप से Openai के GPT-4O और DeepSeek-R1 जैसे तर्क-केंद्रित मॉडल के लिए प्रासंगिक हैं, जो जवाब देने में कई सेकंड लग सकते हैं। वास्तविक समय के अनुप्रयोगों में, विलंबता में कटौती करना और एक विशिष्ट डोमेन के भीतर की गुणवत्ता को बढ़ाना एक प्रतिस्पर्धी बढ़त दे सकता है। नतीजतन, गहरे डोमेन ज्ञान वाली कंपनियां अनुमानित दक्षता और फाइन-ट्यूनिंग आउटपुट के अनुकूलन में महत्वपूर्ण भूमिका निभा सकती हैं।

दीपसेक के काम से पता चलता है कि हम मॉडल की गुणवत्ता में सुधार करने के लिए अधिक पूर्व-प्रशिक्षण पर पूरी तरह से भरोसा करने से दूर जा रहे हैं। इसके बजाय, TTC तेजी से महत्वपूर्ण होता जा रहा है। हालांकि यह स्पष्ट नहीं है कि क्या डीपसेक के मॉडल को जांच के कारण एंटरप्राइज सॉफ्टवेयर में व्यापक रूप से अपनाया जाएगा, अन्य मॉडलों में सुधार पर उनका प्रभाव अधिक स्पष्ट हो रहा है।

हमारा मानना ​​है कि डीपसेक के नवाचार इसी तरह की तकनीकों को अपनाने के लिए स्थापित एआई लैब्स को आगे बढ़ा रहे हैं, जो उनके मौजूदा हार्डवेयर लाभों के पूरक हैं। मॉडल लागतों में अनुमानित गिरावट से लगता है कि Jevons विरोधाभास पैटर्न को फिट करते हुए, अधिक मॉडल उपयोग कर रहा है।

Pashootan Vaezipoor जॉर्जियाई में तकनीकी लीड है।

संबंधित लेख
DeepSeek-GRM:為企業打造可擴展、高性價比的AI解決方案 DeepSeek-GRM:為企業打造可擴展、高性價比的AI解決方案 如果你經營著一家企業,你就知道將人工智慧(AI)整合到你的營運中有多麼艱難。高昂的成本和技術複雜性往往使先進的AI模型超出小型公司的能力範圍。但這就是DeepSeek-GRM的切入點,旨在使AI更加高效且易於取得,縮小大型科技公司與小型企業之間的差距。DeepSeek-GRM 使用一種稱為生成式獎勵建模(GRM)的聰明技術來引導AI回應更符合人類的需求。這一
新技術使DeepSeek和其他模型能夠響應敏感的查詢 新技術使DeepSeek和其他模型能夠響應敏感的查詢 從中國的DeepSeek等大型語言模型(LLM)中消除偏見和審查是一個複雜的挑戰,引起了美國決策者和商業領袖的關注,他們認為這是潛在的國家安全威脅。美國國會選拔委員會的最新報告標記為深層
前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen 前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen 人工智能代理年度:仔細研究2025年的期望和現實2025年被許多專家預示為當年的AI代理商(由高級大型語言和多式聯運公司提供支持的AI代理商),來自OpenAI,Anthropic,Google和Google和Deepseek等公司,最終將帶上中心中心中心中心。
सूचना (30)
JohnRoberts
JohnRoberts 18 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻

WalterWhite
WalterWhite 18 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻

RogerPerez
RogerPerez 18 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻

PatrickMartinez
PatrickMartinez 18 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻

ScottPerez
ScottPerez 18 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻

SophiaCampbell
SophiaCampbell 19 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀

शीर्ष समाचार
Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया दक्षिण कोरिया स्थानीय दुकानों में दीपसेक ऐप डाउनलोड करता है Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें चैट की ऊर्जा का उपयोग अपेक्षा से कम है Openai का O3 मॉडल संभावित रूप से अधिक महंगा है जो शुरू में विचार की तुलना में संचालित होता है नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है
अधिक
शीर्ष पर वापस
OR