शोधकर्ताओं ने $ 50 के तहत Openai के $ 50 'रीजनिंग' मॉडल के लिए ओपन-सोर्स प्रतिद्वंद्वी विकसित किया

पिछले शुक्रवार को, स्टैनफोर्ड और वाशिंगटन विश्वविद्यालय के AI विशेषज्ञों से एक अभूतपूर्व शोध पत्र प्रकाशित हुआ, जिसमें खुलासा हुआ कि उन्होंने क्लाउड कंप्यूट क्रेडिट में $50 से कम में एक AI "रीजनिंग" मॉडल, जिसे s1 नाम दिया गया, विकसित किया। यह खुलासा AI दुनिया में हलचल मचा रहा है, क्योंकि s1 गणित और कोडिंग चुनौतियों से निपटने में OpenAI के o1 और DeepSeek के R1 जैसे शीर्ष मॉडलों के साथ मुकाबला करता है।
s1 मॉडल, इसके प्रशिक्षण डेटा और कोड के सभी रोमांचक विवरणों के साथ, अब GitHub पर उपलब्ध है। टीम ने एक सामान्य आधार मॉडल से शुरुआत की और फिर इसे डिस्टिलेशन नामक तकनीक के माध्यम से कठिन परीक्षा में डाला। इस प्रक्रिया में किसी अन्य AI मॉडल के जवाबों पर प्रशिक्षण देकर उसका "रीजनिंग" निचोड़ लिया जाता है। इस मामले में, s1 ने Google के Gemini 2.0 Flash Thinking Experimental मॉडल से अपनी बुद्धिमत्ता हासिल की। यह वही रणनीति है जो बर्कले के शोधकर्ताओं ने पिछले महीने लगभग $450 में अपना AI रीजनिंग मॉडल तैयार करने के लिए इस्तेमाल की थी।
कुछ लोगों के लिए, यह विचार कि शोधकर्ताओं की एक छोटी टीम बिना भारी बजट के AI क्षेत्र में हलचल मचा सकती है, रोमांचक है। लेकिन s1 का उदय AI मॉडल विकास के भविष्य के बारे में कुछ गंभीर सवाल भी उठाता है। अगर लाखों की लागत से बने मॉडलों को कम बजट में दोहराया जा सकता है, तो हर कोई ऐसा करने से क्या रुकेगा?
आश्चर्य की बात नहीं है कि AI के बड़े खिलाड़ी इससे खुश नहीं हैं। उदाहरण के लिए, OpenAI ने DeepSeek पर उंगली उठाई है, उन पर अपने API डेटा का उपयोग मॉडल डिस्टिलेशन के लिए करने का आरोप लगाया है। इस बीच, s1 टीम ने ठोस रीजनिंग प्रदर्शन और "टेस्ट-टाइम स्केलिंग" नामक कुछ हासिल करने का सबसे सीधा तरीका खोजने पर ध्यान केंद्रित किया, जहां एक AI मॉडल को जवाब देने से पहले सोचने के लिए अधिक समय मिलता है। ये वही नवाचार हैं जो OpenAI के o1 मॉडल ने पेश किए थे, जिन्हें DeepSeek जैसे अन्य ने अपनी विधियों के साथ नकल करने की कोशिश की है।
s1 पत्र से पता चलता है कि आप अपेक्षाकृत छोटे डेटासेट का उपयोग करके सुपरवाइज्ड फाइन-ट्यूनिंग (SFT) नामक तकनीक के साथ रीजनिंग मॉडल को डिस्टिल कर सकते हैं। इसमें AI मॉडल को डेटासेट से विशिष्ट व्यवहारों की नकल करने के लिए प्रशिक्षित करना शामिल है, और यह DeepSeek द्वारा अपने R1 मॉडल के लिए उपयोग किए गए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग की तुलना में सस्ता है, जो OpenAI के o1 के साथ मुकाबला करता है।
Google अपने Google AI Studio प्लेटफॉर्म के माध्यम से Gemini 2.0 Flash Thinking Experimental को मुफ्त में उपलब्ध कराता है, हालांकि दैनिक सीमाओं के साथ। लेकिन एक पेंच है—Google की शर्तें इसके मॉडलों को रिवर्स-इंजीनियरिंग करके प्रतिस्पर्धी सेवाएं बनाने की अनुमति नहीं देतीं। हम इस पर Google से जवाब का इंतजार कर रहे हैं।
s1 मॉडल की शुरुआत Alibaba के Qwen लैब से एक साधारण, ऑफ-द-शेल्फ AI मॉडल के रूप में हुई, जिसे कोई भी मुफ्त में डाउनलोड कर सकता है। s1 को प्रशिक्षित करने के लिए, शोधकर्ताओं ने केवल 1,000 सावधानीपूर्वक चुने गए सवालों का एक डेटासेट तैयार किया, जिसमें जवाब और प्रत्येक के पीछे की "सोच" प्रक्रिया शामिल थी, जो Google के Gemini 2.0 की सौजन्य से थी। पूरी प्रशिक्षण प्रक्रिया में 16 Nvidia H100 GPU पर 30 मिनट से कम समय लगा। इस परियोजना में शामिल स्टैनफोर्ड के शोधकर्ता निकलास म्यूनिघॉफ के अनुसार, आप इसे आज लगभग $20 की कंप्यूट लागत में कर सकते हैं।
शोधकर्ताओं ने s1 को अपने काम की दोबारा जांच करने और अपनी "सोच" का समय बढ़ाने के लिए एक चतुर चाल भी चली—उन्होंने इसे बस "इंतजार" करने के लिए कहा। पत्र के अनुसार, s1 की रीजनिंग प्रक्रिया के दौरान इस शब्द को जोड़ने से इसे थोड़ा अधिक सटीक जवाब देने में मदद मिली।
2025 की ओर देखते हुए, Meta, Google, और Microsoft जैसे तकनीकी दिग्गज AI बुनियादी ढांचे में सैकड़ों अरबों डॉलर निवेश करने के लिए तैयार हैं, जिनमें से अधिकांश अगली पीढ़ी के AI मॉडलों को प्रशिक्षित करने में जाएगा। हालांकि डिस्टिलेशन AI क्षमताओं को सस्ते में फिर से बनाने का एक प्रभावी तरीका साबित होता है, लेकिन यह जल्द ही बिल्कुल नए, अभूतपूर्व AI मॉडलों के निर्माण की ओर नहीं ले जाएगा।
संबंधित लेख
Google ने उद्यम बाजार में OpenAI के साथ प्रतिस्पर्धा करने के लिए उत्पादन-तैयार Gemini 2.5 AI मॉडल्स का अनावरण किया
Google ने सोमवार को अपनी AI रणनीति को और मजबूत किया, उद्यम उपयोग के लिए अपने उन्नत Gemini 2.5 मॉडल्स को लॉन्च किया और कीमत व प्रदर्शन पर प्रतिस्पर्धा करने के लिए एक लागत-कुशल संस्करण पेश किया।Alphabet
मेटा AI प्रतिभा के लिए उच्च वेतन प्रदान करता है, 100 मिलियन डॉलर के साइनिंग बोनस से इनकार
मेटा अपने नए सुपरइंटेलिजेंस लैब में AI शोधकर्ताओं को आकर्षित करने के लिए लाखों डॉलर के मुआवजे पैकेज प्रदान कर रहा है। हालांकि, एक भर्ती किए गए शोधकर्ता और लीक हुई आंतरिक बैठक की टिप्पणियों के अनुसार,
OpenAI मार्केटिंग प्रमुख ने स्तन कैंसर उपचार के लिए छुट्टी ली
केट राउच, OpenAI की मार्केटिंग नेता, आक्रामक स्तन कैंसर के उपचार पर ध्यान केंद्रित करने के लिए तीन महीने की छुट्टी ले रही हैं।एक LinkedIn पोस्ट में, राउच ने घोषणा की कि गैरी ब्रिग्स, पूर्व Meta CMO, उ
सूचना (7)
0/200
StevenWilson
8 अगस्त 2025 2:30:59 अपराह्न IST
Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔
0
BenRoberts
1 अगस्त 2025 8:18:18 पूर्वाह्न IST
Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀
0
DonaldGonzález
23 अप्रैल 2025 5:15:55 पूर्वाह्न IST
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
HarryRoberts
23 अप्रैल 2025 4:08:34 पूर्वाह्न IST
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
HenryWalker
23 अप्रैल 2025 4:04:07 पूर्वाह्न IST
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
GregoryAdams
22 अप्रैल 2025 7:49:22 अपराह्न IST
s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀
0
पिछले शुक्रवार को, स्टैनफोर्ड और वाशिंगटन विश्वविद्यालय के AI विशेषज्ञों से एक अभूतपूर्व शोध पत्र प्रकाशित हुआ, जिसमें खुलासा हुआ कि उन्होंने क्लाउड कंप्यूट क्रेडिट में $50 से कम में एक AI "रीजनिंग" मॉडल, जिसे s1 नाम दिया गया, विकसित किया। यह खुलासा AI दुनिया में हलचल मचा रहा है, क्योंकि s1 गणित और कोडिंग चुनौतियों से निपटने में OpenAI के o1 और DeepSeek के R1 जैसे शीर्ष मॉडलों के साथ मुकाबला करता है।
s1 मॉडल, इसके प्रशिक्षण डेटा और कोड के सभी रोमांचक विवरणों के साथ, अब GitHub पर उपलब्ध है। टीम ने एक सामान्य आधार मॉडल से शुरुआत की और फिर इसे डिस्टिलेशन नामक तकनीक के माध्यम से कठिन परीक्षा में डाला। इस प्रक्रिया में किसी अन्य AI मॉडल के जवाबों पर प्रशिक्षण देकर उसका "रीजनिंग" निचोड़ लिया जाता है। इस मामले में, s1 ने Google के Gemini 2.0 Flash Thinking Experimental मॉडल से अपनी बुद्धिमत्ता हासिल की। यह वही रणनीति है जो बर्कले के शोधकर्ताओं ने पिछले महीने लगभग $450 में अपना AI रीजनिंग मॉडल तैयार करने के लिए इस्तेमाल की थी।
कुछ लोगों के लिए, यह विचार कि शोधकर्ताओं की एक छोटी टीम बिना भारी बजट के AI क्षेत्र में हलचल मचा सकती है, रोमांचक है। लेकिन s1 का उदय AI मॉडल विकास के भविष्य के बारे में कुछ गंभीर सवाल भी उठाता है। अगर लाखों की लागत से बने मॉडलों को कम बजट में दोहराया जा सकता है, तो हर कोई ऐसा करने से क्या रुकेगा?
आश्चर्य की बात नहीं है कि AI के बड़े खिलाड़ी इससे खुश नहीं हैं। उदाहरण के लिए, OpenAI ने DeepSeek पर उंगली उठाई है, उन पर अपने API डेटा का उपयोग मॉडल डिस्टिलेशन के लिए करने का आरोप लगाया है। इस बीच, s1 टीम ने ठोस रीजनिंग प्रदर्शन और "टेस्ट-टाइम स्केलिंग" नामक कुछ हासिल करने का सबसे सीधा तरीका खोजने पर ध्यान केंद्रित किया, जहां एक AI मॉडल को जवाब देने से पहले सोचने के लिए अधिक समय मिलता है। ये वही नवाचार हैं जो OpenAI के o1 मॉडल ने पेश किए थे, जिन्हें DeepSeek जैसे अन्य ने अपनी विधियों के साथ नकल करने की कोशिश की है।
s1 पत्र से पता चलता है कि आप अपेक्षाकृत छोटे डेटासेट का उपयोग करके सुपरवाइज्ड फाइन-ट्यूनिंग (SFT) नामक तकनीक के साथ रीजनिंग मॉडल को डिस्टिल कर सकते हैं। इसमें AI मॉडल को डेटासेट से विशिष्ट व्यवहारों की नकल करने के लिए प्रशिक्षित करना शामिल है, और यह DeepSeek द्वारा अपने R1 मॉडल के लिए उपयोग किए गए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग की तुलना में सस्ता है, जो OpenAI के o1 के साथ मुकाबला करता है।
Google अपने Google AI Studio प्लेटफॉर्म के माध्यम से Gemini 2.0 Flash Thinking Experimental को मुफ्त में उपलब्ध कराता है, हालांकि दैनिक सीमाओं के साथ। लेकिन एक पेंच है—Google की शर्तें इसके मॉडलों को रिवर्स-इंजीनियरिंग करके प्रतिस्पर्धी सेवाएं बनाने की अनुमति नहीं देतीं। हम इस पर Google से जवाब का इंतजार कर रहे हैं।
s1 मॉडल की शुरुआत Alibaba के Qwen लैब से एक साधारण, ऑफ-द-शेल्फ AI मॉडल के रूप में हुई, जिसे कोई भी मुफ्त में डाउनलोड कर सकता है। s1 को प्रशिक्षित करने के लिए, शोधकर्ताओं ने केवल 1,000 सावधानीपूर्वक चुने गए सवालों का एक डेटासेट तैयार किया, जिसमें जवाब और प्रत्येक के पीछे की "सोच" प्रक्रिया शामिल थी, जो Google के Gemini 2.0 की सौजन्य से थी। पूरी प्रशिक्षण प्रक्रिया में 16 Nvidia H100 GPU पर 30 मिनट से कम समय लगा। इस परियोजना में शामिल स्टैनफोर्ड के शोधकर्ता निकलास म्यूनिघॉफ के अनुसार, आप इसे आज लगभग $20 की कंप्यूट लागत में कर सकते हैं।
शोधकर्ताओं ने s1 को अपने काम की दोबारा जांच करने और अपनी "सोच" का समय बढ़ाने के लिए एक चतुर चाल भी चली—उन्होंने इसे बस "इंतजार" करने के लिए कहा। पत्र के अनुसार, s1 की रीजनिंग प्रक्रिया के दौरान इस शब्द को जोड़ने से इसे थोड़ा अधिक सटीक जवाब देने में मदद मिली।
2025 की ओर देखते हुए, Meta, Google, और Microsoft जैसे तकनीकी दिग्गज AI बुनियादी ढांचे में सैकड़ों अरबों डॉलर निवेश करने के लिए तैयार हैं, जिनमें से अधिकांश अगली पीढ़ी के AI मॉडलों को प्रशिक्षित करने में जाएगा। हालांकि डिस्टिलेशन AI क्षमताओं को सस्ते में फिर से बनाने का एक प्रभावी तरीका साबित होता है, लेकिन यह जल्द ही बिल्कुल नए, अभूतपूर्व AI मॉडलों के निर्माण की ओर नहीं ले जाएगा।



Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔




Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀




s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀












