घर

समाचार

शोधकर्ताओं ने $ 50 के तहत Openai के $ 50 'रीजनिंग' मॉडल के लिए ओपन-सोर्स प्रतिद्वंद्वी विकसित किया

शोधकर्ताओं ने $ 50 के तहत Openai के $ 50 'रीजनिंग' मॉडल के लिए ओपन-सोर्स प्रतिद्वंद्वी विकसित किया

21 अप्रैल 2025

JosephWalker

139

# openai # DeepSeek

पिछले शुक्रवार को, स्टैनफोर्ड और वाशिंगटन विश्वविद्यालय के AI विशेषज्ञों से एक अभूतपूर्व शोध पत्र प्रकाशित हुआ, जिसमें खुलासा हुआ कि उन्होंने क्लाउड कंप्यूट क्रेडिट में $50 से कम में एक AI "रीजनिंग" मॉडल, जिसे s1 नाम दिया गया, विकसित किया। यह खुलासा AI दुनिया में हलचल मचा रहा है, क्योंकि s1 गणित और कोडिंग चुनौतियों से निपटने में OpenAI के o1 और DeepSeek के R1 जैसे शीर्ष मॉडलों के साथ मुकाबला करता है।

s1 मॉडल, इसके प्रशिक्षण डेटा और कोड के सभी रोमांचक विवरणों के साथ, अब GitHub पर उपलब्ध है। टीम ने एक सामान्य आधार मॉडल से शुरुआत की और फिर इसे डिस्टिलेशन नामक तकनीक के माध्यम से कठिन परीक्षा में डाला। इस प्रक्रिया में किसी अन्य AI मॉडल के जवाबों पर प्रशिक्षण देकर उसका "रीजनिंग" निचोड़ लिया जाता है। इस मामले में, s1 ने Google के Gemini 2.0 Flash Thinking Experimental मॉडल से अपनी बुद्धिमत्ता हासिल की। यह वही रणनीति है जो बर्कले के शोधकर्ताओं ने पिछले महीने लगभग $450 में अपना AI रीजनिंग मॉडल तैयार करने के लिए इस्तेमाल की थी।

कुछ लोगों के लिए, यह विचार कि शोधकर्ताओं की एक छोटी टीम बिना भारी बजट के AI क्षेत्र में हलचल मचा सकती है, रोमांचक है। लेकिन s1 का उदय AI मॉडल विकास के भविष्य के बारे में कुछ गंभीर सवाल भी उठाता है। अगर लाखों की लागत से बने मॉडलों को कम बजट में दोहराया जा सकता है, तो हर कोई ऐसा करने से क्या रुकेगा?

आश्चर्य की बात नहीं है कि AI के बड़े खिलाड़ी इससे खुश नहीं हैं। उदाहरण के लिए, OpenAI ने DeepSeek पर उंगली उठाई है, उन पर अपने API डेटा का उपयोग मॉडल डिस्टिलेशन के लिए करने का आरोप लगाया है। इस बीच, s1 टीम ने ठोस रीजनिंग प्रदर्शन और "टेस्ट-टाइम स्केलिंग" नामक कुछ हासिल करने का सबसे सीधा तरीका खोजने पर ध्यान केंद्रित किया, जहां एक AI मॉडल को जवाब देने से पहले सोचने के लिए अधिक समय मिलता है। ये वही नवाचार हैं जो OpenAI के o1 मॉडल ने पेश किए थे, जिन्हें DeepSeek जैसे अन्य ने अपनी विधियों के साथ नकल करने की कोशिश की है।

s1 पत्र से पता चलता है कि आप अपेक्षाकृत छोटे डेटासेट का उपयोग करके सुपरवाइज्ड फाइन-ट्यूनिंग (SFT) नामक तकनीक के साथ रीजनिंग मॉडल को डिस्टिल कर सकते हैं। इसमें AI मॉडल को डेटासेट से विशिष्ट व्यवहारों की नकल करने के लिए प्रशिक्षित करना शामिल है, और यह DeepSeek द्वारा अपने R1 मॉडल के लिए उपयोग किए गए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग की तुलना में सस्ता है, जो OpenAI के o1 के साथ मुकाबला करता है।

Google अपने Google AI Studio प्लेटफॉर्म के माध्यम से Gemini 2.0 Flash Thinking Experimental को मुफ्त में उपलब्ध कराता है, हालांकि दैनिक सीमाओं के साथ। लेकिन एक पेंच है—Google की शर्तें इसके मॉडलों को रिवर्स-इंजीनियरिंग करके प्रतिस्पर्धी सेवाएं बनाने की अनुमति नहीं देतीं। हम इस पर Google से जवाब का इंतजार कर रहे हैं।

s1 मॉडल की शुरुआत Alibaba के Qwen लैब से एक साधारण, ऑफ-द-शेल्फ AI मॉडल के रूप में हुई, जिसे कोई भी मुफ्त में डाउनलोड कर सकता है। s1 को प्रशिक्षित करने के लिए, शोधकर्ताओं ने केवल 1,000 सावधानीपूर्वक चुने गए सवालों का एक डेटासेट तैयार किया, जिसमें जवाब और प्रत्येक के पीछे की "सोच" प्रक्रिया शामिल थी, जो Google के Gemini 2.0 की सौजन्य से थी। पूरी प्रशिक्षण प्रक्रिया में 16 Nvidia H100 GPU पर 30 मिनट से कम समय लगा। इस परियोजना में शामिल स्टैनफोर्ड के शोधकर्ता निकलास म्यूनिघॉफ के अनुसार, आप इसे आज लगभग $20 की कंप्यूट लागत में कर सकते हैं।

शोधकर्ताओं ने s1 को अपने काम की दोबारा जांच करने और अपनी "सोच" का समय बढ़ाने के लिए एक चतुर चाल भी चली—उन्होंने इसे बस "इंतजार" करने के लिए कहा। पत्र के अनुसार, s1 की रीजनिंग प्रक्रिया के दौरान इस शब्द को जोड़ने से इसे थोड़ा अधिक सटीक जवाब देने में मदद मिली।

2025 की ओर देखते हुए, Meta, Google, और Microsoft जैसे तकनीकी दिग्गज AI बुनियादी ढांचे में सैकड़ों अरबों डॉलर निवेश करने के लिए तैयार हैं, जिनमें से अधिकांश अगली पीढ़ी के AI मॉडलों को प्रशिक्षित करने में जाएगा। हालांकि डिस्टिलेशन AI क्षमताओं को सस्ते में फिर से बनाने का एक प्रभावी तरीका साबित होता है, लेकिन यह जल्द ही बिल्कुल नए, अभूतपूर्व AI मॉडलों के निर्माण की ओर नहीं ले जाएगा।

संबंधित लेख

Google ने उद्यम बाजार में OpenAI के साथ प्रतिस्पर्धा करने के लिए उत्पादन-तैयार Gemini 2.5 AI मॉडल्स का अनावरण किया Google ने सोमवार को अपनी AI रणनीति को और मजबूत किया, उद्यम उपयोग के लिए अपने उन्नत Gemini 2.5 मॉडल्स को लॉन्च किया और कीमत व प्रदर्शन पर प्रतिस्पर्धा करने के लिए एक लागत-कुशल संस्करण पेश किया।Alphabet

मेटा AI प्रतिभा के लिए उच्च वेतन प्रदान करता है, 100 मिलियन डॉलर के साइनिंग बोनस से इनकार मेटा अपने नए सुपरइंटेलिजेंस लैब में AI शोधकर्ताओं को आकर्षित करने के लिए लाखों डॉलर के मुआवजे पैकेज प्रदान कर रहा है। हालांकि, एक भर्ती किए गए शोधकर्ता और लीक हुई आंतरिक बैठक की टिप्पणियों के अनुसार,

OpenAI मार्केटिंग प्रमुख ने स्तन कैंसर उपचार के लिए छुट्टी ली केट राउच, OpenAI की मार्केटिंग नेता, आक्रामक स्तन कैंसर के उपचार पर ध्यान केंद्रित करने के लिए तीन महीने की छुट्टी ले रही हैं।एक LinkedIn पोस्ट में, राउच ने घोषणा की कि गैरी ब्रिग्स, पूर्व Meta CMO, उ

सूचना (7)

0/200

जमा करना

StevenWilson

8 अगस्त 2025 2:30:59 अपराह्न IST

Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔

BenRoberts

1 अगस्त 2025 8:18:18 पूर्वाह्न IST

Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀

DonaldGonzález

23 अप्रैल 2025 5:15:55 पूर्वाह्न IST

s1モデルが50ドル未満で開発されたなんて信じられない！OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい！🚀

HarryRoberts

23 अप्रैल 2025 4:08:34 पूर्वाह्न IST

This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀

HenryWalker

23 अप्रैल 2025 4:04:07 पूर्वाह्न IST

Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀

GregoryAdams

22 अप्रैल 2025 7:49:22 अपराह्न IST

s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀

शीर्ष समाचार

GEMINI 2.5 प्रो अब असीमित और सस्ता क्लाउड की तुलना में सस्ता, GPT-4O 2025 के शीर्ष AI वीडियो जनरेटर: Pika Labs बनाम विकल्प Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है यूएस डेटा सेंटर के लिए ट्वीक्स 76 GW नई बिजली क्षमता को अनलॉक कर सकते हैं एआई वॉयसओवर: रियलिस्टिक वॉयस क्रिएशन का अल्टीमेट गाइड एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं AI वोइस क्लोनिंग: वोइस कनवर्सन में पकड़ हासिल करने का अंतिम गाइड एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया

अधिक

प्रदर्शित