शोधकर्ताओं ने $ 50 के तहत Openai के $ 50 'रीजनिंग' मॉडल के लिए ओपन-सोर्स प्रतिद्वंद्वी विकसित किया

पिछले शुक्रवार को, स्टैनफोर्ड और वाशिंगटन विश्वविद्यालय के एआई विशेषज्ञों के एक ग्राउंडब्रेकिंग शोध पत्र ने इस दृश्य को मारा, जिससे पता चलता है कि वे क्लाउड कम्प्यूट क्रेडिट में $ 50 से कम के लिए एस 1 के लिए एआई "रीजनिंग" मॉडल विकसित करने में कामयाब रहे। यह रहस्योद्घाटन एआई दुनिया को हिला रहा है, क्योंकि एस 1 ओपनईआई के ओ 1 और डीपसेक के आर 1 जैसे शीर्ष-स्तरीय मॉडल के खिलाफ अपने आप को रखता है जब यह गणित और कोडिंग चुनौतियों से निपटने की बात आती है।
S1 मॉडल, इसके प्रशिक्षण डेटा और कोड के सभी रसदार विवरणों के साथ, अब GitHub पर कब्रों के लिए है। टीम ने एक रन-ऑफ-द-मिल बेस मॉडल के साथ चीजों को बंद कर दिया और फिर इसे डिस्टिलेशन नामक एक तकनीक के साथ रिंगर के माध्यम से रखा। इस प्रक्रिया में अपनी प्रतिक्रियाओं पर प्रशिक्षण द्वारा एक और एआई मॉडल से "तर्क" रस को निचोड़ना शामिल है। इस मामले में, S1 को Google के मिथुन 2.0 फ्लैश थिंकिंग प्रायोगिक मॉडल से अपने स्मार्ट मिले। यह एक समान रणनीति है कि बर्कले के शोधकर्ताओं ने पिछले महीने ही $ 450 के लिए अपने स्वयं के एआई रीजनिंग मॉडल को कोड़ा मारने के लिए क्या इस्तेमाल किया था।
कुछ के लिए, यह विचार कि शोधकर्ताओं की एक छोटी टीम अभी भी बड़े पैमाने पर बजट के बिना एआई क्षेत्र में लहरें बना सकती है, रोमांचकारी है। लेकिन S1 का उद्भव भी AI मॉडल के विकास के भविष्य के बारे में कुछ गंभीर सवालों को जन्म देता है। यदि एक मॉडल जो लाखों लोगों के साथ बनाए गए प्रतिद्वंद्वियों को एक शॉस्ट्रिंग बजट पर दोहराया जा सकता है, तो सभी को भी ऐसा करने से रोकने के लिए क्या है?
आश्चर्य नहीं कि एआई में बड़े खिलाड़ी रोमांचित नहीं हैं। उदाहरण के लिए, Openai ने डीपसेक में उंगलियों को इंगित किया है, उन पर उनके एपीआई डेटा का उपयोग करने का आरोप लगाया है जो मॉडल आसवन को ईंधन देने के लिए है। इस बीच, S1 टीम ठोस तर्क प्रदर्शन और "टेस्ट-टाइम स्केलिंग" नामक कुछ को प्राप्त करने के लिए सबसे सीधा तरीका खोजने पर केंद्रित थी, जहां एक AI मॉडल को जवाब देने से पहले सोचने के लिए अधिक समय मिलता है। ये वही नवाचार हैं जो Openai के O1 मॉडल को टेबल पर लाया गया था, जिसे दीपसेक जैसे अन्य लोगों ने अपने तरीकों से नकल करने की कोशिश की है।
S1 पेपर बताता है कि आप एक अपेक्षाकृत छोटे डेटासेट के साथ तर्क मॉडल को डिस्टिल कर सकते हैं, जिसे पर्यवेक्षित फाइन-ट्यूनिंग (SFT) के रूप में जाना जाता है। इसमें एआई मॉडल को एक डेटासेट से विशिष्ट व्यवहारों को कॉपी करने के लिए प्रशिक्षित करना शामिल है, और यह बड़े पैमाने पर सुदृढीकरण सीखने की तुलना में सस्ता है जो कि डीपसेक अपने आर 1 मॉडल के लिए उपयोग किया जाता है, जो ओपनईएआई के ओ 1 के साथ प्रतिस्पर्धा करता है।
Google अपने Google AI स्टूडियो प्लेटफॉर्म के माध्यम से मुफ्त में उपलब्ध मिथुन 2.0 फ्लैश थिंकिंग प्रायोगिक बनाता है, हालांकि दैनिक सीमा के साथ। लेकिन एक कैच है-Google की शर्तें प्रतिस्पर्धी सेवाओं को बनाने के लिए अपने मॉडल को रिवर्स-इंजीनियरिंग करने की अनुमति नहीं देती हैं। हम इस पर Google से वापस सुनने के लिए इंतजार कर रहे हैं।
S1 मॉडल ने अलीबाबा के क्यूवेन लैब से एक मामूली, ऑफ-द-शेल्फ एआई मॉडल के रूप में जीवन शुरू किया, जिसे कोई भी मुफ्त में डाउनलोड कर सकता है। S1 को प्रशिक्षित करने के लिए, शोधकर्ताओं ने Google के मिथुन 2.0 के सौजन्य से, उत्तर और प्रत्येक एक के पीछे "सोच" प्रक्रिया के साथ -साथ केवल 1,000 ध्यान से चुने गए प्रश्नों का एक डेटासेट रखा। पूरे प्रशिक्षण प्रक्रिया में 16 NVIDIA H100 GPU पर 30 मिनट से कम समय लगा। परियोजना में शामिल एक स्टैनफोर्ड शोधकर्ता निक्लस मुनीघॉफ के अनुसार, आप आज इसे कम्प्यूट लागत में लगभग $ 20 के लिए खींच सकते हैं।
शोधकर्ताओं ने S1 को अपना काम करने के लिए एक चतुर कदम भी खींचा और अपने "सोच" समय का विस्तार किया-उन्होंने बस इसे "प्रतीक्षा" करने के लिए कहा था। S1 के तर्क प्रक्रिया के दौरान इस शब्द को जोड़ने से पेपर के अनुसार, इसे थोड़ा अधिक सटीक उत्तरों के साथ आने में मदद मिली।
2025 के लिए आगे देखते हुए, मेटा, Google और Microsoft जैसे तकनीकी दिग्गजों को AI इन्फ्रास्ट्रक्चर में सैकड़ों अरबों को डालने के लिए सेट किया गया है, जिनमें से अधिकांश AI मॉडल की अगली लहर को प्रशिक्षित करने की ओर जाएंगे। जबकि आसवन सस्ते पर एआई क्षमताओं को फिर से बनाने के लिए एक प्रभावी तरीका साबित होता है, यह जल्द ही कभी भी एआई मॉडल को ब्रांड-नए, ग्राउंडब्रेकिंग के निर्माण के लिए नेतृत्व करने वाला नहीं है।
संबंधित लेख
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準
為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權
Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
सूचना (5)
0/200
HarryRoberts
23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
DonaldGonzález
23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
GregoryAdams
22 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀
0
JackPerez
21 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀
0
HenryWalker
23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
पिछले शुक्रवार को, स्टैनफोर्ड और वाशिंगटन विश्वविद्यालय के एआई विशेषज्ञों के एक ग्राउंडब्रेकिंग शोध पत्र ने इस दृश्य को मारा, जिससे पता चलता है कि वे क्लाउड कम्प्यूट क्रेडिट में $ 50 से कम के लिए एस 1 के लिए एआई "रीजनिंग" मॉडल विकसित करने में कामयाब रहे। यह रहस्योद्घाटन एआई दुनिया को हिला रहा है, क्योंकि एस 1 ओपनईआई के ओ 1 और डीपसेक के आर 1 जैसे शीर्ष-स्तरीय मॉडल के खिलाफ अपने आप को रखता है जब यह गणित और कोडिंग चुनौतियों से निपटने की बात आती है।
S1 मॉडल, इसके प्रशिक्षण डेटा और कोड के सभी रसदार विवरणों के साथ, अब GitHub पर कब्रों के लिए है। टीम ने एक रन-ऑफ-द-मिल बेस मॉडल के साथ चीजों को बंद कर दिया और फिर इसे डिस्टिलेशन नामक एक तकनीक के साथ रिंगर के माध्यम से रखा। इस प्रक्रिया में अपनी प्रतिक्रियाओं पर प्रशिक्षण द्वारा एक और एआई मॉडल से "तर्क" रस को निचोड़ना शामिल है। इस मामले में, S1 को Google के मिथुन 2.0 फ्लैश थिंकिंग प्रायोगिक मॉडल से अपने स्मार्ट मिले। यह एक समान रणनीति है कि बर्कले के शोधकर्ताओं ने पिछले महीने ही $ 450 के लिए अपने स्वयं के एआई रीजनिंग मॉडल को कोड़ा मारने के लिए क्या इस्तेमाल किया था।
कुछ के लिए, यह विचार कि शोधकर्ताओं की एक छोटी टीम अभी भी बड़े पैमाने पर बजट के बिना एआई क्षेत्र में लहरें बना सकती है, रोमांचकारी है। लेकिन S1 का उद्भव भी AI मॉडल के विकास के भविष्य के बारे में कुछ गंभीर सवालों को जन्म देता है। यदि एक मॉडल जो लाखों लोगों के साथ बनाए गए प्रतिद्वंद्वियों को एक शॉस्ट्रिंग बजट पर दोहराया जा सकता है, तो सभी को भी ऐसा करने से रोकने के लिए क्या है?
आश्चर्य नहीं कि एआई में बड़े खिलाड़ी रोमांचित नहीं हैं। उदाहरण के लिए, Openai ने डीपसेक में उंगलियों को इंगित किया है, उन पर उनके एपीआई डेटा का उपयोग करने का आरोप लगाया है जो मॉडल आसवन को ईंधन देने के लिए है। इस बीच, S1 टीम ठोस तर्क प्रदर्शन और "टेस्ट-टाइम स्केलिंग" नामक कुछ को प्राप्त करने के लिए सबसे सीधा तरीका खोजने पर केंद्रित थी, जहां एक AI मॉडल को जवाब देने से पहले सोचने के लिए अधिक समय मिलता है। ये वही नवाचार हैं जो Openai के O1 मॉडल को टेबल पर लाया गया था, जिसे दीपसेक जैसे अन्य लोगों ने अपने तरीकों से नकल करने की कोशिश की है।
S1 पेपर बताता है कि आप एक अपेक्षाकृत छोटे डेटासेट के साथ तर्क मॉडल को डिस्टिल कर सकते हैं, जिसे पर्यवेक्षित फाइन-ट्यूनिंग (SFT) के रूप में जाना जाता है। इसमें एआई मॉडल को एक डेटासेट से विशिष्ट व्यवहारों को कॉपी करने के लिए प्रशिक्षित करना शामिल है, और यह बड़े पैमाने पर सुदृढीकरण सीखने की तुलना में सस्ता है जो कि डीपसेक अपने आर 1 मॉडल के लिए उपयोग किया जाता है, जो ओपनईएआई के ओ 1 के साथ प्रतिस्पर्धा करता है।
Google अपने Google AI स्टूडियो प्लेटफॉर्म के माध्यम से मुफ्त में उपलब्ध मिथुन 2.0 फ्लैश थिंकिंग प्रायोगिक बनाता है, हालांकि दैनिक सीमा के साथ। लेकिन एक कैच है-Google की शर्तें प्रतिस्पर्धी सेवाओं को बनाने के लिए अपने मॉडल को रिवर्स-इंजीनियरिंग करने की अनुमति नहीं देती हैं। हम इस पर Google से वापस सुनने के लिए इंतजार कर रहे हैं।
S1 मॉडल ने अलीबाबा के क्यूवेन लैब से एक मामूली, ऑफ-द-शेल्फ एआई मॉडल के रूप में जीवन शुरू किया, जिसे कोई भी मुफ्त में डाउनलोड कर सकता है। S1 को प्रशिक्षित करने के लिए, शोधकर्ताओं ने Google के मिथुन 2.0 के सौजन्य से, उत्तर और प्रत्येक एक के पीछे "सोच" प्रक्रिया के साथ -साथ केवल 1,000 ध्यान से चुने गए प्रश्नों का एक डेटासेट रखा। पूरे प्रशिक्षण प्रक्रिया में 16 NVIDIA H100 GPU पर 30 मिनट से कम समय लगा। परियोजना में शामिल एक स्टैनफोर्ड शोधकर्ता निक्लस मुनीघॉफ के अनुसार, आप आज इसे कम्प्यूट लागत में लगभग $ 20 के लिए खींच सकते हैं।
शोधकर्ताओं ने S1 को अपना काम करने के लिए एक चतुर कदम भी खींचा और अपने "सोच" समय का विस्तार किया-उन्होंने बस इसे "प्रतीक्षा" करने के लिए कहा था। S1 के तर्क प्रक्रिया के दौरान इस शब्द को जोड़ने से पेपर के अनुसार, इसे थोड़ा अधिक सटीक उत्तरों के साथ आने में मदद मिली।
2025 के लिए आगे देखते हुए, मेटा, Google और Microsoft जैसे तकनीकी दिग्गजों को AI इन्फ्रास्ट्रक्चर में सैकड़ों अरबों को डालने के लिए सेट किया गया है, जिनमें से अधिकांश AI मॉडल की अगली लहर को प्रशिक्षित करने की ओर जाएंगे। जबकि आसवन सस्ते पर एआई क्षमताओं को फिर से बनाने के लिए एक प्रभावी तरीका साबित होता है, यह जल्द ही कभी भी एआई मॉडल को ब्रांड-नए, ग्राउंडब्रेकिंग के निर्माण के लिए नेतृत्व करने वाला नहीं है।




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀




O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀












