विकल्प
घर
समाचार
शोधकर्ताओं ने $ 50 के तहत Openai के $ 50 'रीजनिंग' मॉडल के लिए ओपन-सोर्स प्रतिद्वंद्वी विकसित किया

शोधकर्ताओं ने $ 50 के तहत Openai के $ 50 'रीजनिंग' मॉडल के लिए ओपन-सोर्स प्रतिद्वंद्वी विकसित किया

21 अप्रैल 2025
93

शोधकर्ताओं ने $ 50 के तहत Openai के $ 50 'रीजनिंग' मॉडल के लिए ओपन-सोर्स प्रतिद्वंद्वी विकसित किया

पिछले शुक्रवार को, स्टैनफोर्ड और वाशिंगटन विश्वविद्यालय के एआई विशेषज्ञों के एक ग्राउंडब्रेकिंग शोध पत्र ने इस दृश्य को मारा, जिससे पता चलता है कि वे क्लाउड कम्प्यूट क्रेडिट में $ 50 से कम के लिए एस 1 के लिए एआई "रीजनिंग" मॉडल विकसित करने में कामयाब रहे। यह रहस्योद्घाटन एआई दुनिया को हिला रहा है, क्योंकि एस 1 ओपनईआई के ओ 1 और डीपसेक के आर 1 जैसे शीर्ष-स्तरीय मॉडल के खिलाफ अपने आप को रखता है जब यह गणित और कोडिंग चुनौतियों से निपटने की बात आती है।

S1 मॉडल, इसके प्रशिक्षण डेटा और कोड के सभी रसदार विवरणों के साथ, अब GitHub पर कब्रों के लिए है। टीम ने एक रन-ऑफ-द-मिल बेस मॉडल के साथ चीजों को बंद कर दिया और फिर इसे डिस्टिलेशन नामक एक तकनीक के साथ रिंगर के माध्यम से रखा। इस प्रक्रिया में अपनी प्रतिक्रियाओं पर प्रशिक्षण द्वारा एक और एआई मॉडल से "तर्क" रस को निचोड़ना शामिल है। इस मामले में, S1 को Google के मिथुन 2.0 फ्लैश थिंकिंग प्रायोगिक मॉडल से अपने स्मार्ट मिले। यह एक समान रणनीति है कि बर्कले के शोधकर्ताओं ने पिछले महीने ही $ 450 के लिए अपने स्वयं के एआई रीजनिंग मॉडल को कोड़ा मारने के लिए क्या इस्तेमाल किया था।

कुछ के लिए, यह विचार कि शोधकर्ताओं की एक छोटी टीम अभी भी बड़े पैमाने पर बजट के बिना एआई क्षेत्र में लहरें बना सकती है, रोमांचकारी है। लेकिन S1 का उद्भव भी AI मॉडल के विकास के भविष्य के बारे में कुछ गंभीर सवालों को जन्म देता है। यदि एक मॉडल जो लाखों लोगों के साथ बनाए गए प्रतिद्वंद्वियों को एक शॉस्ट्रिंग बजट पर दोहराया जा सकता है, तो सभी को भी ऐसा करने से रोकने के लिए क्या है?

आश्चर्य नहीं कि एआई में बड़े खिलाड़ी रोमांचित नहीं हैं। उदाहरण के लिए, Openai ने डीपसेक में उंगलियों को इंगित किया है, उन पर उनके एपीआई डेटा का उपयोग करने का आरोप लगाया है जो मॉडल आसवन को ईंधन देने के लिए है। इस बीच, S1 टीम ठोस तर्क प्रदर्शन और "टेस्ट-टाइम स्केलिंग" नामक कुछ को प्राप्त करने के लिए सबसे सीधा तरीका खोजने पर केंद्रित थी, जहां एक AI मॉडल को जवाब देने से पहले सोचने के लिए अधिक समय मिलता है। ये वही नवाचार हैं जो Openai के O1 मॉडल को टेबल पर लाया गया था, जिसे दीपसेक जैसे अन्य लोगों ने अपने तरीकों से नकल करने की कोशिश की है।

S1 पेपर बताता है कि आप एक अपेक्षाकृत छोटे डेटासेट के साथ तर्क मॉडल को डिस्टिल कर सकते हैं, जिसे पर्यवेक्षित फाइन-ट्यूनिंग (SFT) के रूप में जाना जाता है। इसमें एआई मॉडल को एक डेटासेट से विशिष्ट व्यवहारों को कॉपी करने के लिए प्रशिक्षित करना शामिल है, और यह बड़े पैमाने पर सुदृढीकरण सीखने की तुलना में सस्ता है जो कि डीपसेक अपने आर 1 मॉडल के लिए उपयोग किया जाता है, जो ओपनईएआई के ओ 1 के साथ प्रतिस्पर्धा करता है।

Google अपने Google AI स्टूडियो प्लेटफॉर्म के माध्यम से मुफ्त में उपलब्ध मिथुन 2.0 फ्लैश थिंकिंग प्रायोगिक बनाता है, हालांकि दैनिक सीमा के साथ। लेकिन एक कैच है-Google की शर्तें प्रतिस्पर्धी सेवाओं को बनाने के लिए अपने मॉडल को रिवर्स-इंजीनियरिंग करने की अनुमति नहीं देती हैं। हम इस पर Google से वापस सुनने के लिए इंतजार कर रहे हैं।

S1 मॉडल ने अलीबाबा के क्यूवेन लैब से एक मामूली, ऑफ-द-शेल्फ एआई मॉडल के रूप में जीवन शुरू किया, जिसे कोई भी मुफ्त में डाउनलोड कर सकता है। S1 को प्रशिक्षित करने के लिए, शोधकर्ताओं ने Google के मिथुन 2.0 के सौजन्य से, उत्तर और प्रत्येक एक के पीछे "सोच" प्रक्रिया के साथ -साथ केवल 1,000 ध्यान से चुने गए प्रश्नों का एक डेटासेट रखा। पूरे प्रशिक्षण प्रक्रिया में 16 NVIDIA H100 GPU पर 30 मिनट से कम समय लगा। परियोजना में शामिल एक स्टैनफोर्ड शोधकर्ता निक्लस मुनीघॉफ के अनुसार, आप आज इसे कम्प्यूट लागत में लगभग $ 20 के लिए खींच सकते हैं।

शोधकर्ताओं ने S1 को अपना काम करने के लिए एक चतुर कदम भी खींचा और अपने "सोच" समय का विस्तार किया-उन्होंने बस इसे "प्रतीक्षा" करने के लिए कहा था। S1 के तर्क प्रक्रिया के दौरान इस शब्द को जोड़ने से पेपर के अनुसार, इसे थोड़ा अधिक सटीक उत्तरों के साथ आने में मदद मिली।

2025 के लिए आगे देखते हुए, मेटा, Google और Microsoft जैसे तकनीकी दिग्गजों को AI इन्फ्रास्ट्रक्चर में सैकड़ों अरबों को डालने के लिए सेट किया गया है, जिनमें से अधिकांश AI मॉडल की अगली लहर को प्रशिक्षित करने की ओर जाएंगे। जबकि आसवन सस्ते पर एआई क्षमताओं को फिर से बनाने के लिए एक प्रभावी तरीका साबित होता है, यह जल्द ही कभी भी एआई मॉडल को ब्रांड-नए, ग्राउंडब्रेकिंग के निर्माण के लिए नेतृत्व करने वाला नहीं है।

संबंधित लेख
OpenAI升級其Operator Agent的AI模型 OpenAI升級其Operator Agent的AI模型 OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
सूचना (5)
HarryRoberts
HarryRoberts 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀

DonaldGonzález
DonaldGonzález 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀

GregoryAdams
GregoryAdams 22 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀

JackPerez
JackPerez 21 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀

HenryWalker
HenryWalker 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀

शीर्ष समाचार
Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया दक्षिण कोरिया स्थानीय दुकानों में दीपसेक ऐप डाउनलोड करता है Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें चैट की ऊर्जा का उपयोग अपेक्षा से कम है Openai का O3 मॉडल संभावित रूप से अधिक महंगा है जो शुरू में विचार की तुलना में संचालित होता है नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है
अधिक
शीर्ष पर वापस
OR