विकल्प
घर
समाचार
हाई स्कूल के छात्र AI Minecraft बिल्ड-ऑफ चुनौतियों के लिए वेबसाइट बनाते हैं

हाई स्कूल के छात्र AI Minecraft बिल्ड-ऑफ चुनौतियों के लिए वेबसाइट बनाते हैं

18 अप्रैल 2025
119

माइनक्राफ्ट के साथ रचनात्मक AI बेंचमार्किंग

चूंकि पारंपरिक AI बेंचमार्किंग विधियां कम पड़ रही हैं, डेवलपर्स जनरेटिव AI मॉडलों की क्षमता का मूल्यांकन करने के लिए नवीन दृष्टिकोणों की खोज कर रहे हैं। ऐसा ही एक रचनात्मक तरीका माइनक्राफ्ट, माइक्रोसॉफ्ट के स्वामित्व वाला लोकप्रिय सैंडबॉक्स गेम, का उपयोग करना है। डेवलपर्स के एक समूह ने माइनक्राफ्ट बेंचमार्क, या MC-बेंच, शुरू किया है, जो एक ऐसा मंच है जहां AI मॉडल दिए गए संकेतों के आधार पर माइनक्राफ्ट निर्माण में प्रतिस्पर्धा करते हैं।

MC-बेंच पर, उपयोगकर्ता यह वोट कर सकते हैं कि उन्हें किस AI मॉडल का निर्माण पसंद है, और वोट देने के बाद ही उन्हें पता चलता है कि प्रत्येक निर्माण किस मॉडल ने बनाया। यह इंटरैक्टिव दृष्टिकोण न केवल समुदाय को जोड़ता है बल्कि AI क्षमताओं का मूल्यांकन करने का एक अनूठा तरीका भी प्रदान करता है।

छवि साभार: माइनक्राफ्ट बेंचमार्क

छवि साभार: माइनक्राफ्ट बेंचमार्क

आदि सिंह, 12वीं कक्षा के छात्र और MC-बेंच के प्रारंभकर्ता, मानते हैं कि माइनक्राफ्ट की व्यापक पहचान इसकी कुंजी है। अब तक का सबसे अधिक बिकने वाला वीडियो गेम होने के नाते, यह कई लोगों के लिए परिचित है, जिससे लोगों के लिए AI-जनरेटेड निर्माणों की गुणवत्ता का आकलन करना आसान हो जाता है, भले ही उन्होंने स्वयं गेम न खेला हो। "माइनक्राफ्ट लोगों को AI विकास की प्रगति को बहुत आसानी से देखने की अनुमति देता है," सिंह ने टेकक्रंच को बताया। "लोग माइनक्राफ्ट के आदी हैं, इसके लुक और माहौल के आदी हैं।"

MC-बेंच को आठ स्वयंसेवी योगदानकर्ताओं की एक टीम द्वारा समर्थित किया जाता है। Anthropic, Google, OpenAI, और Alibaba जैसी कंपनियों ने बेंचमार्क संकेतों को चलाने के लिए अपने उत्पाद प्रदान किए हैं, हालांकि वे इस परियोजना में अन्यथा शामिल नहीं हैं।

सिंह MC-बेंच को साधारण निर्माणों से परे अधिक जटिल, लक्ष्य-उन्मुख कार्यों तक विस्तार करने की कल्पना करते हैं। "गेम्स शायद एक ऐसा माध्यम हो सकते हैं जो वास्तविक जीवन की तुलना में सुरक्षित और परीक्षण के उद्देश्यों के लिए अधिक नियंत्रणीय हो, जिससे यह मेरी नजर में अधिक आदर्श बनता है," उन्होंने कहा।

अन्य गेम्स के रूप में AI बेंचमार्क्स

माइनक्राफ्ट के अलावा, पोकेमॉन रेड, स्ट्रीट फाइटर, और पिक्शनरी जैसे अन्य गेम्स को AI के लिए प्रायोगिक बेंचमार्क्स के रूप में उपयोग किया गया है। AI बेंचमार्किंग की चुनौती इसकी जटिलता में निहित है, क्योंकि पारंपरिक मानकीकृत परीक्षण अक्सर AI मॉडलों को पक्षपात करते हैं, जो उनकी प्रशिक्षण विधियों के कारण, रटे हुए स्मरण या बुनियादी अनुमान जैसे संकीर्ण समस्या-समाधान क्षेत्रों में उत्कृष्टता प्राप्त करते हैं।

उदाहरण के लिए, जबकि OpenAI का GPT-4 LSAT पर 88वें प्रतिशत में स्कोर कर सकता है, यह "स्ट्रॉबेरी" में R की संख्या गिनने जैसे सरल कार्यों में संघर्ष करता है। इसी तरह, Anthropic का Claude 3.7 Sonnet एक सॉफ्टवेयर इंजीनियरिंग बेंचमार्क पर 62.3% सटीकता प्राप्त करता है, लेकिन पोकेमॉन खेलने में अधिकांश पांच साल के बच्चों की तुलना में कम पड़ता है।

छवि साभार: माइनक्राफ्ट बेंचमार्क

छवि साभार: माइनक्राफ्ट बेंचमार्क

MC-बेंच: सिर्फ एक प्रोग्रामिंग बेंचमार्क से अधिक

तकनीकी रूप से, MC-बेंच एक प्रोग्रामिंग बेंचमार्क है क्योंकि इसके लिए AI मॉडलों को "फ्रॉस्टी द स्नोमैन" या "एक प्राचीन रेतीले तट पर एक आकर्षक उष्णकटिबंधीय झोपड़ी" जैसे निर्माणों को बनाने के लिए कोड लिखना पड़ता है। हालांकि, इस मंच की अपील इसकी पहुंच में निहित है। उपयोगकर्ताओं के लिए निर्माण की दृश्य गुणवत्ता का मूल्यांकन करना कोड का विश्लेषण करने की तुलना में आसान है, जो परियोजना की पहुंच और मॉडल प्रदर्शन पर डेटा संग्रह की संभावना को व्यापक बनाता है।

यह बहस जारी है कि क्या ये स्कोर वास्तव में AI की उपयोगिता को दर्शाते हैं। हालांकि, सिंह मानते हैं कि ये एक मजबूत संकेतक हैं। "वर्तमान लीडरबोर्ड मेरे अपने इन मॉडलों के उपयोग के अनुभव को काफी करीब से दर्शाता है, जो कि कई शुद्ध टेक्स्ट बेंचमार्क्स के विपरीत है," उन्होंने कहा। "शायद [MC-बेंच] कंपनियों के लिए यह जानने में उपयोगी हो सकता है कि क्या वे सही दिशा में जा रहे हैं।"

संबंधित लेख
अमेज़न ने उन्नत AI क्षमताओं के साथ Alexa+ का प्रदर्शन किया अमेज़न ने उन्नत AI क्षमताओं के साथ Alexa+ का प्रदर्शन किया न्यूयॉर्क में बुधवार को आयोजित एक कार्यक्रम में, अमेज़न ने उन्नत Alexa+ अनुभव प्रस्तुत किया, जो अत्याधुनिक जेनरेटिव AI तकनीक द्वारा संचालित है। अमेज़न के डिवाइस और सेवाओं के प्रमुख, पैनोस पनाय ने इसे
2025 में AI टूल्स के साथ वायरल चैट स्टोरी वीडियो बनाने की गाइड 2025 में AI टूल्स के साथ वायरल चैट स्टोरी वीडियो बनाने की गाइड सोशल मीडिया के गतिशील क्षेत्र में, आकर्षक सामग्री बनाना दर्शकों का ध्यान आकर्षित करने और मजबूत ऑनलाइन उपस्थिति स्थापित करने के लिए आवश्यक है। चैट स्टोरी वीडियो की लोकप्रियता में तेजी आई है, विशेष रूप
Google ने यूरोपीय संघ के AI अभ्यास संहिता के प्रति प्रतिबद्धता जताई, उद्योग में बहस के बीच Google ने यूरोपीय संघ के AI अभ्यास संहिता के प्रति प्रतिबद्धता जताई, उद्योग में बहस के बीच Google ने यूरोपीय संघ की स्वैच्छिक AI अभ्यास संहिता को अपनाने का वचन दिया है, जो एक ऐसा ढांचा है जो AI डेवलपर्स को EU के AI अधिनियम के अनुरूप प्रक्रियाओं और प्रणालियों को लागू करने में सहायता करने के
सूचना (21)
BenGarcía
BenGarcía 4 अगस्त 2025 11:31:00 पूर्वाह्न IST

This high school kid building an AI Minecraft challenge site is wild! 🤯 I love how Minecraft’s open world is being used to test AI creativity. Wonder if we’ll see AI build epic castles or just glitchy dirt huts? 🏰

GregoryJones
GregoryJones 21 अप्रैल 2025 2:32:52 पूर्वाह्न IST

マインクラフトでAIの性能を評価するなんて面白いアイデアだね!ただ、AIの建築物が時々変な感じになるのが残念。でも全体的に見て、すごいと思うよ!高校生が作ったなんて信じられない!😲

JonathanKing
JonathanKing 20 अप्रैल 2025 2:12:35 अपराह्न IST

¡Usar Minecraft para evaluar AI es una idea genial! Es como ver a los modelos de AI compitiendo en un mundo virtual. Lo único malo es que a veces las construcciones son demasiado simples, pero en general es fantástico. ¡Sigan así! 😄

RalphHill
RalphHill 20 अप्रैल 2025 9:11:36 पूर्वाह्न IST

Usar o Minecraft para testar AI é uma ideia incrível! Parece que estamos assistindo a uma competição de AI em um mundo virtual. A única coisa ruim é que às vezes as construções são muito simples, mas no geral é fantástico! Continuem o bom trabalho! 😊

CharlesThomas
CharlesThomas 20 अप्रैल 2025 4:19:16 पूर्वाह्न IST

マインクラフトを使ったAIのベンチマーク、面白いですね!ゲームがAIのテストに使われるなんて、まるでAI同士が仮想世界で競っているみたい。ただ、時々ビルドがシンプルすぎるのが残念。でも全体的に素晴らしいアイデアだと思います!👍

KennethLee
KennethLee 20 अप्रैल 2025 3:28:54 पूर्वाह्न IST

This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮

शीर्ष समाचार
GEMINI 2.5 प्रो अब असीमित और सस्ता क्लाउड की तुलना में सस्ता, GPT-4O 2025 के शीर्ष AI वीडियो जनरेटर: Pika Labs बनाम विकल्प एआई वॉयसओवर: रियलिस्टिक वॉयस क्रिएशन का अल्टीमेट गाइड Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है यूएस डेटा सेंटर के लिए ट्वीक्स 76 GW नई बिजली क्षमता को अनलॉक कर सकते हैं एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं AI वोइस क्लोनिंग: वोइस कनवर्सन में पकड़ हासिल करने का अंतिम गाइड एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया
अधिक
शीर्ष पर वापस
OR