हाई स्कूल के छात्र AI Minecraft बिल्ड-ऑफ चुनौतियों के लिए वेबसाइट बनाते हैं
माइनक्राफ्ट के साथ रचनात्मक AI बेंचमार्किंग
चूंकि पारंपरिक AI बेंचमार्किंग विधियां कम पड़ रही हैं, डेवलपर्स जनरेटिव AI मॉडलों की क्षमता का मूल्यांकन करने के लिए नवीन दृष्टिकोणों की खोज कर रहे हैं। ऐसा ही एक रचनात्मक तरीका माइनक्राफ्ट, माइक्रोसॉफ्ट के स्वामित्व वाला लोकप्रिय सैंडबॉक्स गेम, का उपयोग करना है। डेवलपर्स के एक समूह ने माइनक्राफ्ट बेंचमार्क, या MC-बेंच, शुरू किया है, जो एक ऐसा मंच है जहां AI मॉडल दिए गए संकेतों के आधार पर माइनक्राफ्ट निर्माण में प्रतिस्पर्धा करते हैं।
MC-बेंच पर, उपयोगकर्ता यह वोट कर सकते हैं कि उन्हें किस AI मॉडल का निर्माण पसंद है, और वोट देने के बाद ही उन्हें पता चलता है कि प्रत्येक निर्माण किस मॉडल ने बनाया। यह इंटरैक्टिव दृष्टिकोण न केवल समुदाय को जोड़ता है बल्कि AI क्षमताओं का मूल्यांकन करने का एक अनूठा तरीका भी प्रदान करता है।

छवि साभार: माइनक्राफ्ट बेंचमार्क आदि सिंह, 12वीं कक्षा के छात्र और MC-बेंच के प्रारंभकर्ता, मानते हैं कि माइनक्राफ्ट की व्यापक पहचान इसकी कुंजी है। अब तक का सबसे अधिक बिकने वाला वीडियो गेम होने के नाते, यह कई लोगों के लिए परिचित है, जिससे लोगों के लिए AI-जनरेटेड निर्माणों की गुणवत्ता का आकलन करना आसान हो जाता है, भले ही उन्होंने स्वयं गेम न खेला हो। "माइनक्राफ्ट लोगों को AI विकास की प्रगति को बहुत आसानी से देखने की अनुमति देता है," सिंह ने टेकक्रंच को बताया। "लोग माइनक्राफ्ट के आदी हैं, इसके लुक और माहौल के आदी हैं।"
MC-बेंच को आठ स्वयंसेवी योगदानकर्ताओं की एक टीम द्वारा समर्थित किया जाता है। Anthropic, Google, OpenAI, और Alibaba जैसी कंपनियों ने बेंचमार्क संकेतों को चलाने के लिए अपने उत्पाद प्रदान किए हैं, हालांकि वे इस परियोजना में अन्यथा शामिल नहीं हैं।
सिंह MC-बेंच को साधारण निर्माणों से परे अधिक जटिल, लक्ष्य-उन्मुख कार्यों तक विस्तार करने की कल्पना करते हैं। "गेम्स शायद एक ऐसा माध्यम हो सकते हैं जो वास्तविक जीवन की तुलना में सुरक्षित और परीक्षण के उद्देश्यों के लिए अधिक नियंत्रणीय हो, जिससे यह मेरी नजर में अधिक आदर्श बनता है," उन्होंने कहा।
अन्य गेम्स के रूप में AI बेंचमार्क्स
माइनक्राफ्ट के अलावा, पोकेमॉन रेड, स्ट्रीट फाइटर, और पिक्शनरी जैसे अन्य गेम्स को AI के लिए प्रायोगिक बेंचमार्क्स के रूप में उपयोग किया गया है। AI बेंचमार्किंग की चुनौती इसकी जटिलता में निहित है, क्योंकि पारंपरिक मानकीकृत परीक्षण अक्सर AI मॉडलों को पक्षपात करते हैं, जो उनकी प्रशिक्षण विधियों के कारण, रटे हुए स्मरण या बुनियादी अनुमान जैसे संकीर्ण समस्या-समाधान क्षेत्रों में उत्कृष्टता प्राप्त करते हैं।
उदाहरण के लिए, जबकि OpenAI का GPT-4 LSAT पर 88वें प्रतिशत में स्कोर कर सकता है, यह "स्ट्रॉबेरी" में R की संख्या गिनने जैसे सरल कार्यों में संघर्ष करता है। इसी तरह, Anthropic का Claude 3.7 Sonnet एक सॉफ्टवेयर इंजीनियरिंग बेंचमार्क पर 62.3% सटीकता प्राप्त करता है, लेकिन पोकेमॉन खेलने में अधिकांश पांच साल के बच्चों की तुलना में कम पड़ता है।

छवि साभार: माइनक्राफ्ट बेंचमार्क MC-बेंच: सिर्फ एक प्रोग्रामिंग बेंचमार्क से अधिक
तकनीकी रूप से, MC-बेंच एक प्रोग्रामिंग बेंचमार्क है क्योंकि इसके लिए AI मॉडलों को "फ्रॉस्टी द स्नोमैन" या "एक प्राचीन रेतीले तट पर एक आकर्षक उष्णकटिबंधीय झोपड़ी" जैसे निर्माणों को बनाने के लिए कोड लिखना पड़ता है। हालांकि, इस मंच की अपील इसकी पहुंच में निहित है। उपयोगकर्ताओं के लिए निर्माण की दृश्य गुणवत्ता का मूल्यांकन करना कोड का विश्लेषण करने की तुलना में आसान है, जो परियोजना की पहुंच और मॉडल प्रदर्शन पर डेटा संग्रह की संभावना को व्यापक बनाता है।
यह बहस जारी है कि क्या ये स्कोर वास्तव में AI की उपयोगिता को दर्शाते हैं। हालांकि, सिंह मानते हैं कि ये एक मजबूत संकेतक हैं। "वर्तमान लीडरबोर्ड मेरे अपने इन मॉडलों के उपयोग के अनुभव को काफी करीब से दर्शाता है, जो कि कई शुद्ध टेक्स्ट बेंचमार्क्स के विपरीत है," उन्होंने कहा। "शायद [MC-बेंच] कंपनियों के लिए यह जानने में उपयोगी हो सकता है कि क्या वे सही दिशा में जा रहे हैं।"
संबंधित लेख
अमेज़न ने उन्नत AI क्षमताओं के साथ Alexa+ का प्रदर्शन किया
न्यूयॉर्क में बुधवार को आयोजित एक कार्यक्रम में, अमेज़न ने उन्नत Alexa+ अनुभव प्रस्तुत किया, जो अत्याधुनिक जेनरेटिव AI तकनीक द्वारा संचालित है। अमेज़न के डिवाइस और सेवाओं के प्रमुख, पैनोस पनाय ने इसे
2025 में AI टूल्स के साथ वायरल चैट स्टोरी वीडियो बनाने की गाइड
सोशल मीडिया के गतिशील क्षेत्र में, आकर्षक सामग्री बनाना दर्शकों का ध्यान आकर्षित करने और मजबूत ऑनलाइन उपस्थिति स्थापित करने के लिए आवश्यक है। चैट स्टोरी वीडियो की लोकप्रियता में तेजी आई है, विशेष रूप
Google ने यूरोपीय संघ के AI अभ्यास संहिता के प्रति प्रतिबद्धता जताई, उद्योग में बहस के बीच
Google ने यूरोपीय संघ की स्वैच्छिक AI अभ्यास संहिता को अपनाने का वचन दिया है, जो एक ऐसा ढांचा है जो AI डेवलपर्स को EU के AI अधिनियम के अनुरूप प्रक्रियाओं और प्रणालियों को लागू करने में सहायता करने के
सूचना (21)
0/200
BenGarcía
4 अगस्त 2025 11:31:00 पूर्वाह्न IST
This high school kid building an AI Minecraft challenge site is wild! 🤯 I love how Minecraft’s open world is being used to test AI creativity. Wonder if we’ll see AI build epic castles or just glitchy dirt huts? 🏰
0
GregoryJones
21 अप्रैल 2025 2:32:52 पूर्वाह्न IST
マインクラフトでAIの性能を評価するなんて面白いアイデアだね!ただ、AIの建築物が時々変な感じになるのが残念。でも全体的に見て、すごいと思うよ!高校生が作ったなんて信じられない!😲
0
JonathanKing
20 अप्रैल 2025 2:12:35 अपराह्न IST
¡Usar Minecraft para evaluar AI es una idea genial! Es como ver a los modelos de AI compitiendo en un mundo virtual. Lo único malo es que a veces las construcciones son demasiado simples, pero en general es fantástico. ¡Sigan así! 😄
0
RalphHill
20 अप्रैल 2025 9:11:36 पूर्वाह्न IST
Usar o Minecraft para testar AI é uma ideia incrível! Parece que estamos assistindo a uma competição de AI em um mundo virtual. A única coisa ruim é que às vezes as construções são muito simples, mas no geral é fantástico! Continuem o bom trabalho! 😊
0
CharlesThomas
20 अप्रैल 2025 4:19:16 पूर्वाह्न IST
マインクラフトを使ったAIのベンチマーク、面白いですね!ゲームがAIのテストに使われるなんて、まるでAI同士が仮想世界で競っているみたい。ただ、時々ビルドがシンプルすぎるのが残念。でも全体的に素晴らしいアイデアだと思います!👍
0
KennethLee
20 अप्रैल 2025 3:28:54 पूर्वाह्न IST
This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮
0
माइनक्राफ्ट के साथ रचनात्मक AI बेंचमार्किंग
चूंकि पारंपरिक AI बेंचमार्किंग विधियां कम पड़ रही हैं, डेवलपर्स जनरेटिव AI मॉडलों की क्षमता का मूल्यांकन करने के लिए नवीन दृष्टिकोणों की खोज कर रहे हैं। ऐसा ही एक रचनात्मक तरीका माइनक्राफ्ट, माइक्रोसॉफ्ट के स्वामित्व वाला लोकप्रिय सैंडबॉक्स गेम, का उपयोग करना है। डेवलपर्स के एक समूह ने माइनक्राफ्ट बेंचमार्क, या MC-बेंच, शुरू किया है, जो एक ऐसा मंच है जहां AI मॉडल दिए गए संकेतों के आधार पर माइनक्राफ्ट निर्माण में प्रतिस्पर्धा करते हैं।
MC-बेंच पर, उपयोगकर्ता यह वोट कर सकते हैं कि उन्हें किस AI मॉडल का निर्माण पसंद है, और वोट देने के बाद ही उन्हें पता चलता है कि प्रत्येक निर्माण किस मॉडल ने बनाया। यह इंटरैक्टिव दृष्टिकोण न केवल समुदाय को जोड़ता है बल्कि AI क्षमताओं का मूल्यांकन करने का एक अनूठा तरीका भी प्रदान करता है।
आदि सिंह, 12वीं कक्षा के छात्र और MC-बेंच के प्रारंभकर्ता, मानते हैं कि माइनक्राफ्ट की व्यापक पहचान इसकी कुंजी है। अब तक का सबसे अधिक बिकने वाला वीडियो गेम होने के नाते, यह कई लोगों के लिए परिचित है, जिससे लोगों के लिए AI-जनरेटेड निर्माणों की गुणवत्ता का आकलन करना आसान हो जाता है, भले ही उन्होंने स्वयं गेम न खेला हो। "माइनक्राफ्ट लोगों को AI विकास की प्रगति को बहुत आसानी से देखने की अनुमति देता है," सिंह ने टेकक्रंच को बताया। "लोग माइनक्राफ्ट के आदी हैं, इसके लुक और माहौल के आदी हैं।"
MC-बेंच को आठ स्वयंसेवी योगदानकर्ताओं की एक टीम द्वारा समर्थित किया जाता है। Anthropic, Google, OpenAI, और Alibaba जैसी कंपनियों ने बेंचमार्क संकेतों को चलाने के लिए अपने उत्पाद प्रदान किए हैं, हालांकि वे इस परियोजना में अन्यथा शामिल नहीं हैं।
सिंह MC-बेंच को साधारण निर्माणों से परे अधिक जटिल, लक्ष्य-उन्मुख कार्यों तक विस्तार करने की कल्पना करते हैं। "गेम्स शायद एक ऐसा माध्यम हो सकते हैं जो वास्तविक जीवन की तुलना में सुरक्षित और परीक्षण के उद्देश्यों के लिए अधिक नियंत्रणीय हो, जिससे यह मेरी नजर में अधिक आदर्श बनता है," उन्होंने कहा।
अन्य गेम्स के रूप में AI बेंचमार्क्स
माइनक्राफ्ट के अलावा, पोकेमॉन रेड, स्ट्रीट फाइटर, और पिक्शनरी जैसे अन्य गेम्स को AI के लिए प्रायोगिक बेंचमार्क्स के रूप में उपयोग किया गया है। AI बेंचमार्किंग की चुनौती इसकी जटिलता में निहित है, क्योंकि पारंपरिक मानकीकृत परीक्षण अक्सर AI मॉडलों को पक्षपात करते हैं, जो उनकी प्रशिक्षण विधियों के कारण, रटे हुए स्मरण या बुनियादी अनुमान जैसे संकीर्ण समस्या-समाधान क्षेत्रों में उत्कृष्टता प्राप्त करते हैं।
उदाहरण के लिए, जबकि OpenAI का GPT-4 LSAT पर 88वें प्रतिशत में स्कोर कर सकता है, यह "स्ट्रॉबेरी" में R की संख्या गिनने जैसे सरल कार्यों में संघर्ष करता है। इसी तरह, Anthropic का Claude 3.7 Sonnet एक सॉफ्टवेयर इंजीनियरिंग बेंचमार्क पर 62.3% सटीकता प्राप्त करता है, लेकिन पोकेमॉन खेलने में अधिकांश पांच साल के बच्चों की तुलना में कम पड़ता है।
MC-बेंच: सिर्फ एक प्रोग्रामिंग बेंचमार्क से अधिक
तकनीकी रूप से, MC-बेंच एक प्रोग्रामिंग बेंचमार्क है क्योंकि इसके लिए AI मॉडलों को "फ्रॉस्टी द स्नोमैन" या "एक प्राचीन रेतीले तट पर एक आकर्षक उष्णकटिबंधीय झोपड़ी" जैसे निर्माणों को बनाने के लिए कोड लिखना पड़ता है। हालांकि, इस मंच की अपील इसकी पहुंच में निहित है। उपयोगकर्ताओं के लिए निर्माण की दृश्य गुणवत्ता का मूल्यांकन करना कोड का विश्लेषण करने की तुलना में आसान है, जो परियोजना की पहुंच और मॉडल प्रदर्शन पर डेटा संग्रह की संभावना को व्यापक बनाता है।
यह बहस जारी है कि क्या ये स्कोर वास्तव में AI की उपयोगिता को दर्शाते हैं। हालांकि, सिंह मानते हैं कि ये एक मजबूत संकेतक हैं। "वर्तमान लीडरबोर्ड मेरे अपने इन मॉडलों के उपयोग के अनुभव को काफी करीब से दर्शाता है, जो कि कई शुद्ध टेक्स्ट बेंचमार्क्स के विपरीत है," उन्होंने कहा। "शायद [MC-बेंच] कंपनियों के लिए यह जानने में उपयोगी हो सकता है कि क्या वे सही दिशा में जा रहे हैं।"




This high school kid building an AI Minecraft challenge site is wild! 🤯 I love how Minecraft’s open world is being used to test AI creativity. Wonder if we’ll see AI build epic castles or just glitchy dirt huts? 🏰




マインクラフトでAIの性能を評価するなんて面白いアイデアだね!ただ、AIの建築物が時々変な感じになるのが残念。でも全体的に見て、すごいと思うよ!高校生が作ったなんて信じられない!😲




¡Usar Minecraft para evaluar AI es una idea genial! Es como ver a los modelos de AI compitiendo en un mundo virtual. Lo único malo es que a veces las construcciones son demasiado simples, pero en general es fantástico. ¡Sigan así! 😄




Usar o Minecraft para testar AI é uma ideia incrível! Parece que estamos assistindo a uma competição de AI em um mundo virtual. A única coisa ruim é que às vezes as construções são muito simples, mas no geral é fantástico! Continuem o bom trabalho! 😊




マインクラフトを使ったAIのベンチマーク、面白いですね!ゲームがAIのテストに使われるなんて、まるでAI同士が仮想世界で競っているみたい。ただ、時々ビルドがシンプルすぎるのが残念。でも全体的に素晴らしいアイデアだと思います!👍




This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮












