घर

समाचार

मैंने अपने कोडिंग परीक्षणों के माध्यम से GPT -4O डाल दिया और इसने उन्हें जोड़ दिया - एक अजीब परिणाम को छोड़कर

मैंने अपने कोडिंग परीक्षणों के माध्यम से GPT -4O डाल दिया और इसने उन्हें जोड़ दिया - एक अजीब परिणाम को छोड़कर

17 अप्रैल 2025

TimothyGonzález

यदि आप तकनीकी दुनिया के साथ अपडेट रहते हैं, तो आप शायद जानते हैं कि OpenAI ने अपना नवीनतम बड़ा भाषा मॉडल, GPT-4o, जारी किया है, जहां "o" का अर्थ "omni" है। यह नया मॉडल टेक्स्ट, ग्राफिक्स और वॉइस में बहुमुखी प्रतिभा का वादा करता है, और मैं इसे अपने मानक कोडिंग टेस्ट के सेट के साथ आजमाने के लिए उत्सुक था। इन टेस्टों को विभिन्न AI मॉडलों के खिलाफ चलाया गया है, जिससे कुछ बहुत ही रोचक परिणाम मिले हैं। अंत तक मेरे साथ रहें क्योंकि इसमें एक ट्विस्ट है जिसे आप मिस नहीं करना चाहेंगे।

यदि आप अपने स्वयं के प्रयोग करने में रुचि रखते हैं, तो इस गाइड को देखें: मैं AI चैटबॉट की कोडिंग क्षमता का परीक्षण कैसे करता हूँ - और आप भी कर सकते हैं। यह मेरे द्वारा उपयोग किए जाने वाले सभी टेस्टों को रेखांकित करता है, साथ ही यह भी बताता है कि वे कैसे काम करते हैं और परिणामों में क्या देखना चाहिए।

अब, आइए प्रत्येक टेस्ट के परिणामों में गोता लगाएँ और देखें कि GPT-4o पिछले प्रतिस्पर्धियों जैसे Microsoft Copilot, Meta AI, Meta Code Llama, Google Gemini Advanced, और ChatGPT के पहले के संस्करणों के मुकाबले कैसा प्रदर्शन करता है।

1. वर्डप्रेस प्लगिन लिखना

यहाँ GPT-4o के यूजर इंटरफेस की एक झलक है:

दिलचस्प बात यह है कि GPT-4o ने एक जावास्क्रिप्ट फ़ाइल को शामिल करने की स्वतंत्रता ली, जो दोनों क्षेत्रों में लाइन काउंट को गतिशील रूप से अपडेट करती है। हालांकि प्रॉम्प्ट में स्पष्ट रूप से जावास्क्रिप्ट को बाहर नहीं किया गया था, यह रचनात्मक दृष्टिकोण अप्रत्याशित और प्रभावी था। जावास्क्रिप्ट रैंडमाइज़ बटन की कार्यक्षमता को भी बढ़ाता है, जिससे पूर्ण पेज रिफ्रेश के बिना कई परिणाम सेट प्राप्त हो सकते हैं।

लाइनें सही ढंग से व्यवस्थित थीं, और डुप्लिकेट्स को विनिर्देशों के अनुसार उचित रूप से अलग किया गया था। यह कोड का एक ठोस टुकड़ा है, जिसमें केवल एक छोटी सी शिकायत है: रैंडमाइज़ बटन को अपनी अलग लाइन पर नहीं रखा गया था, हालांकि मैंने प्रॉम्प्ट में यह निर्दिष्ट नहीं किया था, इसलिए इसके लिए कोई अंक नहीं काटे गए।

यहाँ इस और पिछले टेस्टों के समग्र परिणाम हैं:

ChatGPT GPT-4o: इंटरफेस: अच्छा, कार्यक्षमता: अच्छा
Microsoft Copilot: इंटरफेस: पर्याप्त, कार्यक्षमता: असफल
Meta AI: इंटरफेस: पर्याप्त, कार्यक्षमता: असफल
Meta Code Llama: पूर्ण असफलता
Google Gemini Advanced: इंटरफेस: अच्छा, कार्यक्षमता: असफल
ChatGPT 4: इंटरफेस: अच्छा, कार्यक्षमता: अच्छा
ChatGPT 3.5: इंटरफेस: अच्छा, कार्यक्षमता: अच्छा

2. स्ट्रिंग फ़ंक्शन को फिर से लिखना

यह टेस्ट मॉडल की डॉलर और सेंट रूपांतरण को संभालने की क्षमता का मूल्यांकन करता है। GPT-4o ने कोड को सफलतापूर्वक फिर से लिखा ताकि बाद की लाइनों में समस्याएँ पैदा करने वाले इनपुट को अस्वीकार किया जाए, यह सुनिश्चित करते हुए कि केवल मान्य डॉलर और सेंट मान संसाधित हों।

मुझे थोड़ी निराशा हुई कि इसने .75 जैसे मानों में स्वचालित रूप से अग्रणी शून्य जोड़कर उन्हें 0.75 में परिवर्तित नहीं किया। हालांकि, चूंकि मैंने इस सुविधा का स्पष्ट रूप से अनुरोध नहीं किया था, यह AI की गलती नहीं है। यह एक अनुस्मारक है कि भले ही AI कार्यात्मक कोड प्रदान करता हो, आपको वास्तव में जो चाहिए वह प्राप्त करने के लिए प्रॉम्प्ट को परिष्कृत करने की आवश्यकता हो सकती है।

यहाँ इस और पिछले टेस्टों के समग्र परिणाम हैं:

ChatGPT GPT-4o: सफल
Microsoft Copilot: असफल
Meta AI: असफल
Meta Code Llama: सफल
Google Gemini Advanced: असफल
ChatGPT 4: सफल
ChatGPT 3.5: सफल

3. एक कष्टप्रद बग ढूँढना

यह टेस्ट दिलचस्प है क्योंकि इसका समाधान तुरंत स्पष्ट नहीं होता। मैं स्वयं अपने कोडिंग के दौरान इस त्रुटि से शुरू में हैरान था, इसलिए मैंने पहली ChatGPT मॉडल से मदद मांगी। इसने त्रुटि को तुरंत ढूंढ लिया, जो उस समय दिमाग को झकझोर देने वाला था।

इसके विपरीत, मेरे द्वारा टेस्ट किए गए अन्य तीन LLM इस समस्या में गलत दिशा को चूक गए। त्रुटि संदेश कोड के एक हिस्से की ओर इशारा करता है, लेकिन वास्तविक समस्या कहीं और है, जिसे पहचानने के लिए वर्डप्रेस फ्रेमवर्क का गहरा ज्ञान आवश्यक है।

सौभाग्य से, GPT-4o ने समस्या को सही ढंग से पहचाना और समाधान का सटीक वर्णन किया।

यहाँ इस और पिछले टेस्टों के समग्र परिणाम हैं:

ChatGPT GPT-4o: सफल
Microsoft Copilot: असफल। शानदार ढंग से। उत्साहपूर्वक। इमोजी के साथ।
Meta AI: सफल
Meta Code Llama: असफल
Google Gemini Advanced: असफल
ChatGPT 4: सफल
ChatGPT 3.5: सफल

अब तक, GPT-4o तीन में से तीन में सफल रहा है। आइए देखें कि यह अंतिम टेस्ट में कैसा प्रदर्शन करता है।

4. एक स्क्रिप्ट लिखना

इस टेस्ट के जवाब में, GPT-4o ने वास्तव में मुझसे जितना मांगा था उससे अधिक प्रदान किया। टेस्ट में असामान्य मैक स्क्रिप्टिंग टूल Keyboard Maestro, Apple का AppleScript, और Chrome स्क्रिप्टिंग व्यवहार का उपयोग शामिल है। वैसे, Keyboard Maestro मेरे लिए एक गेम-चेंजर है, जो अपने ऑपरेटिंग सिस्टम और एप्लिकेशनों को फिर से प्रोग्राम करने की क्षमता के कारण मैक को मेरी उत्पादकता के लिए पसंदीदा बनाता है।

पास करने के लिए, AI को Keyboard Maestro कोड, AppleScript, और Chrome API कार्यक्षमता के संयोजन का उपयोग करके समाधान को सही ढंग से रेखांकित करना होगा।

आश्चर्यजनक रूप से, GPT-4o ने मुझे दो अलग-अलग संस्करण दिए:

दोनों संस्करणों ने Keyboard Maestro के साथ सही ढंग से बातचीत की, लेकिन वे केस संवेदनशीलता को संभालने में भिन्न थे। बायाँ संस्करण गलत था क्योंकि AppleScript "as lowercase" का समर्थन नहीं करता। दायाँ संस्करण, जो "contains" का उपयोग करता था और केस-असंवेदनशील था, ठीक काम करता था।

मैं GPT-4o को पास दे रहा हूँ, हालांकि सावधानीपूर्वक, क्योंकि इसने कार्यात्मक कोड प्रदान किया। हालांकि, दो विकल्प लौटाना, जिनमें से एक गलत था, ने मुझे सही विकल्प का मूल्यांकन करने और चुनने के लिए अतिरिक्त काम करना पड़ा। यह उतना ही समय लेने वाला हो सकता था जितना कि कोड स्वयं लिखना।

यहाँ इस और पिछले टेस्टों के समग्र परिणाम हैं:

ChatGPT GPT-4o: सफल, लेकिन आरक्षण के साथ
Microsoft Copilot: असफल
Meta AI: असफल
Meta Code Llama: असफल
Google Gemini Advanced: सफल
ChatGPT 4: सफल
ChatGPT 3.5: असफल

कुल परिणाम

यहाँ सभी मॉडलों ने चार टेस्टों में कैसा प्रदर्शन किया:

ChatGPT GPT-4o: 4 में से 4 सफल, लेकिन उस एक अजीब दोहरे-विकल्प उत्तर के साथ
Microsoft Copilot: 4 में से 0 सफल
Meta AI: 4 में से 1 सफल
Meta Code Llama: 4 में से 1 सफल
Google Gemini Advanced: 4 में से 1 सफल
ChatGPT 4: 4 में से 4 सफल
ChatGPT 3.5: 4 में से 3 सफल

अब तक, ChatGPT मेरी कोडिंग सहायता के लिए पसंदीदा रहा है। यह हमेशा डिलीवर करता है (सिवाय जब यह नहीं करता)। अन्य AI मेरे टेस्टों में ज्यादातर कम पड़ गए। लेकिन GPT-4o ने उस अंतिम दोहरे-उत्तर प्रतिक्रिया के साथ मुझे हैरान कर दिया। इसने मुझे यह सवाल करने पर मजबूर किया कि इस मॉडल के अंदर क्या हो रहा है जो ऐसी गड़बड़ी का कारण बन सकता है।

इसके बावजूद, GPT-4o मेरे कोडिंग टेस्टों में शीर्ष प्रदर्शनकर्ता बना हुआ है, इसलिए मैं शायद इसका उपयोग जारी रखूँगा और इसकी विचित्रताओं से अधिक परिचित हो जाऊँगा। वैकल्पिक रूप से, मैं ChatGPT Plus में GPT-3.5 या GPT-4 पर वापस जा सकता हूँ। बने रहें; अगली बार जब ChatGPT अपने मॉडल को अपडेट करेगा, मैं निश्चित रूप से इन टेस्टों को फिर से चलाऊँगा यह देखने के लिए कि क्या यह चारों टेस्टों में लगातार सही उत्तर चुन सकता है।

क्या आपने इनमें से किसी AI मॉडल के साथ कोडिंग की कोशिश की है? आपका अनुभव क्या रहा है? नीचे टिप्पणियों में हमें बताएँ।

संबंधित लेख

ट्रम्प का $500B स्टारगेट प्रोजेक्ट वैश्विक AI नवाचार का नेतृत्व करने के लिए तेजी से तकनीकी प्रगति के युग में, कृत्रिम बुद्धिमत्ता (AI) पर प्रभुत्व स्थापित करने की होड़ एक महत्वपूर्ण भू-राजनीतिक और आर्थिक चुनौती के रूप में उभरी है। डोनाल्ड ट्रम्प के नेतृत्व में संयुक्त राज्य अ

AI Music Covers: Ultimate Guide to Creating Unique Songs कृत्रिम बुद्धिमत्ता (AI) ने संगीत उत्पादन में क्रांति ला दी है, जिससे गीतों को पुनर्जनन करने के नवीन तरीके सामने आए हैं। AI गीत कवर उपयोगकर्ताओं को विभिन्न कलाकारों की आवाजों का उपयोग करके लोकप्रिय ट्

2025 में डेवलपर अनुभव को बढ़ाने वाले शीर्ष 10 उपकरण डेवलपर अनुभव (DevEx) केवल शब्दजाल से परे है। जैसे-जैसे तकनीकी ढांचे अधिक जटिल होते जा रहे हैं, दूरस्थ टीमें मानक बन रही हैं, और निरंतर वितरण में तेजी आ रही है, डेवलपर्स को तेजी से जटिल कार्यप्रवाह का

सूचना (20)

0/200

जमा करना

JonathanAllen

26 अप्रैल 2025 5:16:22 अपराह्न IST

GPT-4o é impressionante, passando na maioria dos meus testes de codificação! Mas aquele resultado estranho me deixou confuso. Ainda assim, é versátil em texto, gráficos e voz. Se ao menos pudesse explicar aquele resultado estranho, seria perfeito! 🤔

WillHarris

25 अप्रैल 2025 11:51:39 अपराह्न IST

GPT-4o thật ấn tượng, vượt qua hầu hết các bài kiểm tra mã hóa của tôi! Nhưng kết quả lạ đó làm tôi bối rối. Tuy nhiên, nó rất linh hoạt trong văn bản, đồ họa và giọng nói. Giá mà nó có thể giải thích kết quả lạ đó, thì sẽ hoàn hảo! 🤔

DonaldGonzález

24 अप्रैल 2025 5:11:59 अपराह्न IST

GPT-4oは私のコードテストのほとんどを完璧にこなすので感動しました！しかし、その一つの奇妙な結果が気になりました。それでも、テキスト、グラフィック、音声での多様性は素晴らしいです。あの奇妙な結果を説明できれば完璧だったのに！🤔

JustinAnderson

23 अप्रैल 2025 10:42:28 पूर्वाह्न IST

¡El GPT-4o me impresionó con sus habilidades de codificación! Pasó todos mis tests excepto por un resultado extraño que me dejó pensando. Su versatilidad en texto, gráficos y voz es genial! Pero ese fallo, hay que arreglarlo, OpenAI! 😎

NicholasClark

23 अप्रैल 2025 7:42:49 पूर्वाह्न IST

GPT-4oのコードスキルには感心しました！私のテストをほぼ全てクリアしましたが、一つの奇妙な結果が気になります。テキスト、グラフィック、ボイスでの多才さは素晴らしい！でも、その一つのバグ、修正してほしいですね、OpenAI！😅

DavidThomas

22 अप्रैल 2025 10:34:24 अपराह्न IST

GPT-4o is impressive, acing most of my coding tests! But that one weird result threw me off. Still, it's versatile across text, graphics, and voice. If only it could explain that odd outcome, it'd be perfect! 🤔

शीर्ष समाचार

GEMINI 2.5 प्रो अब असीमित और सस्ता क्लाउड की तुलना में सस्ता, GPT-4O 2025 के शीर्ष AI वीडियो जनरेटर: Pika Labs बनाम विकल्प Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया यूएस डेटा सेंटर के लिए ट्वीक्स 76 GW नई बिजली क्षमता को अनलॉक कर सकते हैं एआई वॉयसओवर: रियलिस्टिक वॉयस क्रिएशन का अल्टीमेट गाइड Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें

अधिक

प्रदर्शित