विकल्प
घर समाचार ओपनएआई के जीपीटी-4.5 ने ट्यूरिंग टेस्ट की समस्या को उजागर किया

ओपनएआई के जीपीटी-4.5 ने ट्यूरिंग टेस्ट की समस्या को उजागर किया

रिलीज़ की तारीख रिलीज़ की तारीख 22 मई 2025
लेखक लेखक EricJohnson
दृश्य दृश्य 0

ट्यूरिंग टेस्ट, महान अलन ट्यूरिंग की एक कल्पना, लंबे समय से कृत्रिम बुद्धिमत्ता की दुनिया में एक मानक रहा है। लेकिन एक आम गलतफहमी को साफ कर देते हैं: ट्यूरिंग टेस्ट पास करने का मतलब यह नहीं है कि मशीन मानव की तरह "सोच" रही है। यह अधिक मनुष्यों को इस बात के लिए मनाने के बारे में है कि वह ऐसा है।

हाल के शोध से कैलिफोर्निया विश्वविद्यालय, सैन डिएगो ने ओपनएआई के नवीनतम मॉडल, जीपीटी-4.5 पर प्रकाश डाला है। यह एआई अब मनुष्यों को यह विश्वास दिलाने में सक्षम है कि वे दूसरे व्यक्ति के साथ चैट कर रहे हैं, यहां तक कि मनुष्यों की तुलना में अधिक प्रभावी ढंग से। यह कृत्रिम बुद्धिमत्ता की दुनिया में एक बहुत बड़ी बात है - यह ऐसा है जैसे किसी जादू की ट्रिक को देखना, जिसका राज आप जानते हैं, लेकिन यह फिर भी आपको हैरान कर देता है।

कैलिफोर्निया विश्वविद्यालय, सैन डिएगो

एजीआई का प्रमाण?

लेकिन यहां एक महत्वपूर्ण बात है: यहां तक कि यूसी सैन डिएगो के शोधकर्ता भी इस बात के लिए तैयार नहीं हैं कि हमने "कृत्रिम सामान्य बुद्धिमत्ता" (एजीआई) को प्राप्त कर लिया है, क्योंकि एक एआई मॉडल ट्यूरिंग टेस्ट पास कर सकता है। एजीआई कृत्रिम बुद्धिमत्ता का पवित्र ग्रह होगा - मशीनें जो मनुष्यों की तरह सोच सकती हैं और जानकारी को प्रोसेस कर सकती हैं।

सांता फे इंस्टीट्यूट की एआई विद्वान मेलानी मिचेल, जर्नल साइंस में तर्क देती हैं कि ट्यूरिंग टेस्ट अधिक मानवीय धारणाओं की परीक्षा है न कि वास्तविक बुद्धिमत्ता की। निश्चित रूप से, एक एआई प्रवाह और आश्वस्त लग सकता है, लेकिन यह सामान्य बुद्धिमत्ता होने जैसा नहीं है। यह शतरंज में अच्छा होने जैसा है - यह प्रभावशाली है, लेकिन यह पूरी तस्वीर नहीं है।

इसके चारों ओर नवीनतम चर्चा कैमरन जोन्स और बेंजामिन बर्गेन के यूसी सैन डिएगो के एक पेपर से आती है, जिसका शीर्षक है "लार्ज लैंग्वेज मॉडल्स पास द ट्यूरिंग टेस्ट," जो arXiv प्री-प्रिंट सर्वर पर प्रकाशित हुआ है। वे वर्षों से यह प्रयोग कर रहे हैं, यूसी सैन डिएगो के स्नातक छात्रों की मदद से, और यह कंप्यूटरों के ट्यूरिंग टेस्ट पास करने के बारे में 800 से अधिक दावों और प्रतिवादों की एक लंबी श्रृंखला का हिस्सा है।

ट्यूरिंग टेस्ट कैसे काम करता है

तो, यह टेस्ट कैसे काम करता है? मूल रूप से, ट्यूरिंग ने इसे एक मानव "जज" और दो "साक्षियों" - एक मानव, एक कंप्यूटर के बीच टेक्स्ट मैसेज के खेल के रूप में कल्पना की थी। साक्षियों की चुनौती है कि वे जज को मनुष्य होने के लिए मना लें। जज जानता है कि एक मानव है, लेकिन यह नहीं कि कौन सा, और उसे अनुमान लगाना होता है। यह एक तीन-पक्षीय सेटअप है जो कंप्यूटर की क्षमताओं के बारे में उतना ही है जितना कि धारणा और विश्वास के बारे में है।

जोन्स और बर्गेन ने इस क्लासिक सेटअप पर अपना मोड़ डाला है, और आप ऑनलाइन जज या साक्षी के रूप में इसे आजमा सकते हैं। उनके संस्करण में, यूसी सैन डिएगो के छात्रों ने एक टेक्स्ट चैट ऐप का उपयोग किया। कुछ ने जज की भूमिका निभाई, दूसरों ने मानव साक्षी की, जबकि जीपीटी-4.5 ने कंप्यूटर साक्षी की भूमिका निभाई। प्रत्येक जज ने एक ही समय में एक मानव और एक कंप्यूटर के साथ चैट की, ट्यूरिंग के मूल प्रारूप को बनाए रखते हुए।

कंप्यूटर साक्षी की भूमिका निभाने के लिए, उन्होंने विभिन्न बड़े भाषा मॉडल का उपयोग किया, जिन्हें जज की चुनौतियों के आधार पर प्रॉम्प्ट दिए गए। जीपीटी-4.5 को दो अलग-अलग प्रॉम्प्ट के साथ परीक्षण किया गया: एक में न्यूनतम जानकारी, और दूसरा जिसे PERSONA कहा जाता है, जिसमें एक युवा, अंतर्मुखी, इंटरनेट-सेवी व्यक्ति की तरह काम करने के विस्तृत निर्देश शामिल हैं जो स्लैंग का उपयोग करता है।

कैलिफोर्निया विश्वविद्यालय, सैन डिएगो

परिणाम

उन्होंने तीन अन्य एआई प्रोग्राम भी परीक्षण किए: ओपनएआई का पिछला मॉडल, जीपीटी-4o; मेटा प्लेटफॉर्म्स का लामा 3.1 405b; और 1960 के दशक का प्राचीन चैटबॉट, ELIZA। उन्होंने ELIZA को शामिल किया ताकि यह देखा जा सके कि क्या बड़े भाषा मॉडल मनुष्यों को संयोग से मूर्ख बना रहे हैं या वे वास्तव में बेहतर हैं।

जोन्स और बर्गेन के अनुसार, जीपीटी-4.5 ने मानव जजों को 73% समय मानव होने के लिए मूर्ख बनाया - जिसे वे "जीत दर" कहते हैं। यह अन्य मॉडलों से बहुत बेहतर है, जिन्होंने 21% से 56% के बीच स्कोर किया, भले ही विस्तृत प्रॉम्प्ट समान हों। और यह पिछले साल के जीपीटी-4 के परीक्षण से एक बहुत बड़ी छलांग है, जिसकी जीत दर केवल 54% थी, जो कि यादृच्छिक संभावना से मुश्किल से ऊपर थी।

जोन्स और बर्गेन ने पाया कि जज न केवल एआई से मूर्ख बने, बल्कि वास्तव में वास्तविक मानव प्रतिभागियों की तुलना में इसे मानव मानने की अधिक संभावना थी।

क्या टेस्ट वास्तव में बुद्धिमत्ता का माप है?

तो, मनुष्य एक चैट में कंप्यूटर को व्यक्ति से अलग नहीं कर पाते, इसका क्या मतलब है? दशकों से बहस का विषय यह बड़ा प्रश्न रहा है कि क्या ट्यूरिंग टेस्ट वास्तव में बुद्धिमत्ता को माप रहा है। जोन्स और बर्गेन सुझाव देते हैं कि शायद मशीनें विभिन्न परिदृश्यों में अनुकूल होने में इतनी अच्छी हो गई हैं कि वे मानव के रूप में आश्वस्त रूप से पास हो सकती हैं। PERSONA प्रॉम्प्ट, जो मनुष्यों द्वारा बनाया गया है, कुछ ऐसा है जिसे जीपीटी-4.5 ने अनुकूलित किया और अपने लाभ के लिए उपयोग किया।

लेकिन एक पकड़ है: शायद मनुष्य बुद्धिमत्ता को पहचानने में बुरे हैं। लेखकों ने बताया है कि ELIZA, प्राचीन चैटबॉट, ने 23% समय जजों को मूर्ख बनाया, न कि इसलिए कि यह अधिक बुद्धिमान था, बल्कि इसलिए कि यह उनकी उम्मीदों को पूरा नहीं करता था कि एआई कैसा होना चाहिए। कुछ जजों ने इसे मानव माना क्योंकि यह "व्यंग्यात्मक" या "अशिष्ट" था, जो उन्हें एआई से उम्मीद नहीं थी।

यह सुझाव देता है कि जज अपनी धारणाओं से प्रभावित होते हैं कि मनुष्य और एआई कैसे व्यवहार करने चाहिए, बजाय इसके कि केवल सबसे बुद्धिमान लगने वाले एजेंट को चुनने के। दिलचस्प बात यह है कि जजों ने ज्ञान पर बहुत ध्यान नहीं दिया, जिसे ट्यूरिंग महत्वपूर्ण मानते थे। इसके बजाय, वे तब अधिक संभावना रखते थे जब वे ज्ञान की कमी महसूस करते थे।

सामाजिकता, बुद्धिमत्ता नहीं

यह सब इस विचार की ओर इशारा करता है कि मनुष्य सामाजिकता को उठा रहे हैं न कि बुद्धिमत्ता। जोन्स और बर्गेन का निष्कर्ष है कि ट्यूरिंग टेस्ट वास्तव में बुद्धिमत्ता की परीक्षा नहीं है - यह मानवीयता की परीक्षा है।

ट्यूरिंग ने सोचा होगा कि बुद्धिमत्ता मानव जैसा दिखने की सबसे बड़ी चुनौती है, लेकिन जैसे-जैसे मशीनें हमारे करीब आती हैं, अन्य अंतर अधिक स्पष्ट हो जाते हैं। अब बुद्धिमत्ता अकेले आश्वस्त रूप से मानव जैसा लगने के लिए पर्याप्त नहीं है।

पेपर में सीधे नहीं कहा गया है कि मनुष्य कंप्यूटर पर टाइप करने के इतने आदी हो गए हैं, चाहे वह व्यक्ति को हो या मशीन को, कि ट्यूरिंग टेस्ट अब वह नवीन मानव-कंप्यूटर इंटरैक्शन टेस्ट नहीं है जो पहले था। यह अब ऑनलाइन मानवीय आदतों की परीक्षा अधिक है।

लेखक सुझाव देते हैं कि टेस्ट को विस्तारित करने की आवश्यकता हो सकती है क्योंकि बुद्धिमत्ता इतनी जटिल और बहुआयामी है कि कोई एकल टेस्ट निर्णायक नहीं हो सकता। वे अलग-अलग डिज़ाइन प्रस्तावित करते हैं, जैसे एआई विशेषज्ञों को जज के रूप में उपयोग करना या जजों को अधिक नज़दीकी से जांचने के लिए वित्तीय प्रोत्साहन जोड़ना। ये परिवर्तन दिखा सकते हैं कि रवैया और उम्मीदें परिणामों को कितना प्रभावित करती हैं।

वे निष्कर्ष निकालते हैं कि जबकि ट्यूरिंग टेस्ट तस्वीर का हिस्सा हो सकता है, इसे अन्य प्रकार के सबूतों के साथ विचार किया जाना चाहिए। यह कृत्रिम बुद्धिमत्ता अनुसंधान में एक बढ़ती प्रवृत्ति के अनुरूप है कि मनुष्यों को "लूप में" शामिल किया जाए, जो मशीनों के कार्यों का मूल्यांकन करते हैं।

क्या मानव निर्णय पर्याप्त होगा?

लेकिन यह सवाल अभी भी बना हुआ है कि क्या लंबे समय में मानव निर्णय पर्याप्त होगा। फिल्म ब्लेड रनर में, मनुष्य मानवों को रेप्लिकेंट रोबोट्स से अलग करने के लिए एक मशीन, "वॉइट-कैम्फ़" का उपयोग करते हैं। जैसे-जैसे हम एजीआई का पीछा करते हैं, और यह परिभाषित करने के लिए संघर्ष करते हैं कि यह क्या है, हम शायद मशीनों की बुद्धिमत्ता का आकलन करने के लिए मशीनों पर निर्भर हो सकते हैं।

या कम से कम, हमें मशीनों से पूछने की आवश्यकता हो सकती है कि वे मनुष्यों को दूसरे मनुष्यों को प्रॉम्प्ट के साथ मूर्ख बनाने के बारे में क्या "सोचते" हैं। एआई अनुसंधान में बाहर एक जंगली दुनिया है, और यह केवल और अधिक दिलचस्प होती जा रही है।

संबंधित लेख
अमेज़न CEO: Alexa+ के 100,000 ग्राहक अमेज़न CEO: Alexa+ के 100,000 ग्राहक अमेज़न के सीईओ, एंडी जैसी ने गुरुवार को कंपनी की आय कॉल पर कुछ रोमांचक समाचार साझा किए: जेनेरेटिव AI द्वारा संचालित अपग्रेडेड डिजिटल सहायक, एलेक्सा+, अब 100,000 से अधिक उपयोगकर्ताओ
एप्पल 2027 में कर्व्ड ग्लास iPhone लॉन्च करेगा एप्पल 2027 में कर्व्ड ग्लास iPhone लॉन्च करेगा इस सुबह, ब्लूमबर्ग के मार्क गुरमैन ने अपने पावर ऑन न्यूज़लेटर के साथ उत्साह पैदा किया, 2027 के लिए एप्पल के "प्रोडक्ट ब्लिट्ज" की भविष्यवाणी की। विशेष रूप से, उन्होंने iPhone की 20
एआई-संचालित मांग पत्र जमे हुए धन को अनलॉक करने में मदद करते हैं एआई-संचालित मांग पत्र जमे हुए धन को अनलॉक करने में मदद करते हैं अमेज़ॅन, पेपैल या स्ट्राइप जैसी कंपनियों से जमे हुए फंड से निपटना एक वास्तविक सिरदर्द हो सकता है। इस मुद्दे से निपटने का एक प्रभावी तरीका एक सम्मोहक मांग पत्र भेजना है। एआई की मदद से, विशेष रूप से चैटगेट, आप एक शक्तिशाली पत्र तैयार कर सकते हैं जो कि बिना किसी के अपने पैसे वापस पा सकते हैं
सूचना (0)
शीर्ष समाचार
Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ कंबियम का एआई कचरे की लकड़ी को लकड़ी में बदल देता है यूएस डेटा सेंटर के लिए ट्वीक्स 76 GW नई बिजली क्षमता को अनलॉक कर सकते हैं Openai का O3 मॉडल संभावित रूप से अधिक महंगा है जो शुरू में विचार की तुलना में संचालित होता है एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया चैट की ऊर्जा का उपयोग अपेक्षा से कम है "2024 विश्व चैम्पियनशिप के लिए 5 शतरंज अन्वेषण युक्तियाँ" नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है
अधिक
शीर्ष पर वापस
OR