मेटा लामा 4 रिलीज का बचाव करता है, मिश्रित गुणवत्ता रिपोर्ट के कारण के रूप में बग्स का हवाला देता है
सप्ताहांत में, मेटा, फेसबुक, इंस्टाग्राम, व्हाट्सएप, और क्वेस्ट वीआर के पीछे का पावरहाउस, अपने नवीनतम एआई भाषा मॉडल, लामा 4 का अनावरण करके सभी को आश्चर्यचकित किया। न केवल एक, बल्कि तीन नए संस्करणों को पेश किया गया, प्रत्येक घमंड क्षमताओं को "मिक्सचर-ऑफ-एक्सपर्ट्स" आर्किटेक्चर और एक उपन्यास प्रशिक्षण दृष्टिकोण के लिए धन्यवाद दिया गया, जो निश्चित हाइपरपेरेंट को शामिल करता है। क्या अधिक है, सभी तीन मॉडल विस्तारक संदर्भ विंडो के साथ आते हैं, जिससे उन्हें एक ही बातचीत में अधिक जानकारी संसाधित करने की अनुमति मिलती है।
रिलीज के उत्साह के बावजूद, एआई समुदाय की प्रतिक्रिया सबसे अच्छी तरह से गुनगुना रही है। शनिवार को, मेटा ने इनमें से दो मॉडलों को बनाया, लामा 4 स्काउट और लामा 4 मावेरिक, डाउनलोड और उपयोग के लिए उपलब्ध है, लेकिन प्रतिक्रिया उत्साही से दूर रही है।
लामा 4 एआई उपयोगकर्ताओं के बीच भ्रम और आलोचना करता है
उत्तरी अमेरिका में एक लोकप्रिय चीनी भाषा समुदाय, 1Point3Acres फोरम पर एक अस्वीकार्य पद, Reddit पर R/Localllama Subreddit के लिए अपना रास्ता खोजता है। द पोस्ट, कथित तौर पर मेटा के जेनई संगठन के एक शोधकर्ता से, ने दावा किया कि लामा 4 ने आंतरिक तृतीय-पक्ष बेंचमार्क पर कमज़ोर किया। इसने सुझाव दिया कि मेटा के नेतृत्व ने विभिन्न मैट्रिक्स को पूरा करने और एक अनुकूल परिणाम पेश करने के लिए प्रशिक्षण के दौरान परीक्षण सेट को सम्मिश्रण करके परिणामों में हेरफेर किया था। इस दावे की प्रामाणिकता संदेह के साथ मिली थी, और मेटा ने अभी तक वेंचरबीट से पूछताछ का जवाब नहीं दिया है।
फिर भी, लामा 4 के प्रदर्शन के बारे में संदेह वहाँ नहीं रुका। X पर, उपयोगकर्ता @CTO_JUNIOR ने मॉडल के प्रदर्शन पर अविश्वास व्यक्त किया, एक स्वतंत्र परीक्षण का हवाला देते हुए, जहां लामा 4 मावेरिक ने Aider पॉलीग्लॉट बेंचमार्क पर केवल 16% स्कोर किया, जो कोडिंग कार्यों का परीक्षण करता है। यह स्कोर पुराने की तुलना में काफी कम है, इसी तरह के आकार के मॉडल जैसे कि डीपसेक वी 3 और क्लाउड 3.7 सॉनेट।
एआई पीएचडी और लेखक एंड्री बुर्कोव ने भी लामा 4 स्काउट के लिए मॉडल के विज्ञापित 10 मिलियन-टोकन संदर्भ विंडो पर सवाल उठाने के लिए एक्स में ले लिया, यह कहते हुए कि यह "वर्चुअल" है क्योंकि मॉडल 256k टोकन से अधिक समय तक प्रशिक्षित नहीं किया गया था। उन्होंने चेतावनी दी कि लंबे समय तक संकेत भेजने से कम गुणवत्ता वाले आउटपुट में परिणाम होगा।
R/Localllama Subreddit पर, उपयोगकर्ता DR_KARMINSKI ने Llama 4 के साथ निराशा साझा की, अपने खराब प्रदर्शन की तुलना DeePseek के गैर-पुन: सक्रिय V3 मॉडल से की, जो एक हेप्टागन के भीतर गेंद आंदोलनों का अनुकरण करने जैसे कार्यों पर।
एआई 2 के पूर्व मेटा शोधकर्ता और वर्तमान वरिष्ठ अनुसंधान वैज्ञानिक नाथन लैंबर्ट ने अपने इंटरकनेक्ट्स सबस्टैक ब्लॉग पर मेटा के बेंचमार्क तुलनाओं की आलोचना की। उन्होंने कहा कि मेटा की प्रचार सामग्री में इस्तेमाल किया जाने वाला लामा 4 मावेरिक मॉडल सार्वजनिक रूप से जारी किए गए एक से अलग था, जो संवादी के बजाय अनुकूलित था। लैंबर्ट ने विसंगति का उल्लेख करते हुए कहा, "चुपके। नीचे दिए गए परिणाम नकली हैं, और यह मेटा के समुदाय के लिए एक बड़ा मामूली है जो उस मॉडल को जारी नहीं करता है जो वे अपने प्रमुख विपणन पुश बनाने के लिए उपयोग करते थे।" उन्होंने कहा कि जब प्रचार मॉडल "रिलीज की तकनीकी प्रतिष्ठा को टंका रहा था क्योंकि इसका चरित्र किशोर है," अन्य प्लेटफार्मों पर उपलब्ध वास्तविक मॉडल "काफी स्मार्ट था और एक उचित स्वर है।"

मेटा जवाब देता है, 'टेस्ट सेट पर प्रशिक्षण' से इनकार करता है और फास्ट रोलआउट के कारण कार्यान्वयन में बग का हवाला देते हुए
आलोचना और आरोपों के जवाब में, मेटा के वीपी और जेनई के प्रमुख, अहमद अल-डाहले ने चिंताओं को दूर करने के लिए एक्स में ले लिया। उन्होंने लामा 4 के साथ समुदाय की सगाई के लिए उत्साह व्यक्त किया, लेकिन विभिन्न सेवाओं में असंगत गुणवत्ता की रिपोर्टों को स्वीकार किया। उन्होंने इन मुद्दों को रैपिड रोलआउट और सार्वजनिक कार्यान्वयन के लिए आवश्यक समय को स्थिर करने के लिए जिम्मेदार ठहराया। अल-डाहले ने परीक्षण सेट पर प्रशिक्षण के आरोपों से दृढ़ता से इनकार किया, इस बात पर जोर दिया कि चर गुणवत्ता किसी भी कदाचार के बजाय कार्यान्वयन बग के कारण थी। उन्होंने लामा 4 मॉडल की महत्वपूर्ण प्रगति में मेटा के विश्वास की पुष्टि की और उनकी क्षमता का एहसास करने के लिए समुदाय के साथ काम करने के लिए उनकी प्रतिबद्धता।
हालांकि, प्रतिक्रिया ने समुदाय की कुंठाओं को कम करने के लिए बहुत कम किया, कई अभी भी खराब प्रदर्शन की रिपोर्ट कर रहे हैं और मॉडल की प्रशिक्षण प्रक्रियाओं के बारे में अधिक तकनीकी दस्तावेज की मांग कर रहे हैं। इस रिलीज ने पिछले लामा संस्करणों की तुलना में अधिक मुद्दों का सामना किया है, इसके विकास और रोलआउट के बारे में सवाल उठाते हैं।
इस रिलीज का समय उल्लेखनीय है, क्योंकि यह मेटा के वीपी ऑफ रिसर्च जोले पिनेउ के प्रस्थान का अनुसरण करता है, जिन्होंने पिछले हफ्ते लिंक्डइन पर अपने समय के लिए कंपनी में अपने समय के लिए आभार व्यक्त किया था। Pineau ने सप्ताहांत में Llama 4 मॉडल परिवार को भी बढ़ावा दिया था।
जैसा कि लामा 4 को मिश्रित परिणामों के साथ अन्य अनुमान प्रदाताओं द्वारा अपनाया जाना जारी है, यह स्पष्ट है कि प्रारंभिक रिलीज सफलता नहीं है कि मेटा की उम्मीद की जा सकती है। 29 अप्रैल को आगामी मेटा ललामकॉन, जो मॉडल परिवार के तीसरे पक्ष के डेवलपर्स के लिए पहली सभा होगी, चर्चा और बहस का एक हॉटबेड होने की संभावना है। हम घटनाक्रमों पर कड़ी नजर रखेंगे, इसलिए बने रहें।
संबंधित लेख
谷歌AI躍升內幕:Gemini 2.5 思維更深、表達更智能且編碼更快
谷歌朝著通用AI助手的願景邁進一步在今年的Google I/O大會上,該公司揭示了其Gemini 2.5系列的重大升級,特別是在多個維度上提升其能力。最新的版本——Gemini 2.5 Flash和2.5 Pro——現在比以往更加聰明和高效。這些進步使谷歌更接近實現其創造通用AI助手的願景,這個助手能夠無縫理解情境、計劃並執行任務。### Gemini 2.
深度認知發布開源AI模型,已名列前茅
深度思睿推出革命性的人工智能模型旧金山一家尖端的人工智能研究初创公司深度思睿(Deep Cogito)正式发布了其首批开源大型语言模型(LLMs),命名为思睿v1。这些模型经过微调自Meta的Llama 3.2,具备混合推理能力,能够快速响应或进行内省思考——这一功能让人联想到OpenAI的“o”系列和DeepSeek R1。深度思睿旨在通过在其模型中促进迭
微軟在Build 2025大會上宣布推出超過50款AI工具打造『主動網路』
微軟於Build大會揭開開放式自主網路願景今天早上,微軟在其年度Build大會上發表了一項大膽宣言:「開放式自主網路」的黎明已經到來。在超過50項公告的廣泛陣容中,這家科技巨頭概述了一項全面策略,將自己置於這個轉型運動的核心位置。從GitHub到Azure,從Windows到Microsoft 365,每條產品線都收到了旨在推動AI代理技術進步的更新。這些代
सूचना (0)
0/200
सप्ताहांत में, मेटा, फेसबुक, इंस्टाग्राम, व्हाट्सएप, और क्वेस्ट वीआर के पीछे का पावरहाउस, अपने नवीनतम एआई भाषा मॉडल, लामा 4 का अनावरण करके सभी को आश्चर्यचकित किया। न केवल एक, बल्कि तीन नए संस्करणों को पेश किया गया, प्रत्येक घमंड क्षमताओं को "मिक्सचर-ऑफ-एक्सपर्ट्स" आर्किटेक्चर और एक उपन्यास प्रशिक्षण दृष्टिकोण के लिए धन्यवाद दिया गया, जो निश्चित हाइपरपेरेंट को शामिल करता है। क्या अधिक है, सभी तीन मॉडल विस्तारक संदर्भ विंडो के साथ आते हैं, जिससे उन्हें एक ही बातचीत में अधिक जानकारी संसाधित करने की अनुमति मिलती है।
रिलीज के उत्साह के बावजूद, एआई समुदाय की प्रतिक्रिया सबसे अच्छी तरह से गुनगुना रही है। शनिवार को, मेटा ने इनमें से दो मॉडलों को बनाया, लामा 4 स्काउट और लामा 4 मावेरिक, डाउनलोड और उपयोग के लिए उपलब्ध है, लेकिन प्रतिक्रिया उत्साही से दूर रही है।
लामा 4 एआई उपयोगकर्ताओं के बीच भ्रम और आलोचना करता है
उत्तरी अमेरिका में एक लोकप्रिय चीनी भाषा समुदाय, 1Point3Acres फोरम पर एक अस्वीकार्य पद, Reddit पर R/Localllama Subreddit के लिए अपना रास्ता खोजता है। द पोस्ट, कथित तौर पर मेटा के जेनई संगठन के एक शोधकर्ता से, ने दावा किया कि लामा 4 ने आंतरिक तृतीय-पक्ष बेंचमार्क पर कमज़ोर किया। इसने सुझाव दिया कि मेटा के नेतृत्व ने विभिन्न मैट्रिक्स को पूरा करने और एक अनुकूल परिणाम पेश करने के लिए प्रशिक्षण के दौरान परीक्षण सेट को सम्मिश्रण करके परिणामों में हेरफेर किया था। इस दावे की प्रामाणिकता संदेह के साथ मिली थी, और मेटा ने अभी तक वेंचरबीट से पूछताछ का जवाब नहीं दिया है।
फिर भी, लामा 4 के प्रदर्शन के बारे में संदेह वहाँ नहीं रुका। X पर, उपयोगकर्ता @CTO_JUNIOR ने मॉडल के प्रदर्शन पर अविश्वास व्यक्त किया, एक स्वतंत्र परीक्षण का हवाला देते हुए, जहां लामा 4 मावेरिक ने Aider पॉलीग्लॉट बेंचमार्क पर केवल 16% स्कोर किया, जो कोडिंग कार्यों का परीक्षण करता है। यह स्कोर पुराने की तुलना में काफी कम है, इसी तरह के आकार के मॉडल जैसे कि डीपसेक वी 3 और क्लाउड 3.7 सॉनेट।
एआई पीएचडी और लेखक एंड्री बुर्कोव ने भी लामा 4 स्काउट के लिए मॉडल के विज्ञापित 10 मिलियन-टोकन संदर्भ विंडो पर सवाल उठाने के लिए एक्स में ले लिया, यह कहते हुए कि यह "वर्चुअल" है क्योंकि मॉडल 256k टोकन से अधिक समय तक प्रशिक्षित नहीं किया गया था। उन्होंने चेतावनी दी कि लंबे समय तक संकेत भेजने से कम गुणवत्ता वाले आउटपुट में परिणाम होगा।
R/Localllama Subreddit पर, उपयोगकर्ता DR_KARMINSKI ने Llama 4 के साथ निराशा साझा की, अपने खराब प्रदर्शन की तुलना DeePseek के गैर-पुन: सक्रिय V3 मॉडल से की, जो एक हेप्टागन के भीतर गेंद आंदोलनों का अनुकरण करने जैसे कार्यों पर।
एआई 2 के पूर्व मेटा शोधकर्ता और वर्तमान वरिष्ठ अनुसंधान वैज्ञानिक नाथन लैंबर्ट ने अपने इंटरकनेक्ट्स सबस्टैक ब्लॉग पर मेटा के बेंचमार्क तुलनाओं की आलोचना की। उन्होंने कहा कि मेटा की प्रचार सामग्री में इस्तेमाल किया जाने वाला लामा 4 मावेरिक मॉडल सार्वजनिक रूप से जारी किए गए एक से अलग था, जो संवादी के बजाय अनुकूलित था। लैंबर्ट ने विसंगति का उल्लेख करते हुए कहा, "चुपके। नीचे दिए गए परिणाम नकली हैं, और यह मेटा के समुदाय के लिए एक बड़ा मामूली है जो उस मॉडल को जारी नहीं करता है जो वे अपने प्रमुख विपणन पुश बनाने के लिए उपयोग करते थे।" उन्होंने कहा कि जब प्रचार मॉडल "रिलीज की तकनीकी प्रतिष्ठा को टंका रहा था क्योंकि इसका चरित्र किशोर है," अन्य प्लेटफार्मों पर उपलब्ध वास्तविक मॉडल "काफी स्मार्ट था और एक उचित स्वर है।"
मेटा जवाब देता है, 'टेस्ट सेट पर प्रशिक्षण' से इनकार करता है और फास्ट रोलआउट के कारण कार्यान्वयन में बग का हवाला देते हुए
आलोचना और आरोपों के जवाब में, मेटा के वीपी और जेनई के प्रमुख, अहमद अल-डाहले ने चिंताओं को दूर करने के लिए एक्स में ले लिया। उन्होंने लामा 4 के साथ समुदाय की सगाई के लिए उत्साह व्यक्त किया, लेकिन विभिन्न सेवाओं में असंगत गुणवत्ता की रिपोर्टों को स्वीकार किया। उन्होंने इन मुद्दों को रैपिड रोलआउट और सार्वजनिक कार्यान्वयन के लिए आवश्यक समय को स्थिर करने के लिए जिम्मेदार ठहराया। अल-डाहले ने परीक्षण सेट पर प्रशिक्षण के आरोपों से दृढ़ता से इनकार किया, इस बात पर जोर दिया कि चर गुणवत्ता किसी भी कदाचार के बजाय कार्यान्वयन बग के कारण थी। उन्होंने लामा 4 मॉडल की महत्वपूर्ण प्रगति में मेटा के विश्वास की पुष्टि की और उनकी क्षमता का एहसास करने के लिए समुदाय के साथ काम करने के लिए उनकी प्रतिबद्धता।
हालांकि, प्रतिक्रिया ने समुदाय की कुंठाओं को कम करने के लिए बहुत कम किया, कई अभी भी खराब प्रदर्शन की रिपोर्ट कर रहे हैं और मॉडल की प्रशिक्षण प्रक्रियाओं के बारे में अधिक तकनीकी दस्तावेज की मांग कर रहे हैं। इस रिलीज ने पिछले लामा संस्करणों की तुलना में अधिक मुद्दों का सामना किया है, इसके विकास और रोलआउट के बारे में सवाल उठाते हैं।
इस रिलीज का समय उल्लेखनीय है, क्योंकि यह मेटा के वीपी ऑफ रिसर्च जोले पिनेउ के प्रस्थान का अनुसरण करता है, जिन्होंने पिछले हफ्ते लिंक्डइन पर अपने समय के लिए कंपनी में अपने समय के लिए आभार व्यक्त किया था। Pineau ने सप्ताहांत में Llama 4 मॉडल परिवार को भी बढ़ावा दिया था।
जैसा कि लामा 4 को मिश्रित परिणामों के साथ अन्य अनुमान प्रदाताओं द्वारा अपनाया जाना जारी है, यह स्पष्ट है कि प्रारंभिक रिलीज सफलता नहीं है कि मेटा की उम्मीद की जा सकती है। 29 अप्रैल को आगामी मेटा ललामकॉन, जो मॉडल परिवार के तीसरे पक्ष के डेवलपर्स के लिए पहली सभा होगी, चर्चा और बहस का एक हॉटबेड होने की संभावना है। हम घटनाक्रमों पर कड़ी नजर रखेंगे, इसलिए बने रहें।












