मेटा का एआई मॉडल बेंचमार्क: भ्रामक?

घर

समाचार

10 अप्रैल 2025

TimothyMitchell

# meta # llama # llama 4

मेटा का एआई मॉडल बेंचमार्क: भ्रामक?

इसलिए, मेटा ने सप्ताहांत में अपने नए एआई मॉडल, मावरिक को गिरा दिया, और यह पहले से ही एलएम एरिना पर दूसरे स्थान पर स्नैग करके लहरें बना रहा है। आप जानते हैं, यही वह स्थान है जहां मनुष्यों को जज और जूरी की भूमिका निभाने के लिए मिलता है, विभिन्न एआई मॉडल की तुलना करते हैं और अपने पसंदीदा को चुनते हैं। लेकिन, पकड़ो, वहाँ एक मोड़ है! यह पता चला है कि Maverick संस्करण LM एरिना पर अपने सामान को स्ट्रक्ट करना काफी नहीं है, जैसा कि आप डाउनलोड कर सकते हैं और एक डेवलपर के रूप में खेल सकते हैं।

एक्स पर कुछ ईगल-आइड एआई शोधकर्ताओं (हाँ, मंच को पूर्व में ट्विटर के रूप में जाना जाता था) ने देखा कि मेटा ने एलएम एरिना संस्करण को "प्रयोगात्मक चैट संस्करण" कहा। और यदि आप लामा वेबसाइट पर झांकते हैं, तो एक चार्ट है जो फलियों को फैलता है, यह कहते हुए कि परीक्षण "लामा 4 मावेरिक के साथ संवादी के लिए अनुकूलित" के साथ किया गया था। अब, हमने पहले इस बारे में बात की है, लेकिन एलएम एरिना एआई प्रदर्शन को मापने के लिए बिल्कुल सोने का मानक नहीं है। अधिकांश एआई कंपनियां इस परीक्षण पर बेहतर स्कोर करने के लिए अपने मॉडल के साथ गड़बड़ नहीं करती हैं - या कम से कम, वे इसे स्वीकार नहीं करते हैं।

बात यह है, जब आप एक बेंचमार्क के लिए एक मॉडल को ट्विक करते हैं, लेकिन फिर जनता के लिए एक अलग "वेनिला" संस्करण जारी करते हैं, तो डेवलपर्स के लिए यह पता लगाना कठिन है कि मॉडल वास्तव में वास्तविक दुनिया के परिदृश्यों में कितना अच्छा प्रदर्शन करेगा। इसके अलावा, यह थोड़े भ्रामक है, है ना? बेंचमार्क, दोषपूर्ण रूप से वे हैं, हमें एक स्पष्ट तस्वीर देनी चाहिए कि एक मॉडल क्या कर सकता है और विभिन्न कार्यों में नहीं कर सकता है।

एक्स पर शोधकर्ताओं को उस मावेरिक के बीच कुछ बड़े अंतरों को नोटिस करने के लिए जल्दी किया गया है जिसे आप डाउनलोड कर सकते हैं और एलएम एरिना पर एक। अखाड़ा संस्करण स्पष्ट रूप से इमोजीस के बारे में है और आपको लंबे, खींचे गए उत्तर देने के लिए प्यार करता है।

ठीक है, लामा 4 एक लिटल्ड पका हुआ लोल है, यह याप सिटी pic.twitter.com/y3gvhbvz65 क्या है
- नाथन लैम्बर्ट (@Natolambert) 6 अप्रैल, 2025

किसी कारण के लिए, एरिना में लामा 4 मॉडल बहुत अधिक इमोजी का उपयोग करता है

एक साथ। ai, यह बेहतर लगता है: pic.twitter.com/f74odx4ztt
- टेक देव नोट्स (@techdevnotes) 6 अप्रैल, 2025

हम मेटा और चैटबोट एरिना के लोगों के पास पहुंच गए हैं, जो एलएम एरिना को चलाते हैं, यह देखने के लिए कि उन्हें इस सब के बारे में क्या कहना है। बने रहें!

संबंधित लेख

Meta AI在歐盟推出並實施限制 Meta 的由人工智能驱动的虛擬助手 Meta AI，終於在歐洲聯盟登陸，這是在與歐洲隱私當局的激烈規管爭議中實現的。該公司在星期四宣布，這個類似聊天機器人的工具將整合到其社交平台套件中，不過其功能比美國市場上的版本更加有限。在另一項發展中，Meta 向 TechCrunch 確認，Meta AI 即將在英國的 WhatsApp 上推出，從最初於去年十月在

OpenAI 聘請前Facebook應用程式負責人菲吉·西莫加入OpenAI担任应用程序业务主管OpenAI通过聘请现任Instacart首席执行官兼前Facebook应用程序负责人菲吉·西莫来领导其应用程序业务，引起了广泛关注。这一任命直接来自高层，OpenAI首席执行官山姆·阿尔特曼在X上分享道，这个新职位将使他能够更多地关注研究、计算和安全性。显然，他们正在为应用程序领域的某些令人兴奋的发展奠定基础！

Meta預測到2035年生成性AI收入將達1.4萬億美元去年，Meta大膽預測其生成式AI產品到2025年將產生20億至30億美元的收入。展望更遠的未來，他們預計到2035年將增長到驚人的4600億至1.4兆美元之間。這些預測是在週三浮出水面的法庭文件中揭示的，當時正值書籍作者對Meta提起訴訟。他們指控該公司未經許可就用他們的作品訓練AI。然而，文件並未具體說明Meta將何謂“生成式AI產品”。不過，眾所周知，

सूचना (35)

0/200

जमा करना

JerryGonzalez