विकल्प
मॉडल पारसिगर मात्रा
671B
मॉडल पारसिगर मात्रा
संबद्ध संगठन
DeepSeek
संबद्ध संगठन
ओपन सोर्स
लाइसेंस प्रकार
जारी करने का समय
26 दिसम्बर 2024
जारी करने का समय
मॉडल परिचय
DeepSeek-V3 ने Qwen2.5-72B और Llama-3.1-405B जैसे अन्य 오픈 स्रोत मॉडल्स से ऊंची एवल्यूएशन स्कोर्स प्राप्त की हैं, और इसका प्रदर्शन GPT-4o और Claude-3.5-Sonnet जैसे विश्व के सबसे शीर्ष बंद स्रोत मॉडल्स के समान है।
और देखने के लिए बाएं और दाएं स्वाइप करें
भाषा समझ की क्षमता भाषा समझ की क्षमता
भाषा समझ की क्षमता
अक्सर सिमेंटिक गलतफहमी बनाता है, प्रतिक्रियाओं में स्पष्ट तार्किक डिस्कनेक्ट के लिए अग्रणी।
6.8
ज्ञान कवरेज गुंजाइश ज्ञान कवरेज गुंजाइश
ज्ञान कवरेज गुंजाइश
मुख्यधारा के विषयों का मुख्य ज्ञान है, लेकिन इसमें अत्याधुनिक अंतःविषय क्षेत्रों की सीमित कवरेज है।
8.8
तर्क क्षमता तर्क क्षमता
तर्क क्षमता
सुसंगत तर्क श्रृंखला बनाए रखने में असमर्थ, अक्सर उल्टे कार्य -कारण या मिसकॉल्स का कारण बनता है।
6.7
मॉडल तुलना
संबंधित मॉडल
DeepSeek-V2-Chat-0628 डीपसीक-V2 एक मिश्रण-ऑफ-इक्सपर्ट्स (MoE) भाषा मॉडल है जो कीमती ट्रेनिंग और कुशल अनुमान लगाव के साथ चिन्हित है। यह कुल 236 बिलियन पैरामीटरों से मिलकर बना है, जिसमें से 21 बिलियन प्रत्येक टोकन के लिए सक्रिय हैं। डीपसीक 67B की तुलना में, डीपसीक-V2 मजबूत प्रदर्शन प्रदान करता है, और इसने 42.5% की ट्रेनिंग लागत की कटौती की, KV कैश को 93.3% कम किया और अधिकतम उत्पादकता को 5.76 गुना बढ़ाया।
DeepSeek-V2.5 DeepSeek-V2.5 एक अपग्रेड वर्शन है जो DeepSeek-V2-Chat और DeepSeek-Coder-V2-Instruct को जोड़ता है। नया मॉडल पिछली दो संस्करणों की सामान्य और कोडिंग क्षमताओं को एक्सप्लोर करता है।
DeepSeek-V3-0324 डीपसीक-V3 कई मूल्यांकनों में Qwen2.5-72B और Llama-3.1-405B जैसे अन्य 오픈 स्रोत मॉडल्स को पारदर्शी करता है और GPT-4 और Claude-3.5-Sonnet जैसे शीर्ष श्रेणी के बंद स्रोत मॉडल्स के प्रदर्शन के साथ मेल खाता है।
DeepSeek-V2-Lite-Chat DeepSeek-V2, डीपसेक द्वारा पेश किए गए एक मजबूत Mixture-of-Experts (MoE) भाषा मॉडल है, और DeepSeek-V2-Lite उसकी हल्की संस्करण है।
DeepSeek-V2-Chat DeepSeek-V2 एक मिश्रण-ऑफ-विशेषज्ञ (MoE) भाषा मॉडल है जो आर्थिक ट्रेनिंग और कुशल अनुमान लगाने के लिए जाना जाता है। यह कुल 236 बिलियन पैरामीटरों से मिलकर बना है, जिसमें से 21 बिलियन प्रत्येक टोकन के लिए सक्रिय होते हैं। DeepSeek 67B की तुलना में, DeepSeek-V2 बेहतर प्रदर्शन प्रदान करता है, ट्रेनिंग लागत को 42.5% कम करता है, KV कैश को 93.3% कम करता है, और अधिकतम उत्पादन अनुमान की दर को 5.76 गुना बढ़ाता है।
प्रासंगिक दस्तावेज
DeepSeek-V3 का अनावरण: हार्डवेयर-जागरूक AI डिज़ाइन कैसे लागत कम करता है और प्रदर्शन बढ़ाता है DeepSeek-V3: AI विकास में लागत-कुशल छलांगAI उद्योग एक चौराहे पर है। जबकि बड़े भाषा मॉडल (LLMs) अधिक शक्तिशाली हो रहे हैं, उनकी गणनात्मक मांगें आसमान छू रही हैं, जिससे अत्याधुनिक AI विकास अधिकांश संगठन
AI-चालित यात्रा: आसानी से अपनी आदर्श छुट्टी की योजना बनाएं छुट्टी की योजना बनाना कठिन लग सकता है, अंतहीन खोज और समीक्षाएं उत्साह को तनाव में बदल सकती हैं। AI-चालित यात्रा योजना इसे बदल देती है, जिससे प्रक्रिया सहज और आनंददायक बनती है। यह लेख बताता है कि AI या
AI驱动的NoteGPT转换YouTube学习体验 在当今快节奏的世界中,有效学习至关重要。NoteGPT 是一个动态的 Chrome 扩展程序,彻底改变您与 YouTube 内容的互动方式。通过利用 AI,它提供简洁的摘要、准确的转录和直观的笔记工具,让用户轻松掌握和保留信息。适合学生、研究人员或终身学习者,NoteGPT 将 YouTube 变成一个定制的教育中心,提升学习效率和生产力。主要亮点NoteGPT 是一个 Chrome 扩展程序,通
सामुदायिक यूनियन और Google ने मिलकर यूके के कर्मचारियों के लिए AI कौशल को बढ़ावा देने के लिए साझेदारी की संपादक का नोट: Google ने यूके में सामुदायिक यूनियन के साथ मिलकर यह प्रदर्शित किया है कि AI कौशल कार्यालय और परिचालन कर्मचारियों की क्षमताओं को कैसे बढ़ा सकते हैं। यह अग्रणी कार्यक्रम यूके की कार्यशक्त
Magi-1 ने क्रांतिकारी ओपन-सोर्स AI वीडियो जनरेशन तकनीक का अनावरण किया AI-संचालित वीडियो निर्माण का क्षेत्र तेजी से आगे बढ़ रहा है, और Magi-1 एक परिवर्तनकारी मील का पत्थर है। यह नवाचारपूर्ण ओपन-सोर्स मॉडल समय, गति और गतिशीलता को नियंत्रित करने में अद्वितीय सटीकता प्रदान
मॉडल तुलना
तुलना शुरू करें
शीर्ष पर वापस
OR