选项
首页
Al模型列表
DeepSeek-V3
模型参数数量
671B
模型参数数量
所属机构
DeepSeek
所属机构
开源
许可证类型
发布时间
2024-12-26
发布时间
模型介绍
DeepSeek-V3 的评估分数高于其他开源模型,例如 Qwen2.5-72B 和 Llama-3.1-405B,其性能与世界顶级闭源模型如 GPT-4o 和 Claude-3.5-Sonnet 相当。
左右滑动查看更多
语言理解能力 语言理解能力
语言理解能力
常出现语义误判,导致回应内容与问题存在明显逻辑断裂。
6.8
知识覆盖范围 知识覆盖范围
知识覆盖范围
掌握主流学科核心知识体系,但对前沿交叉学科覆盖有限。
8.8
推理能力 推理能力
推理能力
无法保持连贯推理链条,常出现因果倒置或数据误算。
6.7
相关模型
DeepSeek-V2-Chat-0628 DeepSeek-V2 是一种强大的混合专家模型(Mixture-of-Experts),其特点是训练成本经济且推理高效。它总共有2360亿个参数,每次生成每个标记时激活其中的210亿个参数。与DeepSeek 67B相比,DeepSeek-V2 性能更强,同时节省了42.5%的训练成本,将KV缓存减少了93.3%,并将最大生成吞吐量提高了5.76倍。
DeepSeek-V2.5 DeepSeek-V2.5 是一个升级版本,结合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct。新模型集成了前两个版本的通用和编码能力。
DeepSeek-V3-0324 在多项评估中,DeepSeek-V3的表现优于其他开源模型,如Qwen2.5-72B和Llama-3.1-405B,并且其性能与顶级闭源模型,如GPT-4和Claude-3.5-Sonnet相当。
DeepSeek-V2-Lite-Chat DeepSeek-V2 是由 DeepSeek 提出的强大混合专家模型(MoE),DeepSeek-V2-Lite 是它的轻量版。
DeepSeek-V2-Chat DeepSeek-V2 是一种强大的混合专家模型(MoE),以其经济的训练和高效的推理能力著称。它总共有2360亿个参数,每次生成每个标记时激活其中的210亿个参数。与DeepSeek 67B相比,DeepSeek-V2性能更强,同时节省了42.5%的训练成本,将KV缓存减少了93.3%,并将最大生成吞吐量提高了5.76倍。
相关文档
DeepSeek-V3发布:硬件感知AI设计如何降低成本并提升性能 DeepSeek-V3:AI开发的高效成本突破AI行业正处于十字路口。大型语言模型(LLMs)功能日益强大,但计算需求激增,使尖端AI开发对大多数组织而言成本高昂。DeepSeek-V3通过证明智能硬件-软件协同设计——而非单纯的暴力扩展——能以极低成本实现顶尖性能,挑战这一趋势。仅用2,048 NVIDIA H800 GPUs训练,DeepSeek-V3利用了多头潜在注意力(MLA)、专家混合(
AI驱动的旅行:轻松规划完美度假 规划度假可能让人感到畏惧,无休止的搜索和评论会将兴奋转化为压力。AI驱动的旅行规划改变了这一点,使过程变得顺畅而愉快。本文深入探讨了AI如何革新旅行,聚焦于工具和策略,以无与伦比的轻松和个性化打造您的理想之旅。关键要点AI分析过去的行为,推荐个性化的目的地和活动。AI工具简化行程路线和计划,节省时间并减轻压力。AI提供实时建议、虚拟导览和沉浸式旅行体验。像Atlas IQ这样的平台利用AI使旅行规
AI驱动的NoteGPT革新YouTube学习体验 在当今快节奏的世界中,有效学习至关重要。NoteGPT 是一款动态的 Chrome 扩展程序,彻底改变您与 YouTube 内容的互动方式。通过利用 AI,它提供简洁的摘要、准确的转录和直观的笔记工具,使用户能够轻松掌握和保留信息。适合学生、研究人员或终身学习者,NoteGPT 将 YouTube 转变为定制的教育中心,提升学习效率和生产力。主要亮点NoteGPT 是一款 Chrome 扩展程序,
社区工会与Google合作提升英国工人AI技能 编辑注:Google已与英国的社区工会合作,展示AI技能如何增强办公室和运营工人的能力。这一开创性项目是一系列旨在将AI融入英国劳动力的举措之一。Google正与 Multi Academy Trusts、 SMBs以及社区工会合作,确定到2030年实现超过4000亿英镑生产力提升的最有效策略。我们与社区工会物流部门代表保罗·托马斯和社区工会总书记罗伊·里克胡斯CBE进行了交谈,了解了这一举措以及
Magi-1揭示革命性开源AI视频生成技术 人工智能驱动的视频创作领域正在迅速发展,Magi-1标志着一个变革性的里程碑。这一创新的开源模型在控制时间、动作和动态方面提供了无与伦比的精确度,重新定义了视频制作。本文将探讨Magi-1的功能、潜在应用及其对未来视觉叙事的影响。主要亮点Magi-1是用于视频生成的尖端开源AI模型。它在视频创作的时间、动作和动态方面提供了卓越的精确度。由Sand AI开发,确保高质量输出。Magi-1提供逼真且动
模型比较
开始比较
返回顶部
OR