70B
模型参数数量
Meta
所属机构
开源
许可证类型
2024-07-23
发布时间
模型介绍
Llama 3.1 405B 是首个在普通知识、可控性、数学、工具使用和多语言翻译等前沿能力方面可与顶级 AI 模型相媲美的公开可用模型。
左右滑动查看更多
语言理解能力
常出现语义误判,导致回应内容与问题存在明显逻辑断裂。
4.6
知识覆盖范围
掌握主流学科核心知识体系,但对前沿交叉学科覆盖有限。
8.4
推理能力
无法保持连贯推理链条,常出现因果倒置或数据误算。
3.5
模型比较
Llama3.1-405B-Instruct-FP8 vs Qwen2.5-7B-Instruct
像Qwen2一样,Qwen2.5语言模型支持高达128K个标记,并且可以生成多达8K个标记。它们还继续支持超过29种语言,包括中文、英文、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。
Llama3.1-405B-Instruct-FP8 vs Spark-X1
科大讯飞发布的推理模型Spark X1,在国内数学任务领先的基础上,针对推理、文本生成和语言理解等通用任务的表现,对标OpenAI的o1和DeepSeek的R1。
相关模型
Llama4-Maverick-17B-128E-Instruct
Llama 4 模型是一种自动回归语言模型,采用专家混合(MoE)架构,并结合了早期融合技术以实现本地多模态。
Llama4-Maverick-17B-128E-Instruct
Llama 4 模型是自回归语言模型,采用专家混合(MoE)架构,并融入早期融合技术以实现原生多模态能力。
Llama3.1-8B-Instruct
Llama3.1 是多语言模型,具有显著更长的上下文长度 128K,最先进的工具使用能力以及整体更强的推理能力。
Llama3.1-405B-Instruct-FP8
Llama 3.1 405B 是首个在普通知识、可控性、数学、工具使用和多语言翻译等前沿能力方面可与顶级 AI 模型相媲美的开源模型。
Llama3.2-3B-Instruct
Llama 3.2 3B 模型支持长达 128K 个标记的上下文长度,并且在其设备端应用场景(如摘要、指令跟随和重写任务在边缘本地运行)方面处于同类产品的领先地位。
相关文档
AI搜索强制政策引发用户出走潮,DuckDuckGo用户激增
继谷歌在2026年I/O大会上宣布将对其搜索引擎进行全面的人工智能改造后,由于没有简单的“一键禁用”功能来关闭AI功能,许多用户开始寻找更具可控性的替代方案。 以隐私保护为宗旨的搜索平台DuckDuckGo近期流量出现明显转移,已成为对谷歌激进AI推广不满用户的热门避风港。1. 用户用脚投票:安装量激增根据DuckDuckGo分享的数据,随着用户对谷歌AI更新的不满情绪加剧,该平台在5月20日至2
小红书进行组织架构调整:柯南出任总裁,新设AI主营部门Dots及海外业务部门Rednote
4月30日,小红书向全体员工发布内部通告,宣布启动新一轮组织架构调整。此次调整的核心在于将社区、电商和商业化三大业务线与公司的技术系统全面整合。 公司新设了名为“Dots”的AI优先部门,这标志着小红书已正式将AI提升为最高战略优先级,旨在使其从工具性功能转变为核心生产力。在人事任命方面,南(丁玲)被任命为小红书总裁,负责公司核心业务运营,并直接向CEO邢宇汇报。 各业务板块负责人也已明确:智恒将
腾讯旗下“小龙虾”表现远超预期,团队将运力扩大10倍,并致歉及提供补偿
腾讯正式推出全场景AI智能助手“WorkBuddy”,凭借高度集成和低部署门槛,标志着大型模型应用层竞争进入新阶段。该产品在发布当天便引发了业界广泛关注。 用户流量远超预期,导致相关产品腾讯云代码助手(CodeBuddy)出现登录故障及服务不稳定。腾讯云团队随后发布致歉声明,表示技术团队已紧急将容量扩容十倍,目前服务已全面恢复。受影响用户获得了5,000腾讯云代金券作为补偿。业界观察人士将Work
Suno领投方:删除帖子无法填补版权诉讼的漏洞
备受瞩目的AI音乐生成平台Suno正面临一场艰难的版权诉讼,而其领投投资人的坦率言论,可能恰恰为对方提供了他们梦寐以求的证据。 Menlo Ventures(Suno的核心投资者)合伙人C.C. Gong近日删除了一个推文,该推文与公司当前的法律辩护策略直接相悖。在之前的版权诉讼中,Suno的辩护主要依赖“合理使用”的论点,声称AI生成的音乐仅仅是一种“工具”,既不会直接与受版权保护的原创作品竞争
Claude Opus 4.7 正式发布,将可靠性置于智能之上
Anthropic 今年保持着激进的开发节奏,几乎每隔一天就会推出新功能。备受期待的 Claude Opus 4.7 刚刚正式发布,有趣的是,Anthropic 在公告中直言不讳地表示:“这并非我们最强大的模型。” 传闻中更强大的 Claude Mythos Preview 仍处于待命状态。尽管如此,Opus 4.7 依然引发了广泛关注,因为它致力于解决“更可靠”而非“更智能”的问题。基准测试结果





首页
