123B
模型参数数量
Mistral AI
所属机构
开源
许可证类型
2024-07-24
发布时间
模型介绍
Mistral-Large-Instruct-2407 是一个具有 123B 参数的先进密集型大型语言模型 (LLM),具备最前沿的推理、知识和编码能力。
左右滑动查看更多
语言理解能力
常出现语义误判,导致回应内容与问题存在明显逻辑断裂。
4.9
知识覆盖范围
掌握主流学科核心知识体系,但对前沿交叉学科覆盖有限。
8.1
推理能力
无法保持连贯推理链条,常出现因果倒置或数据误算。
5.0
模型比较
Mistral-Large-Instruct-2407 vs Qwen2.5-7B-Instruct
像Qwen2一样,Qwen2.5语言模型支持高达128K个标记,并且可以生成多达8K个标记。它们还继续支持超过29种语言,包括中文、英文、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。
Mistral-Large-Instruct-2407 vs Spark-X1
科大讯飞发布的推理模型Spark X1,在国内数学任务领先的基础上,针对推理、文本生成和语言理解等通用任务的表现,对标OpenAI的o1和DeepSeek的R1。
相关模型
Mistral-Large-Instruct-2411
Mistral-Large-Instruct-2411 是一个具有 123B 参数的先进密集型大型语言模型(LLM),具备领先世界的推理、知识和编码能力,并通过更好的长上下文、函数调用和系统提示改进了 Mistral-Large-Instruct-2407。
Mistral-Large-Instruct-2411
Mistral-Large-Instruct-2411 是一个具有 123B 参数的先进密集型大型语言模型(LLM),具备最先进的推理、知识和编码能力,并通过更好的长上下文、函数调用和系统提示改进了 Mistral-Large-Instruct-2407。
Mistral-Small-Instruct-2409
Mistral Small v24.09 拥有 220 亿个参数,为客户提供了一种方便的选择,介于 Mistral NeMo 12B 和 Mistral Large 2 之间,提供了一种成本效益高的解决方案,可在各种平台和环境中部署。
Mistral-Small-Instruct-2409
Mistral Small v24.09 拥有 220 亿个参数,为客户提供了一种方便的选择,介于 Mistral NeMo 12B 和 Mistral Large 2 之间,提供了一种经济高效的解决方案,可以在各种平台和环境中部署。
Ministral-8B-Instruct-2410
Ministral-8B-Instruct-2410 语言模型是一款指令微调模型,在 Mistral 研究许可下发布,其性能显著优于类似规模的现有模型。
相关文档
中国电信投资面壁智能,为大型语言模型及数据基础设施筹集71.3万元资金
在大模型领域,这支“国家队”与来自清华大学的领军人物正在深化战略合作。据企查查最新企业注册数据显示,2026年3月1日,北京面壁智能科技有限公司进行了重大股权重组,正式引入了电信巨头和行业基金的投资。这一转变不仅关乎资金注入——更预示着国内大模型在公共数据平台及智能硬件领域的商业化进程将大幅提速。核心亮点:电信巨头与本土基金的双重背书此次股权变更后,面壁智能的股东结构迎来了数家重要新成员:中国电信
陶天集团加速推进AI原生转型,向实习生发放免费代币配额
陶天集团近期推出了“AI生产力计划”,旨在通过资源配置和工具补贴,加速将AI技术融入电商运营及研发工作流程。该计划现已向所有实习生开放,使其在实习期间享有与正式员工同等的AI权限、计算配额及审批流程。自3月17日起,淘天集团员工已获授权免费使用多款付费AI工具,包括悟空和Qoder系列。这些工具支持从基础技术研发到日常办公效率提升等广泛应用场景。 通过直接提供Token配额,公司降低了使用大型语言
Glean瞄准企业级AI基础设施市场,展开抢占先机之战
争夺企业人工智能主导权的竞争正在加速。微软正将 Copilot 嵌入 Office,谷歌则将 Gemini 整合到 Workspace 中,而 OpenAI 和 Anthropic 都在直接向企业销售产品。与此同时,如今几乎每家 SaaS 供应商都配备了人工智能助手。在各方争相掌控用户界面的热潮中,Glean却采取了一种更低调的策略:成为底层的智能架构。七年前,Glean以“职场版谷歌”的定位起家
藏语语言模型在北京科技博览会上广受好评
在第28届中国北京国际科技产业博览会上,一款能够“理解”藏语并运用藏式思维生成内容的大型语言模型引起了广泛关注。 该模型由西藏大学研究团队开发,命名为“DeepZang”,它展示了人工智能在多语言处理方面的突破,并凸显了少数民族语言如何迅速融入全球数字格局。多年来,主流的大型语言模型主要基于中文和英语进行训练,因此当应用于藏语等少数民族语言时,生成的内容往往充斥着生硬的翻译痕迹。 为克服这一挑战,
Anthropic以200亿美元身价被谷歌收购,人工智能计算领域的竞争日趋白热化
随着人工智能领域的竞争日益激烈,Anthropic等领先的人工智能初创公司已采取重大举措。消息人士称,该公司已正式承诺在未来五年内向谷歌支付高达200亿美元。这笔巨额资金将主要用于云计算资源以及专门为人工智能训练定制的芯片。此项协议不仅创下了行业合作规模的新纪录,更标志着两家公司在基础设施层面实现了前所未有的深度融合。 对Anthropic而言,确保大规模、高效的计算能力供应对模型开发至关重要。对





首页
