Moortech S5000 GPU的突破性技术为中国移动的“九天”AI模型提供动力
在即将举行的第九届数字中国峰会上,中国移动自主研发的“九天”35B通用大型语言模型将正式亮相。作为国内计算生态系统的一项重大进展,摩尔线程近日宣布,其旗舰级全能GPU——MTT S5000已完成该模型的全流程适配及推理验证。
此次适配的核心在于深度集成。Moore Threads依托其专有的MUSA软件栈和SGLang-MUSA高性能推理引擎,成功实现了“九天”35B模型的完整推理管道。 通过对MUSA C开发框架、muDNN计算库及开源MATE运算符库的协同优化,MTT S5000针对大模型特有的注意力机制和长序列推理需求进行了精细调优,确保在处理长文本及高并发请求时能保持高效稳定的性能。

作为此次适配的技术基石,MTT S5000计算卡展现了卓越的性能。该GPU基于第四代MUSA“平湖”架构,单卡最高AI密计算性能可达1000 TFLOPS。 其硬件配置包含80GB大容量VRAM,内存带宽达1.6 TB/s,支持从FP8到FP64的全精度计算。此外,高达784 GB/s的卡间互联带宽,确保了在复杂智能计算场景下的卓越可扩展性。
此次合作不仅验证了国产GPU在支撑中央国有企业核心大模型方面的可靠性,也彰显了摩尔线程在高性能运算优化及软件生态系统建设方面的成熟度。随着“九天”350亿参数模型的正式发布,这一“国产大模型+国产算力”的组合,为构建自主可控的计算基础设施提供了极具参考价值的实践案例。
相关文章
英国各政府部门就人工智能数据中心的能源需求问题发生争执
英国政府正面临一项重大挑战:在推动清洁能源发展的同时,力争成为人工智能领域的全球领导者。然而,负责实现这些目标的各部门之间却存在严重分歧。 科学、创新与技术部(DSIT)与能源安全与净零部(DESNZ)对人工智能数据中心的未来电力需求做出了截然不同的预测。DSIT预测,到2030年,人工智能数据中心将需要6吉瓦的电力,而DESNZ的估计则不到这一数字的十分之一。 这一差距引起了非营利组织Foxgl
中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注
中国国家互联网信息办公室出台了一项全面计划,旨在规范短视频内容标注,要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题,监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上,现已将内容标注作为短视频发布流程中的强制性环节。 发布者必须从六种选项中选择其一:“虚构演绎”、“AI生成”、“含营销信息”
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech
相关专题推荐
评论 (0)
0/500
在即将举行的第九届数字中国峰会上,中国移动自主研发的“九天”35B通用大型语言模型将正式亮相。作为国内计算生态系统的一项重大进展,摩尔线程近日宣布,其旗舰级全能GPU——MTT S5000已完成该模型的全流程适配及推理验证。
此次适配的核心在于深度集成。Moore Threads依托其专有的MUSA软件栈和SGLang-MUSA高性能推理引擎,成功实现了“九天”35B模型的完整推理管道。 通过对MUSA C开发框架、muDNN计算库及开源MATE运算符库的协同优化,MTT S5000针对大模型特有的注意力机制和长序列推理需求进行了精细调优,确保在处理长文本及高并发请求时能保持高效稳定的性能。

作为此次适配的技术基石,MTT S5000计算卡展现了卓越的性能。该GPU基于第四代MUSA“平湖”架构,单卡最高AI密计算性能可达1000 TFLOPS。 其硬件配置包含80GB大容量VRAM,内存带宽达1.6 TB/s,支持从FP8到FP64的全精度计算。此外,高达784 GB/s的卡间互联带宽,确保了在复杂智能计算场景下的卓越可扩展性。
此次合作不仅验证了国产GPU在支撑中央国有企业核心大模型方面的可靠性,也彰显了摩尔线程在高性能运算优化及软件生态系统建设方面的成熟度。随着“九天”350亿参数模型的正式发布,这一“国产大模型+国产算力”的组合,为构建自主可控的计算基础设施提供了极具参考价值的实践案例。
英国各政府部门就人工智能数据中心的能源需求问题发生争执
英国政府正面临一项重大挑战:在推动清洁能源发展的同时,力争成为人工智能领域的全球领导者。然而,负责实现这些目标的各部门之间却存在严重分歧。 科学、创新与技术部(DSIT)与能源安全与净零部(DESNZ)对人工智能数据中心的未来电力需求做出了截然不同的预测。DSIT预测,到2030年,人工智能数据中心将需要6吉瓦的电力,而DESNZ的估计则不到这一数字的十分之一。 这一差距引起了非营利组织Foxgl
中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注
中国国家互联网信息办公室出台了一项全面计划,旨在规范短视频内容标注,要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题,监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上,现已将内容标注作为短视频发布流程中的强制性环节。 发布者必须从六种选项中选择其一:“虚构演绎”、“AI生成”、“含营销信息”
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech





首页






