Дом
Прорывная технология графического процессора Moortech S5000 лежит в основе модели искусственного интеллекта Jiutian от China Mobile
На предстоящем 9-м саммите «Digital China» состоится официальная публичная премьера разработанной компанией China Mobile универсальной крупномасштабной языковой модели «Jiutian» с 35 миллиардами параметров. В качестве значительного прорыва для отечественной вычислительной экосистемы компания Moore Threads недавно объявила, что её флагманский полнофункциональный графический процессор MTT S5000 прошел полную адаптацию и проверку инференса для данной модели.
Суть этой адаптации заключается в глубокой интеграции. Используя свой собственный программный стек MUSA и высокопроизводительный движок инференции SGLang-MUSA, компания Moore Threads успешно реализовала весь конвейер инференции для модели «Jiutian» 35B. Благодаря совместной оптимизации среды разработки MUSA C, вычислительной библиотеки muDNN и библиотеки операторов с открытым исходным кодом MATE, MTT S5000 был точно настроен под специфические механизмы внимания и требования к выводу по длинным последовательностям, характерные для крупных моделей. Это обеспечивает эффективную и стабильную производительность при обработке длинных текстов и обработке запросов с высокой степенью параллелизма.

Вычислительная карта MTT S5000, служащая технической основой для этой адаптации, продемонстрировала исключительные возможности. Построенный на архитектуре MUSA «Pinghu» четвертого поколения, этот графический процессор обеспечивает максимальную плотную вычислительную мощность ИИ до 1000 ТФЛОПС на карту. Его аппаратная конфигурация включает 80 ГБ VRAM высокой емкости с пропускной способностью памяти 1,6 ТБ/с, поддерживающую вычисления с полной точностью от FP8 до FP64. Кроме того, высокая пропускная способность межкарточного соединения, равная 784 ГБ/с, обеспечивает отличную масштабируемость в сложных сценариях интеллектуальных вычислений.
Это сотрудничество не только подтверждает надежность отечественных графических процессоров в поддержке основных крупных моделей центральных государственных предприятий, но и подчеркивает зрелость Moore Threads в области высокопроизводительной оптимизации операторов и развития программной экосистемы. С официальным запуском модели «Jiutian» 35B эта комбинация «отечественная крупная модель + отечественная вычислительная мощность» предоставляет весьма актуальный практический пример создания независимой и контролируемой вычислительной инфраструктуры.
Связанная статья
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Заметки Талата по искусственному интеллекту хранятся прямо на вашем устройстве, а не в облаке
Granola — приложение для ведения заметок на базе искусственного интеллекта, оцениваемое в 250 миллионов долларов, — завоевало популярность среди основателей технологических компаний и венчурных инвест
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao
Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная
Рекомендации по связанным специальным темам
Комментарии (0)
На предстоящем 9-м саммите «Digital China» состоится официальная публичная премьера разработанной компанией China Mobile универсальной крупномасштабной языковой модели «Jiutian» с 35 миллиардами параметров. В качестве значительного прорыва для отечественной вычислительной экосистемы компания Moore Threads недавно объявила, что её флагманский полнофункциональный графический процессор MTT S5000 прошел полную адаптацию и проверку инференса для данной модели.
Суть этой адаптации заключается в глубокой интеграции. Используя свой собственный программный стек MUSA и высокопроизводительный движок инференции SGLang-MUSA, компания Moore Threads успешно реализовала весь конвейер инференции для модели «Jiutian» 35B. Благодаря совместной оптимизации среды разработки MUSA C, вычислительной библиотеки muDNN и библиотеки операторов с открытым исходным кодом MATE, MTT S5000 был точно настроен под специфические механизмы внимания и требования к выводу по длинным последовательностям, характерные для крупных моделей. Это обеспечивает эффективную и стабильную производительность при обработке длинных текстов и обработке запросов с высокой степенью параллелизма.

Вычислительная карта MTT S5000, служащая технической основой для этой адаптации, продемонстрировала исключительные возможности. Построенный на архитектуре MUSA «Pinghu» четвертого поколения, этот графический процессор обеспечивает максимальную плотную вычислительную мощность ИИ до 1000 ТФЛОПС на карту. Его аппаратная конфигурация включает 80 ГБ VRAM высокой емкости с пропускной способностью памяти 1,6 ТБ/с, поддерживающую вычисления с полной точностью от FP8 до FP64. Кроме того, высокая пропускная способность межкарточного соединения, равная 784 ГБ/с, обеспечивает отличную масштабируемость в сложных сценариях интеллектуальных вычислений.
Это сотрудничество не только подтверждает надежность отечественных графических процессоров в поддержке основных крупных моделей центральных государственных предприятий, но и подчеркивает зрелость Moore Threads в области высокопроизводительной оптимизации операторов и развития программной экосистемы. С официальным запуском модели «Jiutian» 35B эта комбинация «отечественная крупная модель + отечественная вычислительная мощность» предоставляет весьма актуальный практический пример создания независимой и контролируемой вычислительной инфраструктуры.
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Заметки Талата по искусственному интеллекту хранятся прямо на вашем устройстве, а не в облаке
Granola — приложение для ведения заметок на базе искусственного интеллекта, оцениваемое в 250 миллионов долларов, — завоевало популярность среди основателей технологических компаний и венчурных инвест
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao
Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная











