Maison
La technologie révolutionnaire du GPU Moortech S5000 alimente le modèle d'IA Jiutian de China Mobile
Lors du prochain 9e Sommet Digital China, le modèle linguistique généraliste « Jiutian » 35B, développé en interne par China Mobile, fera ses débuts officiels devant le grand public. S'agissant d'une avancée majeure pour l'écosystème informatique national, Moore Threads a récemment annoncé que son GPU phare et complet, le MTT S5000, avait achevé l'adaptation complète du processus et la vérification de l'inférence pour ce modèle.
Le cœur de cette adaptation réside dans une intégration en profondeur. En s'appuyant sur sa pile logicielle propriétaire MUSA et le moteur d'inférence haute performance SGLang-MUSA, Moore Threads a réussi à mettre en œuvre l'ensemble du pipeline d'inférence pour le modèle « Jiutian » 35B. Grâce à l'optimisation collaborative du cadre de développement MUSA C, de la bibliothèque de calcul muDNN et de la bibliothèque d'opérateurs open source MATE, le MTT S5000 a été finement réglé pour répondre aux mécanismes d'attention spécifiques et aux exigences d'inférence de longues séquences des grands modèles. Cela garantit des performances efficaces et stables lors du traitement de textes volumineux et de la gestion de requêtes à forte concurrence.

La carte de calcul MTT S5000, qui sert de base technique à cette adaptation, a démontré des capacités exceptionnelles. Basé sur l'architecture MUSA « Pinghu » de quatrième génération, ce GPU offre une puissance de calcul dense en IA pouvant atteindre 1 000 TFLOPS par carte. Sa configuration matérielle comprend 80 Go de VRAM haute capacité avec une bande passante mémoire de 1,6 To/s, prenant en charge le calcul en précision complète de FP8 à FP64. De plus, une bande passante d'interconnexion inter-cartes élevée de 784 Go/s garantit une excellente évolutivité dans des scénarios de calcul intelligent complexes.
Cette collaboration confirme non seulement la fiabilité des GPU nationaux pour prendre en charge les grands modèles de base des grandes entreprises publiques, mais met également en évidence la maturité de Moore Threads en matière d’optimisation haute performance et de développement d’écosystèmes logiciels. Avec le lancement officiel du modèle « Jiutian » 35B, cette combinaison « grand modèle national + puissance de calcul nationale » offre un cas pratique très pertinent pour la mise en place d’une infrastructure informatique indépendante et contrôlable.
Article connexe
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve
La nouvelle Roewe i6 arrive sur le marché au prix de 659 000 yuans, équipée d'un processeur Snapdragon 8155 et du modèle Doubao Large
SAIC Roewe a lancé aujourd'hui la nouvelle Roewe i6, une berline compacte qui reprend intégralement le langage stylistique de la Roewe D7. Sa grande calandre verticale caractéristique et sa barre lumi
Recommandations de sujets spéciaux liés
commentaires (0)
Lors du prochain 9e Sommet Digital China, le modèle linguistique généraliste « Jiutian » 35B, développé en interne par China Mobile, fera ses débuts officiels devant le grand public. S'agissant d'une avancée majeure pour l'écosystème informatique national, Moore Threads a récemment annoncé que son GPU phare et complet, le MTT S5000, avait achevé l'adaptation complète du processus et la vérification de l'inférence pour ce modèle.
Le cœur de cette adaptation réside dans une intégration en profondeur. En s'appuyant sur sa pile logicielle propriétaire MUSA et le moteur d'inférence haute performance SGLang-MUSA, Moore Threads a réussi à mettre en œuvre l'ensemble du pipeline d'inférence pour le modèle « Jiutian » 35B. Grâce à l'optimisation collaborative du cadre de développement MUSA C, de la bibliothèque de calcul muDNN et de la bibliothèque d'opérateurs open source MATE, le MTT S5000 a été finement réglé pour répondre aux mécanismes d'attention spécifiques et aux exigences d'inférence de longues séquences des grands modèles. Cela garantit des performances efficaces et stables lors du traitement de textes volumineux et de la gestion de requêtes à forte concurrence.

La carte de calcul MTT S5000, qui sert de base technique à cette adaptation, a démontré des capacités exceptionnelles. Basé sur l'architecture MUSA « Pinghu » de quatrième génération, ce GPU offre une puissance de calcul dense en IA pouvant atteindre 1 000 TFLOPS par carte. Sa configuration matérielle comprend 80 Go de VRAM haute capacité avec une bande passante mémoire de 1,6 To/s, prenant en charge le calcul en précision complète de FP8 à FP64. De plus, une bande passante d'interconnexion inter-cartes élevée de 784 Go/s garantit une excellente évolutivité dans des scénarios de calcul intelligent complexes.
Cette collaboration confirme non seulement la fiabilité des GPU nationaux pour prendre en charge les grands modèles de base des grandes entreprises publiques, mais met également en évidence la maturité de Moore Threads en matière d’optimisation haute performance et de développement d’écosystèmes logiciels. Avec le lancement officiel du modèle « Jiutian » 35B, cette combinaison « grand modèle national + puissance de calcul nationale » offre un cas pratique très pertinent pour la mise en place d’une infrastructure informatique indépendante et contrôlable.
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve
La nouvelle Roewe i6 arrive sur le marché au prix de 659 000 yuans, équipée d'un processeur Snapdragon 8155 et du modèle Doubao Large
SAIC Roewe a lancé aujourd'hui la nouvelle Roewe i6, une berline compacte qui reprend intégralement le langage stylistique de la Roewe D7. Sa grande calandre verticale caractéristique et sa barre lumi











