Maison
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.

Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitement – des puces sous-jacentes et de la plateforme cloud aux modèles et solutions d’inférence – positionnant ainsi Alibaba Cloud en tant que « usine d’intelligence artificielle » capable de faire fonctionner en continu, 24 heures sur 24, de très nombreux agents intelligents, allant au-delà du simple service aux utilisateurs humains.
1. Fondation essentielle : La puce Tengxun Zhenwu M890 et le serveur Super Node
Au cœur de cette mise à niveau se trouve la nouvelle génération de puce d’intelligence artificielle développée par Tengxun, la Zhenwu M890, qui intègre à la fois les fonctions d’entraînement et d’inférence.
Amélioration des performances : La M890 dispose de 144 Go de mémoire et offre trois fois plus de performances que son prédécesseur, la Zhenwu 810E. Elle prend en charge nativement une gamme de niveaux de précision des données allant de FP32 à FP4, ce qui en fait l’outil idéal pour les entraînements de haute précision ainsi que pour les inférences à très basse précision dans les scénarios d’agents intelligents.
Avancées en matière d’interconnexion des clusters : Grâce à l’intégration avec la puce d’interconnexion propriétaire ICN Switch 1.0, Alibaba Cloud a lancé le serveur Super Node Panjiu AL128, basé sur la Zhenwu M890. Ce serveur coordonne les fonctions de stockage, de calcul et de réseau au niveau du système, permettant des latences de communication à l’échelle des nanosecondes et améliorant considérablement l’efficacité et la stabilité des grands clusters d’informatique intelligente.
Planification future : Tengxun a dévoilé pour la première fois le plan de développement de sa gamme de puces Zhenwu, confirmant que les Zhenwu V900 et Zhenwu J900 seront lancées au cours des deux prochaines années, renforçant ainsi sa compétitivité à long terme sur le marché du calcul en centre de données.
2. Point d’accès essentiel : La réinvention de “Qwen Cloud” et une interaction centrée sur les agents
Alibaba Cloud a radicalement transformé la logique d’interaction avec le cloud. Alors que les plateformes cloud traditionnelles étaient conçues pour les humains – avec des panneaux de contrôle et des tableaux de bord – le cloud de l’ère des agents intelligents doit être adapté aux besoins de ces agents.
Le site web Qwen Cloud, nativement conçu pour l’intelligence artificielle : Ce site web remplace le catalogue de produits traditionnellement complexe par un code d’installation standardisé des compétences. Les agents peuvent interpréter directement ces instructions et utiliser automatiquement les fonctionnalités de calcul, de stockage et de modèles, sans avoir besoin de configurer manuellement les panneaux de contrôle.
Standardisation des capacités : Alibaba Cloud a regroupé plus de 150 modèles et fonctionnalités de produits cloud dans des outils standardisés tels que les Skills et les CLI. Avec une seule instruction, des outils comme Claude Code et les frameworks d’agents couramment utilisés peuvent installer et accéder rapidement à l’ensemble des capacités infrastructurelles d’Alibaba Cloud.
3. Stratégie technique : Intégration complète de la puce, du cloud, des modèles et de l’inférence
Ce nouveau système a été conçu pour relever les défis uniques posés par les workloads des agents intelligents, caractérisés par une élasticité irrégulière, des cycles de vie courts et une concurrence instantanée extrêmement élevée.
Optimisation approfondie : Alibaba Cloud propose non seulement des modèles tels que le leader Qwen3.7-Max, mais réalise également une planification optimale des ressources de calcul grâce à l’intégration profonde entre les puces Zhenwu et le framework d’inférence.
Changement d’objectif : Comme l’ont souligné Feifei Li, CTO d’Alibaba Cloud, et d’autres experts, l’accent des grands modèles d’intelligence artificielle a changé : il ne s’agit plus de plaire aux préférences humaines – c’est-à-dire de bien formuler les choses – mais plutôt de répondre aux objectifs des tâches à accomplir. L’évolution globale du système assure que les agents intelligents puissent effectuer efficacement des tâches complexes en quelques millisecondes, réduisant ainsi les obstacles à l’adoption de l’intelligence artificielle dans différents secteurs.
Résumé :
En combinant sa matrice de puces Tengxun avec le point d’accès Qwen Cloud et une approche complète d’inférence des modèles, Alibaba Cloud est devenue la première entreprise du secteur à passer d’un fournisseur de services de calcul en location à une « usine d’intelligence artificielle ». Ce système non seulement fournit l’infrastructure nécessaire au développement rapide des agents intelligents, mais démontre également l’ambition des leaders technologiques chinois de réformer les mécanismes mondiaux de productivité grâce à la collaboration entre hardware et software dans l’ère des agents intelligents.
Article connexe
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large
Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Le district de Shangcheng à Hangzhou lance les premières “Dix Mesures d’Or” audiovisuelles de Zhejiang dans le cadre du programme AIGC, avec la création d’un fonds industriel de 5 milliards de yuans.
Le 16ème, la Conférence sur l’écosystème d’innovation de l’industrie audiovisuelle AIGC s’est tenue dans le district de Shangcheng à Hangzhou. Lors de cet événement, la province a dévoilé sa première politique spécifique pour l’industrie audiovisuell
Recommandations de sujets spéciaux liés
commentaires (0)

Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitement – des puces sous-jacentes et de la plateforme cloud aux modèles et solutions d’inférence – positionnant ainsi Alibaba Cloud en tant que « usine d’intelligence artificielle » capable de faire fonctionner en continu, 24 heures sur 24, de très nombreux agents intelligents, allant au-delà du simple service aux utilisateurs humains.
1. Fondation essentielle : La puce Tengxun Zhenwu M890 et le serveur Super Node
Au cœur de cette mise à niveau se trouve la nouvelle génération de puce d’intelligence artificielle développée par Tengxun, la Zhenwu M890, qui intègre à la fois les fonctions d’entraînement et d’inférence.
Amélioration des performances : La M890 dispose de 144 Go de mémoire et offre trois fois plus de performances que son prédécesseur, la Zhenwu 810E. Elle prend en charge nativement une gamme de niveaux de précision des données allant de FP32 à FP4, ce qui en fait l’outil idéal pour les entraînements de haute précision ainsi que pour les inférences à très basse précision dans les scénarios d’agents intelligents.
Avancées en matière d’interconnexion des clusters : Grâce à l’intégration avec la puce d’interconnexion propriétaire ICN Switch 1.0, Alibaba Cloud a lancé le serveur Super Node Panjiu AL128, basé sur la Zhenwu M890. Ce serveur coordonne les fonctions de stockage, de calcul et de réseau au niveau du système, permettant des latences de communication à l’échelle des nanosecondes et améliorant considérablement l’efficacité et la stabilité des grands clusters d’informatique intelligente.
Planification future : Tengxun a dévoilé pour la première fois le plan de développement de sa gamme de puces Zhenwu, confirmant que les Zhenwu V900 et Zhenwu J900 seront lancées au cours des deux prochaines années, renforçant ainsi sa compétitivité à long terme sur le marché du calcul en centre de données.
2. Point d’accès essentiel : La réinvention de “Qwen Cloud” et une interaction centrée sur les agents
Alibaba Cloud a radicalement transformé la logique d’interaction avec le cloud. Alors que les plateformes cloud traditionnelles étaient conçues pour les humains – avec des panneaux de contrôle et des tableaux de bord – le cloud de l’ère des agents intelligents doit être adapté aux besoins de ces agents.
Le site web Qwen Cloud, nativement conçu pour l’intelligence artificielle : Ce site web remplace le catalogue de produits traditionnellement complexe par un code d’installation standardisé des compétences. Les agents peuvent interpréter directement ces instructions et utiliser automatiquement les fonctionnalités de calcul, de stockage et de modèles, sans avoir besoin de configurer manuellement les panneaux de contrôle.
Standardisation des capacités : Alibaba Cloud a regroupé plus de 150 modèles et fonctionnalités de produits cloud dans des outils standardisés tels que les Skills et les CLI. Avec une seule instruction, des outils comme Claude Code et les frameworks d’agents couramment utilisés peuvent installer et accéder rapidement à l’ensemble des capacités infrastructurelles d’Alibaba Cloud.
3. Stratégie technique : Intégration complète de la puce, du cloud, des modèles et de l’inférence
Ce nouveau système a été conçu pour relever les défis uniques posés par les workloads des agents intelligents, caractérisés par une élasticité irrégulière, des cycles de vie courts et une concurrence instantanée extrêmement élevée.
Optimisation approfondie : Alibaba Cloud propose non seulement des modèles tels que le leader Qwen3.7-Max, mais réalise également une planification optimale des ressources de calcul grâce à l’intégration profonde entre les puces Zhenwu et le framework d’inférence.
Changement d’objectif : Comme l’ont souligné Feifei Li, CTO d’Alibaba Cloud, et d’autres experts, l’accent des grands modèles d’intelligence artificielle a changé : il ne s’agit plus de plaire aux préférences humaines – c’est-à-dire de bien formuler les choses – mais plutôt de répondre aux objectifs des tâches à accomplir. L’évolution globale du système assure que les agents intelligents puissent effectuer efficacement des tâches complexes en quelques millisecondes, réduisant ainsi les obstacles à l’adoption de l’intelligence artificielle dans différents secteurs.
Résumé :
En combinant sa matrice de puces Tengxun avec le point d’accès Qwen Cloud et une approche complète d’inférence des modèles, Alibaba Cloud est devenue la première entreprise du secteur à passer d’un fournisseur de services de calcul en location à une « usine d’intelligence artificielle ». Ce système non seulement fournit l’infrastructure nécessaire au développement rapide des agents intelligents, mais démontre également l’ambition des leaders technologiques chinois de réformer les mécanismes mondiaux de productivité grâce à la collaboration entre hardware et software dans l’ère des agents intelligents.
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large
Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Le district de Shangcheng à Hangzhou lance les premières “Dix Mesures d’Or” audiovisuelles de Zhejiang dans le cadre du programme AIGC, avec la création d’un fonds industriel de 5 milliards de yuans.
Le 16ème, la Conférence sur l’écosystème d’innovation de l’industrie audiovisuelle AIGC s’est tenue dans le district de Shangcheng à Hangzhou. Lors de cet événement, la province a dévoilé sa première politique spécifique pour l’industrie audiovisuell











