Maison
Comment faire évoluer les grands modèles : la stratégie de Yang Zhilin présentée lors de la GTC concernant l'efficacité des tokens et les clusters d'agents

La clé pour aborder la seconde moitié de l'ère des grands modèles ne réside plus simplement dans l'augmentation de la puissance de calcul, mais dans une refonte fondamentale de l'architecture sous-jacente.
Lors de la conférence NVIDIA GTC 2026 qui s'est tenue le 18 mars, Yang Zhilin, fondateur de Moonshot AI, a prononcé un discours très attendu. Il s'agissait de sa première présentation publique complète de la feuille de route technique sous-jacente au modèle Kimi K2.5 , offrant une nouvelle perspective sur l'évolution des grands modèles à l'ère « post-scaling ».
Yang Zhilin a déclaré que pour dépasser les limites actuelles de l'intelligence, une restructuration complète des technologies clés telles que les optimiseurs, les mécanismes d'attention et les connexions résiduelles est essentielle. Il a présenté l'évolution de Kimi selon trois dimensions synergiques :
Efficacité des tokens : éliminer le gaspillage de ressources pour atteindre un rapport calcul/performance encore plus extrême.
Contexte long : approfondir en permanence l'avantage de Kimi en matière de mémoire de contexte long pour traiter des informations à très grande échelle.
Groupe d'agents : l'intelligence évolue, passant d'agents individuels à des « groupes numériques » générés dynamiquement.
Selon Yang Zhilin, la mise à l'échelle consiste désormais à rechercher des effets d'échelle en matière d'efficacité, de mémoire et de collaboration automatisée. Multiplier les gains issus de ces trois dimensions pourrait ouvrir la voie à des niveaux d'intelligence bien au-delà des capacités actuelles.
Selon des annonces précédentes, le modèle Kimi K2.5 lancé début janvier démontre déjà cette capacité « polyvalente ». En tant que modèle open source le plus puissant de Moonshot AI à ce jour, il dispose d’une architecture multimodale native, atteint des performances de pointe (SOTA) en compréhension du code et visuelle, et prend en charge une commutation flexible entre les modes « pensant » et « non pensant » pour s’adapter précisément aux tâches basées sur des agents.
À mesure que l'approche technologique de Moonshot AI se précise, la compétition entre les grands modèles se déplace du « nombre de paramètres » vers la « densité d'intelligence ». Les clusters d'agents émergeant comme une forme potentielle ultime de l'intelligence future, la question de savoir si Kimi peut réaliser une percée dans le cadre de la « multiplication tridimensionnelle » de Yang Zhilin est devenue un enjeu central pour l'industrie.
Article connexe
La start-up de codage Cursor AI prévoit d'embaucher 200 personnes dans la région Asie-Pacifique après avoir reçu un investissement important de la part de SpaceX
La start-up spécialisée dans le codage IA Cursor a annoncé une expansion mondiale majeure, prévoyant de recruter 200 collaborateurs dans la région Asie-Pacifique au cours des six prochains mois. Les p
Claude a été utilisé pour créer des paquets npm malveillants : plus de 670 paquets compromis menacent l'open source
Un incident de cybersécurité récent met en lumière la manière dont les grands modèles linguistiques (LLM) sont détournés pour développer des logiciels malveillants. Le chercheur en sécurité Sibi Moosa
Reliance dévoile un plan d'investissement de 110 milliards de dollars dans l'IA alors que l'Inde accélère sa transition technologique
Mukesh Ambani, le président milliardaire du conglomérat indien Reliance, a annoncé jeudi un plan de 10 000 milliards de roupies (environ 110 milliards de dollars) visant à mettre en place une infrastr
Recommandations de sujets spéciaux liés
commentaires (0)

La clé pour aborder la seconde moitié de l'ère des grands modèles ne réside plus simplement dans l'augmentation de la puissance de calcul, mais dans une refonte fondamentale de l'architecture sous-jacente.
Lors de la conférence NVIDIA GTC 2026 qui s'est tenue le 18 mars, Yang Zhilin, fondateur de Moonshot AI, a prononcé un discours très attendu. Il s'agissait de sa première présentation publique complète de la feuille de route technique sous-jacente au modèle
Yang Zhilin a déclaré que pour dépasser les limites actuelles de l'intelligence, une restructuration complète des technologies clés telles que les optimiseurs, les mécanismes d'attention et les connexions résiduelles est essentielle. Il a présenté l'évolution de Kimi selon trois dimensions synergiques :
Efficacité des tokens : éliminer le gaspillage de ressources pour atteindre un rapport calcul/performance encore plus extrême.
Contexte long : approfondir en permanence l'avantage de Kimi en matière de mémoire de contexte long pour traiter des informations à très grande échelle.
Groupe d'agents : l'intelligence évolue, passant d'agents individuels à des « groupes numériques » générés dynamiquement.
Selon Yang Zhilin, la mise à l'échelle consiste désormais à rechercher des effets d'échelle en matière d'efficacité, de mémoire et de collaboration automatisée. Multiplier les gains issus de ces trois dimensions pourrait ouvrir la voie à des niveaux d'intelligence bien au-delà des capacités actuelles.
Selon des annonces précédentes, le modèle Kimi K2.5 lancé début janvier démontre déjà cette capacité « polyvalente ». En tant que modèle open source le plus puissant de Moonshot AI à ce jour, il dispose d’une architecture multimodale native, atteint des performances de pointe (SOTA) en compréhension du code et visuelle, et prend en charge une commutation flexible entre les modes « pensant » et « non pensant » pour s’adapter précisément aux tâches basées sur des agents.
À mesure que l'approche technologique de Moonshot AI se précise, la compétition entre les grands modèles se déplace du « nombre de paramètres » vers la « densité d'intelligence ». Les clusters d'agents émergeant comme une forme potentielle ultime de l'intelligence future, la question de savoir si
La start-up de codage Cursor AI prévoit d'embaucher 200 personnes dans la région Asie-Pacifique après avoir reçu un investissement important de la part de SpaceX
La start-up spécialisée dans le codage IA Cursor a annoncé une expansion mondiale majeure, prévoyant de recruter 200 collaborateurs dans la région Asie-Pacifique au cours des six prochains mois. Les p
Claude a été utilisé pour créer des paquets npm malveillants : plus de 670 paquets compromis menacent l'open source
Un incident de cybersécurité récent met en lumière la manière dont les grands modèles linguistiques (LLM) sont détournés pour développer des logiciels malveillants. Le chercheur en sécurité Sibi Moosa
Reliance dévoile un plan d'investissement de 110 milliards de dollars dans l'IA alors que l'Inde accélère sa transition technologique
Mukesh Ambani, le président milliardaire du conglomérat indien Reliance, a annoncé jeudi un plan de 10 000 milliards de roupies (environ 110 milliards de dollars) visant à mettre en place une infrastr











