Maison
Kimi Yang Zhilin : L'entraînement des grands modèles entre dans la troisième phase de la recherche axée sur l'IA
Yang Zhilin, fondateur de Moonshot , a déclaré lors de la réunion annuelle du Forum de Zhongguancun, le 25 mars 2026, que l'entraînement des grands modèles entrait dans une troisième phase critique, portée par l'IA. Ce changement de paradigme marque le passage d'une approche reposant sur les données naturelles et l'annotation manuelle vers une auto-évolution hautement automatisée.

En réfléchissant à la feuille de route technique, Yang Zhilin a décrit trois phases dans l'évolution des grands modèles : la première phase, il y a trois ans, dépendait principalement de données Internet naturelles et d'un alignement des valeurs annotées manuellement limité ; la deuxième phase, l'année dernière, était centrée sur l'apprentissage par renforcement à grande échelle, les chercheurs sélectionnant des tâches de haute qualité pour améliorer les performances des modèles. En 2026, un changement fondamental s'est produit dans les méthodes de recherche en IA, et le rôle des chercheurs évolue vers celui de « planificateur de calcul IA ». À ce nouveau stade, le processus de recherche est piloté par l'IA, qui utilise un nombre considérable de tokens pour synthétiser de manière autonome de nouvelles tâches et de nouveaux environnements, définir des paramètres de récompense optimaux, et même s'engager activement dans l'exploration de nouvelles architectures de réseau.
Cette tendance laisse présager une accélération exponentielle de l’efficacité de la recherche et du développement en IA. Moonshot a annoncé que son produit phare, Kimi , se concentrera sur l’avancement des frontières de la technologie intelligente et sur la promotion d’un écosystème technologique collaboratif et évolutif avec la communauté open source. La transition de « l'IA enseignée par l'homme » vers « l'IA guidant la recherche » n'est pas seulement une amélioration des méthodes de formation, mais aussi une étape importante sur la voie de la réalisation de l'intelligence artificielle générale (AGI), marquant le passage de l'apprentissage passif à l'exploration autonome.
Article connexe
La facturation basée sur des jetons de Github Copilot provoque la colère des développeurs
L'âge d'or de GitHub Copilot chez Microsoft semble prendre fin, en particulier pour les utilisateurs individuels. L'entreprise passe d'un modèle de tarification fixe à un système basé sur des jetons, ce qui pourrait augmenter considérablement les coû
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Recommandations de sujets spéciaux liés
commentaires (0)

En réfléchissant à la feuille de route technique, Yang Zhilin a décrit trois phases dans l'évolution des grands modèles : la première phase, il y a trois ans, dépendait principalement de données Internet naturelles et d'un alignement des valeurs annotées manuellement limité ; la deuxième phase, l'année dernière, était centrée sur l'apprentissage par renforcement à grande échelle, les chercheurs sélectionnant des tâches de haute qualité pour améliorer les performances des modèles. En 2026, un changement fondamental s'est produit dans les méthodes de recherche en IA, et le rôle des chercheurs évolue vers celui de « planificateur de calcul IA ». À ce nouveau stade, le processus de recherche est piloté par l'IA, qui utilise un nombre considérable de tokens pour synthétiser de manière autonome de nouvelles tâches et de nouveaux environnements, définir des paramètres de récompense optimaux, et même s'engager activement dans l'exploration de nouvelles architectures de réseau.
Cette tendance laisse présager une accélération exponentielle de l’efficacité de la recherche et du développement en IA. Moonshot a annoncé que son produit phare,
La facturation basée sur des jetons de Github Copilot provoque la colère des développeurs
L'âge d'or de GitHub Copilot chez Microsoft semble prendre fin, en particulier pour les utilisateurs individuels. L'entreprise passe d'un modèle de tarification fixe à un système basé sur des jetons, ce qui pourrait augmenter considérablement les coû
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen











