Maison
Baidu lance Ernie 5.1, réduisant les coûts de pré-entraînement de 94 % et se classant parmi les quatre premiers au niveau mondial
Baidu a officiellement lancé son modèle linguistique de nouvelle génération, Ernie 5.1, le 11 mai 2026. S'appuyant sur les bases de pré-entraînement d'Ernie 5.0 publiées plus tôt en janvier — un modèle comportant 2,4 billions de paramètres —, cette nouvelle version a été développée à l'aide d'un « cadre d'entraînement élastique en une seule fois » innovant. Cette approche a permis à Baidu d'optimiser plusieurs tailles de modèles en un seul cycle d'entraînement, réduisant ainsi les coûts de pré-entraînement d'Ernie 5.1 à seulement 6 % de ceux des modèles comparables.

Au 9 mai, Ernie 5.1 occupait la quatrième place mondiale et se classait premier parmi les modèles chinois au classement Arena Search avec un score de 1 223 points, démontrant ainsi son efficacité exceptionnelle et ses performances bien équilibrées.
Sur le plan architectural, Ernie 5.1 se caractérise par une conception en sous-modèles dont la profondeur, la largeur et le nombre d’experts actifs sont ajustables. Son nombre total de paramètres ne représente qu’un tiers de celui de son prédécesseur, et le nombre de paramètres effectifs activés par requête a été réduit de moitié environ. Pour remédier à « l’effet de balancier » courant dans l’entraînement multiconcompétences, Baidu a mis en œuvre un processus de post-entraînement en quatre phases. Cette méthode utilise un code d'entraînement spécialisé en parallèle, l'inférence et des modèles d'experts proxy, combinés à la distillation de stratégies et à l'apprentissage par renforcement, résolvant ainsi efficacement le défi sectoriel consistant à trouver un équilibre entre les capacités de programmation et le raisonnement créatif. De plus, une infrastructure d'apprentissage par renforcement remaniée dissocie les mises à jour du modèle, la génération de réponses et l'évaluation. Associée à une bibliothèque de calculs à faible précision standardisée, cela améliore considérablement la stabilité de l'entraînement à grande échelle.

Article connexe
Les revenus d’Anthropic augmentent de manière significative, et la valeur boursière approche le chiffre de un trillion de dollars.
Les rapports indiquent qu’Anthropic a enregistré une croissance significative de ses revenus en seulement quelques mois. Les revenus annuels de l’entreprise dépassent désormais 30 milliards de dollars, ce qui représente plus du triple par rapport à l
Apple retire l'application Cal AI en raison d'achats inappropriés à l'intérieur de l'application et de facturation frauduleuse.
La récente suppression par Apple de l’application Cal AI, une populaire application de suivi alimentaire utilisant l’intelligence artificielle et intégrée à MyFitnessPal, souligne son respect strict des politiques de l’App Store concernant les paieme
La facturation basée sur des jetons de Github Copilot provoque la colère des développeurs
L'âge d'or de GitHub Copilot chez Microsoft semble prendre fin, en particulier pour les utilisateurs individuels. L'entreprise passe d'un modèle de tarification fixe à un système basé sur des jetons, ce qui pourrait augmenter considérablement les coû
Recommandations de sujets spéciaux liés
commentaires (0)
Baidu a officiellement lancé son modèle linguistique de nouvelle génération, Ernie 5.1, le 11 mai 2026. S'appuyant sur les bases de pré-entraînement d'Ernie 5.0 publiées plus tôt en janvier — un modèle comportant 2,4 billions de paramètres —, cette nouvelle version a été développée à l'aide d'un « cadre d'entraînement élastique en une seule fois » innovant. Cette approche a permis à Baidu d'optimiser plusieurs tailles de modèles en un seul cycle d'entraînement, réduisant ainsi les coûts de pré-entraînement d'Ernie 5.1 à seulement 6 % de ceux des modèles comparables.

Au 9 mai, Ernie 5.1 occupait la quatrième place mondiale et se classait premier parmi les modèles chinois au classement Arena Search avec un score de 1 223 points, démontrant ainsi son efficacité exceptionnelle et ses performances bien équilibrées.
Sur le plan architectural, Ernie 5.1 se caractérise par une conception en sous-modèles dont la profondeur, la largeur et le nombre d’experts actifs sont ajustables. Son nombre total de paramètres ne représente qu’un tiers de celui de son prédécesseur, et le nombre de paramètres effectifs activés par requête a été réduit de moitié environ. Pour remédier à « l’effet de balancier » courant dans l’entraînement multiconcompétences, Baidu a mis en œuvre un processus de post-entraînement en quatre phases. Cette méthode utilise un code d'entraînement spécialisé en parallèle, l'inférence et des modèles d'experts proxy, combinés à la distillation de stratégies et à l'apprentissage par renforcement, résolvant ainsi efficacement le défi sectoriel consistant à trouver un équilibre entre les capacités de programmation et le raisonnement créatif. De plus, une infrastructure d'apprentissage par renforcement remaniée dissocie les mises à jour du modèle, la génération de réponses et l'évaluation. Associée à une bibliothèque de calculs à faible précision standardisée, cela améliore considérablement la stabilité de l'entraînement à grande échelle.

Les revenus d’Anthropic augmentent de manière significative, et la valeur boursière approche le chiffre de un trillion de dollars.
Les rapports indiquent qu’Anthropic a enregistré une croissance significative de ses revenus en seulement quelques mois. Les revenus annuels de l’entreprise dépassent désormais 30 milliards de dollars, ce qui représente plus du triple par rapport à l
Apple retire l'application Cal AI en raison d'achats inappropriés à l'intérieur de l'application et de facturation frauduleuse.
La récente suppression par Apple de l’application Cal AI, une populaire application de suivi alimentaire utilisant l’intelligence artificielle et intégrée à MyFitnessPal, souligne son respect strict des politiques de l’App Store concernant les paieme
La facturation basée sur des jetons de Github Copilot provoque la colère des développeurs
L'âge d'or de GitHub Copilot chez Microsoft semble prendre fin, en particulier pour les utilisateurs individuels. L'entreprise passe d'un modèle de tarification fixe à un système basé sur des jetons, ce qui pourrait augmenter considérablement les coû











