option
Maison
Nouvelles
Le modèle Open Source Seed-OSS-36B de ByteDance prend en charge un contexte de jetons de 512K

Le modèle Open Source Seed-OSS-36B de ByteDance prend en charge un contexte de jetons de 512K

29 novembre 2025
106

Le modèle Open Source Seed-OSS-36B de ByteDance prend en charge un contexte de jetons de 512K

TikTok fait à nouveau parler de lui depuis que la Maison Blanche a rejoint la populaire plateforme de médias sociaux, mais sa société mère ByteDance, une importante entreprise technologique chinoise, a également fait une annonce surprise.

L'unité de recherche en IA de l'entreprise, l'équipe Seed, a lancé aujourd'hui Seed-OSS-36B sur le dépôt de codes d'IA Hugging Face.

Seed-OSS-36B est une nouvelle série de grands modèles de langage (LLM) open-source conçus pour un raisonnement sophistiqué et une utilisation conviviale pour les développeurs, avec un contexte de jeton plus long que de nombreux modèles concurrents développés aux États-Unis, y compris les principaux modèles d'OpenAI et d'Anthropic.

La collection comprend trois variantes principales :

  • Seed-OSS-36B-Base avec données synthétiques
  • Seed-OSS-36B-Base sans données synthétiques
  • Seed-OSS-36B-Instruct

En publiant des versions synthétiques et non synthétiques du modèle Seed-OSS-36B-Base, l'équipe Seed a cherché à équilibrer les performances dans le monde réel et l'adaptabilité de la recherche.

La version à données synthétiques, entraînée avec des données d'instruction supplémentaires, obtient de meilleurs résultats sur des critères de référence établis et est conçue comme un modèle polyvalent plus performant.

En revanche, le modèle non synthétique supprime ces améliorations et fournit une base plus claire qui réduit le biais potentiel des données d'instruction synthétiques.

En fournissant les deux variantes, l'équipe offre aux utilisateurs pratiques des résultats améliorés tout en donnant aux chercheurs une base de référence impartiale pour étudier les techniques post-formation.

Le modèle Seed-OSS-36B-Instruct est quant à lui post-entraîné à l'aide de données d'instruction, et se concentre sur l'exécution des tâches et le respect des instructions au lieu de servir uniquement de modèle de base.

Les trois modèles sont sous licence Apache-2.0, ce qui permet aux chercheurs et aux développeurs d'entreprise de les utiliser, de les modifier et de les partager librement.

Cela signifie qu'ils peuvent être intégrés dans des applications commerciales, que ce soit pour des opérations internes ou des services destinés aux clients, sans que ByteDance ne facture de frais de licence ou d'API.

Cette initiative s'inscrit dans la tendance du milieu des années 2025, où les entreprises chinoises lancent des modèles avancés à code source ouvert, tandis que l'OpenAI s'efforce de suivre le rythme avec son propre duo gpt-oss à code source ouvert, récemment publié.

L'équipe Seed a conçu Seed-OSS pour une utilisation mondiale, en soulignant son adaptabilité en matière de raisonnement, ses fonctions axées sur les tâches et ses environnements multilingues.

Créée en 2023, l'équipe Seed s'est concentrée sur la création de modèles fondamentaux adaptés à la fois à la recherche et aux applications pratiques.

Conception et caractéristiques principales

La structure de Seed-OSS-36B intègre des éléments de conception reconnus tels que la modélisation causale du langage, l'attention groupée des requêtes, l'activation SwiGLU, la RMSNorm et l'encodage positionnel RoPE.

Chaque modèle contient 36 milliards de paramètres répartis sur 64 couches et prend en charge un vocabulaire de 155 000 mots.

L'une de ses caractéristiques principales est sa capacité inhérente de traitement de longs contextes, qui permet de traiter jusqu'à 512 000 mots-clés pour traiter de longs documents et des séquences logiques sans dégradation.

Cette capacité est deux fois supérieure à celle de la nouvelle famille GPT-5 d'OpenAI et correspond approximativement à la longueur d'un texte de 1 600 pages, soit à peu près la taille de la Bible.

Une autre caractéristique remarquable est le budget de réflexion, qui permet aux développeurs de définir la quantité de raisonnement que le modèle applique avant de générer une réponse.

Un mécanisme similaire apparaît dans d'autres versions open-source récentes, notamment le Nemotron-Nano-9B-v2 de Nvidia, également accessible via Hugging Face.

Concrètement, cela permet aux équipes de calibrer les performances en fonction de la complexité de la tâche et des besoins d'efficacité du déploiement.

Les valeurs budgétaires sont indiquées en multiples de 512 jetons, 0 permettant un mode de réponse direct.

Performances compétitives sur des benchmarks tiers

Les résultats des tests publiés placent Seed-OSS-36B parmi les grands modèles open-source les plus performants. La version Instruct, en particulier, obtient des résultats de pointe dans plusieurs domaines.

  • Mathématiques et raisonnement : Seed-OSS-36B-Instruct obtient 91,7 % sur AIME24 et 65 sur BeyondAIME, ce qui représente l'état de l'art en matière de logiciels libres (SOTA).
  • Codage : Sur LiveCodeBench v6, le modèle Instruct atteint 67,4, une autre marque SOTA.
  • Capacité de contexte long : Sur RULER à 128K de longueur de contexte, il atteint 94,6, le plus haut résultat open-source rapporté.
  • Performance du modèle de base : La variante Base à données synthétiques obtient 65,1 sur MMLU-Pro et 81,7 sur MATH, deux résultats de premier plan dans leur catégorie.

Le modèle de base non synthétique, bien que légèrement à la traîne dans plusieurs mesures, reste compétitif en soi.

Il surpasse la version synthétique sur GPQA-D, fournissant aux chercheurs une base de test plus propre et neutre en termes d'instructions.

Pour les entreprises qui évaluent des alternatives ouvertes, ces résultats indiquent que Seed-OSS est très prometteur pour les applications mathématiques intensives, de codage et de contexte long, tout en préservant la flexibilité pour les scénarios de recherche.

Accès et déploiement

Au-delà des performances, l'équipe Seed met l'accent sur l'accessibilité pour les développeurs. Les modèles peuvent être déployés via des transformateurs Hugging Face, avec une quantification en formats 4 bits et 8 bits pour minimiser l'utilisation de la mémoire.

Ils s'intègrent également à vLLM pour un service évolutif, avec des exemples d'installation et des directives pour les serveurs API.

Pour simplifier encore l'adoption, l'équipe fournit des scripts pour l'inférence, la personnalisation des messages et l'intégration des outils.

Pour les responsables techniques qui gèrent de petites équipes ou qui disposent de budgets limités, ces ressources permettent d'expérimenter des modèles à 36 milliards de paramètres.

Licence et considérations pour les décideurs d'entreprise

Disponibles sous Apache-2.0, ces modèles peuvent être adoptés sans licence restrictive, ce qui représente un avantage considérable pour les équipes qui évaluent les facteurs juridiques et opérationnels.

Pour les dirigeants qui évaluent l'écosystème des logiciels libres, cette version met en évidence trois points essentiels :

  • Des résultats de référence de premier ordre en mathématiques, en codage et en raisonnement en contexte long,
  • un équilibre entre des modèles synthétiques entraînés très performants et des bases de recherche impartiales,
  • Des fonctions d'accessibilité qui réduisent la complexité opérationnelle pour des unités d'ingénierie rationalisées.

En combinant des performances élevées et un déploiement adaptable sous une licence ouverte, l'équipe Seed de ByteDance a élargi les options disponibles pour les entreprises, les chercheurs et les développeurs.

Article connexe
L'IA révèle les intentions cachées dans les contenus d'actualité L'IA révèle les intentions cachées dans les contenus d'actualité Les modèles de type ChatGPT sont désormais entraînés à mettre au jour le point de vue sous-jacent d'un article d'actualité, même lorsque celui-ci est dissimulé derrière des citations, un cadrage ou un
TikTok lance une fonctionnalité permettant de limiter les contenus générés par l'IA dans le fil d'actualité TikTok lance une fonctionnalité permettant de limiter les contenus générés par l'IA dans le fil d'actualité TikTok, à l'origine une plateforme dédiée aux vidéos créées par les utilisateurs, lance une nouvelle fonctionnalité qui permet aux utilisateurs de régler la quantité de contenu généré par l'IA qui app
Claude 4.1 d'Anthropic surpasse les benchmarks de codage avant le lancement de GPT-5 Claude 4.1 d'Anthropic surpasse les benchmarks de codage avant le lancement de GPT-5 Anthropic a dévoilé lundi une version améliorée de son modèle d'IA haut de gamme, établissant ainsi une nouvelle référence en matière de performances pour les tâches d'ingénierie logicielle. Ce lancem
Recommandations de sujets spéciaux liés
Création d'animations Generateur d'animation AI pour Donghua : Créer des personnages de romans web et des avatars de bandes dessinées
Generateur d'animation AI pour Donghua : Créer des personnages de romans web et des avatars de bandes dessinées

Découvrez les meilleurs générateurs d’animés AI de 2026 pour la création de doublages en chinois. Notre liste, sélectionnée avec soin, propose des outils puissants pour créer des personnages incroyables pour des romans web et des avatars de comics. Comparez les options gratuites et payantes grâce à des tests réels. Trouvez le partenaire créatif idéal et donnez vie à vos histoires dès aujourd’hui sur XIX.AI.

10 outils
xix.ai
Création de bande dessinée Les meilleurs outils d'auto-coloration IA pour les mangas : appliquez des couleurs unies sans aucune erreur de cohérence
Les meilleurs outils d'auto-coloration IA pour les mangas : appliquez des couleurs unies sans aucune erreur de cohérence

Découvrez les meilleurs outils d'auto-coloration IA pour mangas de 2026 sur XIX.AI. Notre sélection regroupe des solutions de premier plan qui changent la donne : elles appliquent des couleurs unies sans aucune erreur de cohérence, ce qui booste votre productivité. Consultez nos comparatifs entre versions gratuites et payantes, nos tests en conditions réelles et nos classements mis à jour chaque semaine pour trouver l'outil qui vous convient le mieux. Profitez dès aujourd'hui de l'avantage de l'IA.

10 outils
xix.ai
en écrivant Les meilleurs créateurs de profils de fiction basés sur l'IA : générer des motivations de personnages cohérentes et des faiblesses fatales
Les meilleurs créateurs de profils de fiction basés sur l'IA : générer des motivations de personnages cohérentes et des faiblesses fatales

Découvrez les meilleurs outils de création de profils de personnages basés sur l'IA de 2026 pour donner de la profondeur à vos personnages. La sélection de XIX.AI regroupe les outils les mieux notés et les plus innovants, capables de générer des motivations cohérentes et des défauts fatals. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez dès maintenant votre potentiel de narration.

10 outils
xix.ai
Entreprise Les meilleurs logiciels d'optimisation des prix basés sur l'IA : suivez vos concurrents et ajustez automatiquement les prix de votre boutique
Les meilleurs logiciels d'optimisation des prix basés sur l'IA : suivez vos concurrents et ajustez automatiquement les prix de votre boutique

Découvrez les meilleurs logiciels d'optimisation des prix basés sur l'IA pour 2026 sur XIX.AI. Notre sélection comprend des outils de premier plan qui changent la donne : ils surveillent vos concurrents et ajustent automatiquement les prix de votre boutique pour maximiser vos bénéfices. Comparez les options gratuites et payantes grâce à des tests concrets. Prenez dès maintenant une longueur d'avance en matière de tarification.

10 outils
xix.ai
code Les meilleurs outils d'analyse de code basés sur l'IA : automatisez la conformité au code propre et refactorisez les fichiers des dépôts hérités
Les meilleurs outils d'analyse de code basés sur l'IA : automatisez la conformité au code propre et refactorisez les fichiers des dépôts hérités

Découvrez les meilleurs outils d'analyse de code par IA de 2026 sur XIX.AI. Notre sélection comprend des outils de premier plan, véritables révolutionnaires, permettant d'automatiser la conformité au code propre et de refactoriser les fichiers de dépôts hérités. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Prenez dès aujourd'hui une longueur d'avance grâce à l'IA.

10 outils
xix.ai
Synthèse vocale Les meilleures applications de synthèse vocale basées sur l'IA pour la dyslexie : un soutien à l'apprentissage et à l'efficacité en lecture pour les élèves
Les meilleures applications de synthèse vocale basées sur l'IA pour la dyslexie : un soutien à l'apprentissage et à l'efficacité en lecture pour les élèves

Découvrez les meilleures applications de synthèse vocale par IA de 2026, spécialement sélectionnées pour aider les personnes dyslexiques. Notre classement d'experts compare les outils gratuits et payants, en mettant en avant des fonctionnalités performantes qui améliorent l'efficacité de la lecture et l'apprentissage. Découvrez des solutions révolutionnaires à ne pas manquer pour libérer le potentiel des élèves. Commencez votre parcours sur XIX.AI.

10 outils
xix.ai
commentaires (0)
0/500
OR