Un modèle d'IA japonais de grande envergure accusé d'avoir copié DeepSeek

Un lancement très médiatisé dans le secteur technologique japonais a déclenché un débat public sur la transparence technologique. Le groupe Rakuten a récemment dévoilé ce qu’il décrit comme le « plus grand et le plus puissant » modèle linguistique de grande envergure développé en interne. Ce modèle de 70 milliards de paramètres est l’un des principaux résultats d’un projet soutenu par le ministère japonais de l’Économie, du Commerce et de l’Industrie (METI) dans le cadre de son initiative GENIAC. Peu après sa sortie, cependant, la communauté open source a commencé à se demander s'il ne s'agissait pas simplement d'une version remaniée d'un modèle existant.
Les développeurs ont découvert que l'architecture centrale et le fichier de configuration du modèle renvoyaient sans équivoque à un modèle créé par une équipe chinoise. Les preuves indiquent que le modèle de Rakuten a non seulement conservé l'identifiant d'origine « DeepseekV3ForCausalLM », mais qu'il s'agissait en réalité d'une adaptation affinée à partir de données japonaises, et non d'un développement entièrement nouveau.
La controverse porte sur ce que beaucoup considèrent comme une « zone grise » dans la communication et la gestion des licences de Rakuten :
Divulgation insuffisante : le communiqué de presse officiel mentionnait uniquement « l'intégration de l'essence de la communauté open source », sans reconnaître l'origine du modèle de base.
Problèmes de gestion des licences : la communauté a souligné que la version initiale de Rakuten aurait omis les fichiers de licence MIT requis. Bien qu'un fichier NOTICE ait été ajouté par la suite pour se conformer aux conditions légales, cette correction rétroactive a été critiquée pour son manque de transparence et d'intention sincère.
À ce jour, le groupe Rakuten n'a pas directement abordé la question de la suppression des fichiers de licence ni celle des similitudes architecturales frappantes.
Article connexe
La facturation basée sur des jetons de Github Copilot provoque la colère des développeurs
L'âge d'or de GitHub Copilot chez Microsoft semble prendre fin, en particulier pour les utilisateurs individuels. L'entreprise passe d'un modèle de tarification fixe à un système basé sur des jetons, ce qui pourrait augmenter considérablement les coû
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Recommandations de sujets spéciaux liés
commentaires (0)

Un lancement très médiatisé dans le secteur technologique japonais a déclenché un débat public sur la transparence technologique. Le groupe Rakuten a récemment dévoilé ce qu’il décrit comme le « plus grand et le plus puissant » modèle linguistique de grande envergure développé en interne. Ce modèle de 70 milliards de paramètres est l’un des principaux résultats d’un projet soutenu par le ministère japonais de l’Économie, du Commerce et de l’Industrie (METI) dans le cadre de son initiative GENIAC. Peu après sa sortie, cependant, la communauté open source a commencé à se demander s'il ne s'agissait pas simplement d'une version remaniée d'un modèle existant.
Les développeurs ont découvert que l'architecture centrale et le fichier de configuration du modèle renvoyaient sans équivoque à un modèle créé par une équipe chinoise. Les preuves indiquent que le modèle de Rakuten a non seulement conservé l'identifiant d'origine « DeepseekV3ForCausalLM », mais qu'il s'agissait en réalité d'une adaptation affinée à partir de données japonaises, et non d'un développement entièrement nouveau.
La controverse porte sur ce que beaucoup considèrent comme une « zone grise » dans la communication et la gestion des licences de Rakuten :
Divulgation insuffisante : le communiqué de presse officiel mentionnait uniquement « l'intégration de l'essence de la communauté open source », sans reconnaître l'origine du modèle de base.
Problèmes de gestion des licences : la communauté a souligné que la version initiale de Rakuten aurait omis les fichiers de licence MIT requis. Bien qu'un fichier NOTICE ait été ajouté par la suite pour se conformer aux conditions légales, cette correction rétroactive a été critiquée pour son manque de transparence et d'intention sincère.
À ce jour, le groupe Rakuten n'a pas directement abordé la question de la suppression des fichiers de licence ni celle des similitudes architecturales frappantes.
La facturation basée sur des jetons de Github Copilot provoque la colère des développeurs
L'âge d'or de GitHub Copilot chez Microsoft semble prendre fin, en particulier pour les utilisateurs individuels. L'entreprise passe d'un modèle de tarification fixe à un système basé sur des jetons, ce qui pourrait augmenter considérablement les coû
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen





Maison






