Modelo gigante de IA japonês é acusado de copiar o DeepSeek

Um lançamento de grande repercussão no setor de tecnologia do Japão desencadeou um debate público sobre a transparência tecnológica. O Grupo Rakuten revelou recentemente o que descreve como o “maior e mais poderoso” modelo de linguagem de grande escala desenvolvido internamente. Esse modelo de 70 bilhões de parâmetros é um dos principais resultados de um projeto apoiado pelo Ministério da Economia, Comércio e Indústria do Japão (METI) no âmbito de sua iniciativa GENIAC. Logo após seu lançamento, no entanto, a comunidade de código aberto começou a questionar se se tratava apenas de uma versão reempacotada de um modelo já existente.
Os desenvolvedores descobriram que a arquitetura central e o arquivo de configuração do modelo apontavam inequivocamente para um modelo criado por uma equipe chinesa. As evidências indicam que o modelo da Rakuten não apenas manteve o identificador original “DeepseekV3ForCausalLM”, mas era, na verdade, uma adaptação otimizada usando dados japoneses, e não um desenvolvimento totalmente novo.
A controvérsia gira em torno do que muitos consideram uma “área cinzenta” nas comunicações e no gerenciamento de licenças da Rakuten:
Divulgação inadequada: O comunicado de imprensa oficial mencionou apenas “integrar a essência da comunidade de código aberto”, deixando de reconhecer a origem do modelo fundamental.
Problemas de gerenciamento de licenças: a comunidade destacou que o lançamento inicial da Rakuten pode ter omitido os arquivos de licença MIT exigidos. Embora um arquivo NOTICE tenha sido adicionado posteriormente para cumprir os termos legais, essa correção retroativa foi criticada por carecer de transparência e intenção genuína.
Até o momento, o Grupo Rakuten não abordou diretamente a remoção dos arquivos de licença nem as impressionantes semelhanças arquitetônicas.
Artigo relacionado
O sistema de cobrança baseado em tokens do Github Copilot provoca indignação entre os desenvolvedores.
A era de ouro do GitHub Copilot da Microsoft pode estar chegando ao fim, especialmente para os usuários individuais. A empresa está passando de um modelo de assinatura fixa para um sistema de cobrança baseado em tokens, o que pode aumentar significat
Pontos destacados do documento de oferta pública inicial da SpaceX: ambições de expansão na área de internet por satélite e inteligência artificial
Em seu documento de registro S-1 apresentado antes do planejado IPO, a SpaceX revelou vários indicadores empresariais impressionantes que destacam sua forte presença no campo das comunicações aeroespaciais e da inteligência artificial:Mais de 10 mil
Alibaba Tuhao M890 estreia com desempenho triplamente superior, marcando o início de uma nova era de agentes full-stack para modelos de inferência em nuvem e chip.
Em 20 de maio de 2026, no Alibaba Cloud Summit, a empresa anunciou a conclusão de uma atualização do sistema tecnológico full-stack projetada para a era dos agentes inteligentes. Essa transformação redefiniu todo o processo, desde os chips e a plataf
Recomendações de tópicos especiais relacionados
Comentários (0)

Um lançamento de grande repercussão no setor de tecnologia do Japão desencadeou um debate público sobre a transparência tecnológica. O Grupo Rakuten revelou recentemente o que descreve como o “maior e mais poderoso” modelo de linguagem de grande escala desenvolvido internamente. Esse modelo de 70 bilhões de parâmetros é um dos principais resultados de um projeto apoiado pelo Ministério da Economia, Comércio e Indústria do Japão (METI) no âmbito de sua iniciativa GENIAC. Logo após seu lançamento, no entanto, a comunidade de código aberto começou a questionar se se tratava apenas de uma versão reempacotada de um modelo já existente.
Os desenvolvedores descobriram que a arquitetura central e o arquivo de configuração do modelo apontavam inequivocamente para um modelo criado por uma equipe chinesa. As evidências indicam que o modelo da Rakuten não apenas manteve o identificador original “DeepseekV3ForCausalLM”, mas era, na verdade, uma adaptação otimizada usando dados japoneses, e não um desenvolvimento totalmente novo.
A controvérsia gira em torno do que muitos consideram uma “área cinzenta” nas comunicações e no gerenciamento de licenças da Rakuten:
Divulgação inadequada: O comunicado de imprensa oficial mencionou apenas “integrar a essência da comunidade de código aberto”, deixando de reconhecer a origem do modelo fundamental.
Problemas de gerenciamento de licenças: a comunidade destacou que o lançamento inicial da Rakuten pode ter omitido os arquivos de licença MIT exigidos. Embora um arquivo NOTICE tenha sido adicionado posteriormente para cumprir os termos legais, essa correção retroativa foi criticada por carecer de transparência e intenção genuína.
Até o momento, o Grupo Rakuten não abordou diretamente a remoção dos arquivos de licença nem as impressionantes semelhanças arquitetônicas.
O sistema de cobrança baseado em tokens do Github Copilot provoca indignação entre os desenvolvedores.
A era de ouro do GitHub Copilot da Microsoft pode estar chegando ao fim, especialmente para os usuários individuais. A empresa está passando de um modelo de assinatura fixa para um sistema de cobrança baseado em tokens, o que pode aumentar significat
Pontos destacados do documento de oferta pública inicial da SpaceX: ambições de expansão na área de internet por satélite e inteligência artificial
Em seu documento de registro S-1 apresentado antes do planejado IPO, a SpaceX revelou vários indicadores empresariais impressionantes que destacam sua forte presença no campo das comunicações aeroespaciais e da inteligência artificial:Mais de 10 mil
Alibaba Tuhao M890 estreia com desempenho triplamente superior, marcando o início de uma nova era de agentes full-stack para modelos de inferência em nuvem e chip.
Em 20 de maio de 2026, no Alibaba Cloud Summit, a empresa anunciou a conclusão de uma atualização do sistema tecnológico full-stack projetada para a era dos agentes inteligentes. Essa transformação redefiniu todo o processo, desde os chips e a plataf





Lar






