Name: DeepSeek-R1-0528
Rating: 1 (61 reviews)
Author: DeepSeek

Lar

Lista de modelos AL

DeepSeek-R1-0528

Adicione comparação

671B

Modelo Parâmetro Quantidade

DeepSeek

Organização afiliada

Código aberto

Tipo de licença

28 de Maio de 2025

Tempo de liberação

Site oficial

Documentação do modelo

Figuras relacionadas

Zhenda Xie

Kai Dong

Qihao Zhu

Daya Guo

Liang Wenfeng

Introdução ao modelo

A versão mais recente do Deepseek R1.

Pontuação abrangente Diálogo de idiomas Reserva de conhecimento Associação de Raciocínio Cálculo matemático Escrita de código Comando seguindo

Deslize para a esquerda e para a direita para ver mais

Capacidade de compreensão de idiomas

Capaz de entender contextos complexos e gerar frases logicamente coerentes, embora ocasionalmente desativada no controle de tom.

8.3

Escopo de cobertura do conhecimento

Possui conhecimento central das disciplinas convencionais, mas tem cobertura limitada de campos interdisciplinares de ponta.

8.9

Capacidade de raciocínio

Incapaz de manter cadeias de raciocínio coerentes, geralmente causando causalidade invertida ou erros de cálculo.

6.2

Comparação de modelos

DeepSeek-R1-0528 vs Qwen2.5-7B-Instruct Assim como o Qwen2, os modelos de linguagem Qwen2.5 suportam até 128K tokens e podem gerar até 8K tokens. Eles também mantêm suporte multilíngue para mais de 29 idiomas, incluindo chinês, inglês, francês, espanhol, português, alemão, italiano, russo, japonês, coreano, vietnamita, tailandês, árabe e muito mais.

DeepSeek-R1-0528 vs Hunyuan-T1-20250822 O modelo de raciocínio profundo desenvolvido de forma independente pela Tencent adota o número de versão hunyuan-t1-20250822.

DeepSeek-R1-0528 vs Spark-X1 O modelo de inferência Spark X1 lançado pela iFlytek, além de liderar tarefas matemáticas domésticas, avalia o desempenho de tarefas gerais como inferência, geração de texto e compreensão linguística contra o OpenAI o1 e o DeepSeek R1.

DeepSeek-R1-0528 vs Doubao-Seed-1.6-251015 (Thinking) O modelo de raciocínio profundo lançado pela ByteDance, que suporta a troca manual de raciocínio profundo, e seu desempenho foi significativamente aprimorado em comparação com o doubao-1.5.

DeepSeek-R1-0528 vs Doubao-Seed-1.6-thinking-250715 A versão mais recente do modelo da série Seed lançado pela ByteDance, que suporta o modo de pensamento.

Modelo relacionado

DeepSeek-V3.2 A versão mais recente dos modelos da série Deepseek V3.

DeepSeek-V3.2-Exp A versão experimental mais recente dos modelos da série Deepseek V3.

DeepSeek-V3-0324 O DeepSeek-V3 supera outros modelos de código aberto, como Qwen2.5-72B e Llama-3.1-405B, em várias avaliações e corresponde ao desempenho de modelos de código fechado de alto nível, como GPT-4 e Claude-3.5-Sonnet.

DeepSeek-R1-0528 A versão mais recente do Deepseek R1.

DeepSeek-V2-Chat-0628 DeepSeek-V2 é um forte modelo de linguagem Mixture-of-Experts (MoE), caracterizado por treinamento econômico e inferência eficiente. Ele consiste em 236 bilhões de parâmetros no total, dos quais 21 bilhões são ativados para cada token. Em comparação com o DeepSeek 67B, o DeepSeek-V2 apresenta um desempenho superior, economizando 42,5% nos custos de treinamento, reduzindo o cache KV em 93,3% e aumentando a capacidade máxima de geração em 5,76 vezes.

Documentos relevantes

Xiaohongshu passa por reestruturação: Conan é nomeado presidente, cria o Departamento de IA e a Divisão Internacional Rednote Em 30 de abril, a Xiaohongshu enviou um memorando interno a todos os funcionários anunciando o lançamento de uma nova reestruturação organizacional. O cerne dessa mudança envolve a integração total de

O jogo "Xiaolongxia", da Tencent, supera as expectativas; equipe amplia capacidade em 10 vezes, pede desculpas e oferece indenização A Tencent lançou oficialmente o WorkBuddy, um agente inteligente de IA para todos os cenários, marcando uma nova fase na corrida pela camada de aplicação de modelos de grande porte, com alta integraçã

Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá

Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire

A Haier lança o robô exoesqueleto esportivo com IA mais leve do mundo, pesando apenas 1,75 kg O Grupo Haier apresentou o robô exoesqueleto com inteligência artificial mais leve do mundo para esportes — o Haier Exoskeleton Robot W3. Este lançamento estabelece um novo recorde do setor em termos

Comparação de modelos

Inicie a comparação