opção
Lar
Lista de modelos AL
DBRX-Instruct
Modelo Parâmetro Quantidade
132B
Modelo Parâmetro Quantidade
Organização afiliada
DataBricks
Organização afiliada
Código aberto
Tipo de licença
Tempo de liberação
26 de Março de 2024
Tempo de liberação
Introdução ao modelo
DBRX-Instruct é um modelo MoE treinado do zero pela DataBricks, utilizando um esquema de seleção de 16 especialistas escolhendo 4, com um número de parâmetros ativos de 36B. Ele foi pré-treinado em 12T tokens, suportando um contexto de 32K.
Deslize para a esquerda e para a direita para ver mais
Capacidade de compreensão de idiomas Capacidade de compreensão de idiomas
Capacidade de compreensão de idiomas
Muitas vezes, faz mal julgamentos semânticos, levando a óbvias desconexões lógicas nas respostas.
2.5
Escopo de cobertura do conhecimento Escopo de cobertura do conhecimento
Escopo de cobertura do conhecimento
Possui pontos cegos significativos, geralmente mostrando erros factuais e repetindo informações desatualizadas.
6.6
Capacidade de raciocínio Capacidade de raciocínio
Capacidade de raciocínio
Incapaz de manter cadeias de raciocínio coerentes, geralmente causando causalidade invertida ou erros de cálculo.
2.0
Modelo relacionado
DBRX-Instruct DBRX-Instruct é um modelo MoE treinado do zero pela DataBricks, utilizando um esquema de seleção de 16 especialistas escolhendo 4, com um número de parâmetros ativos de 36B. Ele foi pré-treinado em 12T tokens, suportando um contexto de 32K.
Qwen2.5-7B-Instruct Assim como o Qwen2, os modelos de linguagem Qwen2.5 suportam até 128K tokens e podem gerar até 8K tokens. Eles também mantêm suporte multilíngue para mais de 29 idiomas, incluindo chinês, inglês, francês, espanhol, português, alemão, italiano, russo, japonês, coreano, vietnamita, tailandês, árabe e muito mais.
Hunyuan-T1-20250822 O modelo de raciocínio profundo desenvolvido de forma independente pela Tencent adota o número de versão hunyuan-t1-20250822.
Spark-X1 O modelo de inferência Spark X1 lançado pela iFlytek, além de liderar tarefas matemáticas domésticas, avalia o desempenho de tarefas gerais como inferência, geração de texto e compreensão linguística contra o OpenAI o1 e o DeepSeek R1.
Doubao-Seed-1.6-thinking-250715 A versão mais recente do modelo da série Seed lançado pela ByteDance, que suporta o modo de pensamento.
Documentos relevantes
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Google lança os Notebooks Gemini, combinando o NotebookLM com uma base de conhecimento pessoal O Google lançou recentemente o recurso “Notebooks” para o Gemini, projetado para ajudar os usuários a gerenciar projetos complexos por meio da criação de uma base de conhecimento personalizada. Essa a
A Luma AI apresenta o modelo autorregressivo Uni-1, capaz de gerar texto e pixels simultaneamente A Luma Labs lançou seu modelo de geração de imagens Uni-1 em 23 de março, marcando o primeiro modelo da empresa disponível ao público desenvolvido com base na arquitetura Unified Intelligence. O acess
Xinzhou Wu, da NVIDIA: chegou o momento “ChatGPT” da direção autônoma; a produção em massa do nível 4 não é mais um sonho No campo da IA física, em rápida evolução, a direção autônoma é frequentemente vista como o primeiro grande desafio a ser superado. Recentemente, Wu Xinzhou, vice-presidente da NVIDIA, apresentou a am
A Anthropic aumenta discretamente os preços do Claude Code; taxas diárias para desenvolvedores dobram As pressões de custo na programação de IA estão se tornando cada vez mais evidentes. A Anthropic, uma empresa líder no setor de IA, ajustou recentemente os preços de sua ferramenta de programação de I
Comparação de modelos
Inicie a comparação
OR