NVLM-D-72B VS VILA1.5-13B
| Nome do modelo | Plataforma | Tempo de liberação | Modelo Parâmetro Quantidade | Pontuação abrangente |
|---|---|---|---|---|
| NVLM-D-72B | Nvidia | 1 de Março de 2025 | 79.4B | 3.4 |
| VILA1.5-13B | NVIDIA | 1 de Março de 2025 | 13B | 2.4 |
Breve comparação de NVLM-D-72B vs VILA1.5-13B modelos AI
Avaliação abrangente
Ambos os modelos apresentam baixo desempenho no raciocínio multimodal, com grave má interpretação dos detalhes visuais e raciocínio ilógico, indicando um nível geral de capacidade baixo.
Raciocínio multimodal
Both NVLM-D-72B and VILA1.5-13B are weak in multimodal reasoning, exhibiting severe misinterpretation of visual information and shallow, chaotic cross-modal reasoning, with capabilities at a low level.
Criação multimodal
NVLM-D-72B e VILA1.5-13B são fracos na criação multimodal, com grave desconexão entre imagem e linguagem, criatividade superficial e caótica, e nível de capacidade baixo。





Lar
