opção
Lar Modelo multimodal InternVL3-2B VS VILA1.5-13B

InternVL3-2B VS VILA1.5-13B

Nome do modelo Plataforma Tempo de liberação Modelo Parâmetro Quantidade Pontuação abrangente
InternVL3-2B Shanghai AI Laboratory & Tsinghua University 1 de Junho de 2025 2.09B 3.0
VILA1.5-13B NVIDIA 1 de Março de 2025 13B 2.4
Deslize para a esquerda e para a direita para ver mais

Breve comparação de InternVL3-2B vs VILA1.5-13B modelos AI

Avaliação abrangente

Ambos os modelos apresentam baixo desempenho no raciocínio multimodal, com grave má interpretação dos detalhes visuais e raciocínio ilógico, indicando um nível geral de capacidade baixo.

Raciocínio multimodal

Both InternVL3-2B and VILA1.5-13B are weak in multimodal reasoning, exhibiting severe misinterpretation of visual information and shallow, chaotic cross-modal reasoning, with capabilities at a low level.

Criação multimodal

InternVL3-2B e VILA1.5-13B são fracos na criação multimodal, com grave desconexão entre imagem e linguagem, criatividade superficial e caótica, e nível de capacidade baixo。

OR