Lar

Modelo multimodal

InternVL3-14B VS SmolVLM-Instruct

Nome do modelo	Plataforma	Tempo de liberação	Modelo Parâmetro Quantidade	Pontuação abrangente
InternVL3-14B	Shanghai AI Laboratory & Tsinghua University	1 de Junho de 2025	15.1B	4.0
SmolVLM-Instruct	HuggingFace	1 de Março de 2025	2.3B	1.7

Deslize para a esquerda e para a direita para ver mais

Breve comparação de InternVL3-14B vs SmolVLM-Instruct modelos AI

Avaliação abrangente

Ambos os modelos apresentam baixo desempenho no raciocínio multimodal, com grave má interpretação dos detalhes visuais e raciocínio ilógico, indicando um nível geral de capacidade baixo.

Raciocínio multimodal

Both InternVL3-14B and SmolVLM-Instruct are weak in multimodal reasoning, exhibiting severe misinterpretation of visual information and shallow, chaotic cross-modal reasoning, with capabilities at a low level.

Criação multimodal

InternVL3-14B e SmolVLM-Instruct são fracos na criação multimodal, com grave desconexão entre imagem e linguagem, criatividade superficial e caótica, e nível de capacidade baixo。