Hogar

Modelo multimodal

InternVL3-78B VS SmolVLM-Instruct

Nombre del modelo	Plataforma	Tiempo de lanzamiento	Cantidad de parámetros del modelo	Puntaje integral
InternVL3-78B	Shanghai AI Laboratory & Tsinghua University	1 de junio de 2025	78.4B	4.5
SmolVLM-Instruct	HuggingFace	1 de marzo de 2025	2.3B	1.7

Desliza hacia la izquierda y la derecha para ver más

Breve comparación de InternVL3-78B vs SmolVLM-Instruct modelos AI

Evaluación integral

Ambos modelos presentan un bajo rendimiento en el razonamiento multimodal, con graves errores de interpretación de detalles visuales y razonamiento ilógico, lo que indica un nivel general de capacidad bajo。

Razonamiento multimodal

Both InternVL3-78B and SmolVLM-Instruct are weak in multimodal reasoning, exhibiting severe misinterpretation of visual information and shallow, chaotic cross-modal reasoning, with capabilities at a low level.

Creación multimodal

InternVL3-78B y SmolVLM-Instruct son débiles en la creación multimodal, mostrando una grave desconexión entre imagen y lenguaje, con creatividad superficial y caótica, y nivel de capacidad bajo。