InternVL3-78B VS SmolVLM-Instruct
| Nombre del modelo | Plataforma | Tiempo de lanzamiento | Cantidad de parámetros del modelo | Puntaje integral |
|---|---|---|---|---|
| InternVL3-78B | Shanghai AI Laboratory & Tsinghua University | 1 de junio de 2025 | 78.4B | 4.5 |
| SmolVLM-Instruct | HuggingFace | 1 de marzo de 2025 | 2.3B | 1.7 |
Breve comparación de InternVL3-78B vs SmolVLM-Instruct modelos AI
Evaluación integral
Ambos modelos presentan un bajo rendimiento en el razonamiento multimodal, con graves errores de interpretación de detalles visuales y razonamiento ilógico, lo que indica un nivel general de capacidad bajo。
Razonamiento multimodal
Both InternVL3-78B and SmolVLM-Instruct are weak in multimodal reasoning, exhibiting severe misinterpretation of visual information and shallow, chaotic cross-modal reasoning, with capabilities at a low level.
Creación multimodal
InternVL3-78B y SmolVLM-Instruct son débiles en la creación multimodal, mostrando una grave desconexión entre imagen y lenguaje, con creatividad superficial y caótica, y nivel de capacidad bajo。





Hogar
