opción
Hogar
Última hora
Contenido
StevenMartin
StevenMartin
4 de junio de 2026

Google ha lanzado Gemma 4 12B, un modelo multimodal unificado que prescinde de los codificadores tradicionales para procesar directamente datos visuales y de audio. Solo requiere 16 GB de VRAM para su implementación local en hardware de consumo. Mediante el uso de capas de incrustación ligeras, reduce la complejidad computacional al tiempo que se acerca al rendimiento del modelo MoE de 26 000 millones de parámetros. Con licencia de código abierto bajo Apache 2.0, es compatible con múltiples marcos de inferencia y la implementación en el borde, y cuenta con más de 150 millones de descargas.

Google ha lanzado Gemma 4 12B, un modelo multimodal unificado que prescinde de los codificadores tradicionales para procesar directamente datos visuales y de audio. Solo requiere 16 GB de VRAM para su implementación local en hardware de consumo. Mediante el uso de capas de incrustación ligeras, reduce la complejidad computacional al tiempo que se acerca al rendimiento del modelo MoE de 26 000 millones de parámetros. Con licencia de código abierto bajo Apache 2.0, es compatible con múltiples marcos de inferencia y la implementación en el borde, y cuenta con más de 150 millones de descargas.
comentario (0)
0/300
OR