Hogar
Google lanza el modelo de código abierto Gemma4 en cuatro versiones; la versión de 31 000 millones de parámetros ocupa el tercer puesto a nivel mundial
A las 4:03 a. m., hora de Pekín, del 3 de abril, Google lanzó oficialmente el modelo de lenguaje de gran tamaño de código abierto Gemma4. Con un avance revolucionario en la «eficiencia de parámetros por unidad», establece un nuevo punto de referencia para los modelos de código abierto en la gestión de flujos de trabajo de agentes inteligentes.
La serie incluye las eficientes variantes E2B (2,3B) y E4B (4,5B), junto con los modelos de alto rendimiento 26B MoE y 31B dense. Como última versión basada en la pila tecnológica Gemini3, Gemma4 ofrece compatibilidad total con entradas multimodales (imágenes y vídeos). Los modelos E2B y E4B también admiten de forma nativa la entrada de voz, lo que permite la comprensión de la voz en tiempo real en el borde.

En cuanto a la arquitectura técnica, los modelos de gran tamaño logran una eficiencia de hardware excepcional gracias a la optimización. La versión densa de 31B ocupa el tercer puesto a nivel mundial entre los modelos de código abierto en la clasificación de texto de Arena AI, mientras que la versión MoE de 26B ocupa la sexta posición. Sus capacidades de razonamiento lógico y de llamada a funciones son lo suficientemente robustas como para impulsar agentes autónomos complejos.
Para la implementación local, Gemma4 reduce drásticamente las barreras de acceso a la IA de vanguardia. Los pesos del modelo 31B no cuantificado pueden ejecutarse en una sola GPU H100 de 80 GB, mientras que las versiones cuantificadas son compatibles con GPU de consumo. Para dispositivos móviles y de IoT, los modelos E2B y E4B logran un procesamiento lógico de baja latencia en plataformas como Raspberry Pi y teléfonos inteligentes, gracias a la innovadora tecnología de incrustación PLE y a la compatibilidad con una longitud de contexto de 128K.
Este lanzamiento no solo pone de manifiesto el profundo compromiso de Google con el ecosistema de código abierto, sino que, a través de su licencia Apache 2.0, proporciona una base para que los desarrolladores de todo el mundo creen aplicaciones de IA localizadas y con un alto nivel de privacidad.
Artículo relacionado
Snowflake invierte más de 600 millones de dólares en chips personalizados de AWS para impulsar la IA empresarial
Snowflake, el gigante de los datos en la nube, ha anunciado sus planes de invertir más de 600 millones de dólares en los próximos seis años para adquirir procesadores de la serie Graviton y acelerador
China Telecom invierte en Mianbi Intelligence y aumenta su capital a 713 000 yuanes para modelos de lenguaje a gran escala (LLM) e infraestructura de datos
El «equipo nacional» y la figura destacada de la Universidad de Tsinghua en el ámbito de los modelos a gran escala están profundizando en su alineación estratégica. El 1 de marzo de 2026, según los úl
El Grupo Taotian acelera su reestructuración centrada en la IA y concede a los becarios cuotas de tokens gratuitas
El Grupo TaoTian ha presentado recientemente el «Plan de Productividad con IA», diseñado para acelerar la integración de la tecnología de IA en las operaciones de comercio electrónico y los flujos de
Recomendaciones de temas especiales relacionados
comentario (1)
0/500
A las 4:03 a. m., hora de Pekín, del 3 de abril, Google lanzó oficialmente el modelo de lenguaje de gran tamaño de código abierto Gemma4. Con un avance revolucionario en la «eficiencia de parámetros por unidad», establece un nuevo punto de referencia para los modelos de código abierto en la gestión de flujos de trabajo de agentes inteligentes.
La serie incluye las eficientes variantes E2B (2,3B) y E4B (4,5B), junto con los modelos de alto rendimiento 26B MoE y 31B dense. Como última versión basada en la pila tecnológica Gemini3, Gemma4 ofrece compatibilidad total con entradas multimodales (imágenes y vídeos). Los modelos E2B y E4B también admiten de forma nativa la entrada de voz, lo que permite la comprensión de la voz en tiempo real en el borde.

En cuanto a la arquitectura técnica, los modelos de gran tamaño logran una eficiencia de hardware excepcional gracias a la optimización. La versión densa de 31B ocupa el tercer puesto a nivel mundial entre los modelos de código abierto en la clasificación de texto de Arena AI, mientras que la versión MoE de 26B ocupa la sexta posición. Sus capacidades de razonamiento lógico y de llamada a funciones son lo suficientemente robustas como para impulsar agentes autónomos complejos.
Para la implementación local, Gemma4 reduce drásticamente las barreras de acceso a la IA de vanguardia. Los pesos del modelo 31B no cuantificado pueden ejecutarse en una sola GPU H100 de 80 GB, mientras que las versiones cuantificadas son compatibles con GPU de consumo. Para dispositivos móviles y de IoT, los modelos E2B y E4B logran un procesamiento lógico de baja latencia en plataformas como Raspberry Pi y teléfonos inteligentes, gracias a la innovadora tecnología de incrustación PLE y a la compatibilidad con una longitud de contexto de 128K.
Este lanzamiento no solo pone de manifiesto el profundo compromiso de Google con el ecosistema de código abierto, sino que, a través de su licencia Apache 2.0, proporciona una base para que los desarrolladores de todo el mundo creen aplicaciones de IA localizadas y con un alto nivel de privacidad.
Snowflake invierte más de 600 millones de dólares en chips personalizados de AWS para impulsar la IA empresarial
Snowflake, el gigante de los datos en la nube, ha anunciado sus planes de invertir más de 600 millones de dólares en los próximos seis años para adquirir procesadores de la serie Graviton y acelerador
China Telecom invierte en Mianbi Intelligence y aumenta su capital a 713 000 yuanes para modelos de lenguaje a gran escala (LLM) e infraestructura de datos
El «equipo nacional» y la figura destacada de la Universidad de Tsinghua en el ámbito de los modelos a gran escala están profundizando en su alineación estratégica. El 1 de marzo de 2026, según los úl
El Grupo Taotian acelera su reestructuración centrada en la IA y concede a los becarios cuotas de tokens gratuitas
El Grupo TaoTian ha presentado recientemente el «Plan de Productividad con IA», diseñado para acelerar la integración de la tecnología de IA en las operaciones de comercio electrónico y los flujos de











