谷歌发布了 Gemma 4 12B,这是一个统一的多模态模型,它摒弃了传统的编码器,能够直接处理视觉和音频数据。该模型仅需 16GB 显存即可在消费级硬件上进行本地部署。通过采用轻量级嵌入层,它在降低计算复杂度的同时,性能已接近 26B 的 MoE 模型。 该模型在Apache 2.0协议下开源,支持多种推理框架和边缘部署,下载量已超过1.5亿次。
评论 (0)
0/300





首页
