Gemma 2现在可供研究人员,开发人员访问

人工智能有能力应对我们今天面临的一些最艰巨的挑战——但前提是每个人都能获得使用它的工具。这就是为什么我们在年初推出了Gemma,一套轻量级、尖端的开放模型,采用了与我们的Gemini模型相同的技术。从那时起,我们通过与Hugging Face、NVIDIA和Ollama等公司的合作,扩展了Gemma家族,新增了CodeGemma、RecurrentGemma和PaliGemma,每种模型都针对不同的AI任务进行了优化,并且易于访问。
现在,我们激动地宣布Gemma 2面向全球研究人员和开发者发布。Gemma 2提供9亿(9B)和27亿(27B)参数规模,与前代相比,性能和效率显著提升,安全性也有了重大改进。27B版本是同类中的佼佼者,甚至能与参数规模超过其两倍的模型竞争,并且它可以在单个NVIDIA H100 Tensor Core GPU或TPU主机上运行,大幅降低了部署成本。我们实现了高性能且无需花费巨资,这不是很酷吗?
开放模型效率与性能的新标准
我们为Gemma 2重新设计了架构,力求实现顶尖的性能和效率。以下是它的独特之处:
- 超强性能:27B的Gemma 2在其类别中名列前茅,甚至能与参数规模超过其两倍的模型竞争。9B版本同样表现出色,超越了Llama 3 8B及其他同类别开放模型。想了解更多细节,请查看技术报告。
- 无与伦比的效率与成本节约:27B的Gemma 2可以在单个Google Cloud TPU主机、NVIDIA A100 80GB Tensor Core GPU或NVIDIA H100 Tensor Core GPU上以全精度流畅运行,这意味着您可以在不牺牲性能的情况下降低成本。这使得AI部署更加易于获取且预算友好。
- 跨硬件的超快推理:Gemma 2设计为在从游戏笔记本电脑、高端台式机到云端设置的各种硬件上快速运行。您可以在Google AI Studio中以全精度测试它,在您的CPU上使用Gemma.cpp的量化版本本地运行,或通过Hugging Face Transformers在您的家用电脑上使用NVIDIA RTX或GeForce RTX进行尝试。
为开发者与研究人员打造
Gemma 2不仅更强大,还设计为无缝融入您的工作流程:
- 开放且易于获取:与原始Gemma模型一样,Gemma 2采用对商业友好的许可证,允许开发者与研究人员分享和商业化他们的创作。
- 广泛的框架兼容性:通过与主要AI框架的兼容性,如Hugging Face Transformers、JAX、PyTorch、TensorFlow(通过原生Keras 3.0)、vLLM、Gemma.cpp、Llama.cpp和Ollama,您可以轻松将Gemma 2集成到您喜欢的工具和工作流程中。它还通过NVIDIA TensorRT-LLM为NVIDIA加速基础设施进行了优化,或作为NVIDIA NIM推理微服务,未来还将优化NVIDIA的NeMo。您可以立即通过Keras和Hugging Face开始微调,我们还在开发更多参数高效的微调选项。
- 轻松部署:从下个月起,Google Cloud客户可以通过Vertex AI轻松部署和管理Gemma 2。
深入体验新的Gemma Cookbook,里面包含实用示例和指南,帮助您构建自己的应用程序并为特定任务微调Gemma 2。学习如何使用您喜欢的工具与Gemma一起完成任务,例如检索增强生成。
负责任的AI开发
我们致力于帮助开发者与研究人员负责任地构建和部署AI。我们的负责任生成AI工具包是这一努力的一部分。最近开源的LLM Comparator可帮助对语言模型进行详细评估。从今天起,您可以使用配套的Python库运行模型和数据的对比评估,并在应用程序中可视化结果。我们还在努力开源我们的文本水印技术SynthID,适用于Gemma模型。
在训练Gemma 2时,我们遵循了严格的内部安全流程,过滤预训练数据,并针对广泛的指标进行彻底测试和评估,以识别和减轻潜在的偏见和风险。我们在与安全性和代表性危害相关的公共基准上分享了我们的结果。
基于Gemma的项目
我们的首次Gemma发布引发了超过1000万次下载和众多令人惊叹的项目。例如,Navarasa使用Gemma开发了一个庆祝印度语言多样性的模型。
有了Gemma 2,开发者可以着手进行更具雄心的项目,推动AI可能性的边界。我们将继续探索新的架构,开发专用的Gemma变体,以应对更广泛的AI任务和挑战。我们还计划发布一个2600万参数的Gemma 2模型,旨在平衡轻量级可访问性与强大性能。有关更多信息,请查看技术报告。
开始使用
Gemma 2现已在Google AI Studio中可用,您无需任何硬件即可测试其27B的完整功能。您还可以从Kaggle和Hugging Face Models下载Gemma 2的模型权重,Vertex AI Model Garden即将推出。
为了支持研究和开发,Gemma 2通过Kaggle或Colab笔记本的免费层免费提供。首次使用Google Cloud的客户可能有资格获得300美元的信用。学术研究人员可以申请Gemma 2学术研究计划,获得Google Cloud信用以加速使用Gemma 2的研究。申请现已开放,至8月9日截止。
相关文章
Kakao Mobility 概述了面向物理人工智能的 L4 级自动驾驶路线图
Kakao Mobility 计划内部自主研发 L4 级自动驾驶技术,作为其物理人工智能战略的一部分。在首尔COEX举行的2026世界IT展上,Kakao Mobility副总裁兼物理AI部门负责人金镇奎(Kim Jin-kyu)介绍了该路线图。他的演讲聚焦于物理AI时代基于出行平台构建的自动驾驶服务。据韩联社报道,这场题为“超越构想,付诸行动:AI驱动现实”的活动汇聚了来自17个国家的460
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
相关专题推荐
评论 (64)
0/500
As a student working on my first NLP project, having access to lightweight open models like Gemma 2 feels like a game-changer! 🙌 Finally something that won't require supercomputing resources. Curious if the training datasets will be equally accessible though? Still, excited to experiment with this! 🤖
Gemma 2가 개발자들에게 공개되었다니 기대되네요! 경량 모델이라서 스타트업이나 개인 개발자도 활용하기 좋을 것 같아요. 근데 진짜 빨리 써보고 싶은데 한국어 지원은 언제될까요? ㄷㄷ
Wow, Gemma 2 sounds like a game-changer for researchers! Open models like this could spark some wild innovations. Anyone else excited to see what devs cook up with this? 🚀
Gemma 2 é uma revolução para pesquisadores! É tão acessível e fácil de usar. O único ponto negativo é a curva de aprendizado para iniciantes. Mas, uma vez que você pega o jeito, é incrível! 🚀

人工智能有能力应对我们今天面临的一些最艰巨的挑战——但前提是每个人都能获得使用它的工具。这就是为什么我们在年初推出了Gemma,一套轻量级、尖端的开放模型,采用了与我们的Gemini模型相同的技术。从那时起,我们通过与Hugging Face、NVIDIA和Ollama等公司的合作,扩展了Gemma家族,新增了CodeGemma、RecurrentGemma和PaliGemma,每种模型都针对不同的AI任务进行了优化,并且易于访问。
现在,我们激动地宣布Gemma 2面向全球研究人员和开发者发布。Gemma 2提供9亿(9B)和27亿(27B)参数规模,与前代相比,性能和效率显著提升,安全性也有了重大改进。27B版本是同类中的佼佼者,甚至能与参数规模超过其两倍的模型竞争,并且它可以在单个NVIDIA H100 Tensor Core GPU或TPU主机上运行,大幅降低了部署成本。我们实现了高性能且无需花费巨资,这不是很酷吗?
开放模型效率与性能的新标准
我们为Gemma 2重新设计了架构,力求实现顶尖的性能和效率。以下是它的独特之处:
- 超强性能:27B的Gemma 2在其类别中名列前茅,甚至能与参数规模超过其两倍的模型竞争。9B版本同样表现出色,超越了Llama 3 8B及其他同类别开放模型。想了解更多细节,请查看技术报告。
- 无与伦比的效率与成本节约:27B的Gemma 2可以在单个Google Cloud TPU主机、NVIDIA A100 80GB Tensor Core GPU或NVIDIA H100 Tensor Core GPU上以全精度流畅运行,这意味着您可以在不牺牲性能的情况下降低成本。这使得AI部署更加易于获取且预算友好。
- 跨硬件的超快推理:Gemma 2设计为在从游戏笔记本电脑、高端台式机到云端设置的各种硬件上快速运行。您可以在Google AI Studio中以全精度测试它,在您的CPU上使用Gemma.cpp的量化版本本地运行,或通过Hugging Face Transformers在您的家用电脑上使用NVIDIA RTX或GeForce RTX进行尝试。
为开发者与研究人员打造
Gemma 2不仅更强大,还设计为无缝融入您的工作流程:
- 开放且易于获取:与原始Gemma模型一样,Gemma 2采用对商业友好的许可证,允许开发者与研究人员分享和商业化他们的创作。
- 广泛的框架兼容性:通过与主要AI框架的兼容性,如Hugging Face Transformers、JAX、PyTorch、TensorFlow(通过原生Keras 3.0)、vLLM、Gemma.cpp、Llama.cpp和Ollama,您可以轻松将Gemma 2集成到您喜欢的工具和工作流程中。它还通过NVIDIA TensorRT-LLM为NVIDIA加速基础设施进行了优化,或作为NVIDIA NIM推理微服务,未来还将优化NVIDIA的NeMo。您可以立即通过Keras和Hugging Face开始微调,我们还在开发更多参数高效的微调选项。
- 轻松部署:从下个月起,Google Cloud客户可以通过Vertex AI轻松部署和管理Gemma 2。
深入体验新的Gemma Cookbook,里面包含实用示例和指南,帮助您构建自己的应用程序并为特定任务微调Gemma 2。学习如何使用您喜欢的工具与Gemma一起完成任务,例如检索增强生成。
负责任的AI开发
我们致力于帮助开发者与研究人员负责任地构建和部署AI。我们的负责任生成AI工具包是这一努力的一部分。最近开源的LLM Comparator可帮助对语言模型进行详细评估。从今天起,您可以使用配套的Python库运行模型和数据的对比评估,并在应用程序中可视化结果。我们还在努力开源我们的文本水印技术SynthID,适用于Gemma模型。
在训练Gemma 2时,我们遵循了严格的内部安全流程,过滤预训练数据,并针对广泛的指标进行彻底测试和评估,以识别和减轻潜在的偏见和风险。我们在与安全性和代表性危害相关的公共基准上分享了我们的结果。
基于Gemma的项目
我们的首次Gemma发布引发了超过1000万次下载和众多令人惊叹的项目。例如,Navarasa使用Gemma开发了一个庆祝印度语言多样性的模型。
有了Gemma 2,开发者可以着手进行更具雄心的项目,推动AI可能性的边界。我们将继续探索新的架构,开发专用的Gemma变体,以应对更广泛的AI任务和挑战。我们还计划发布一个2600万参数的Gemma 2模型,旨在平衡轻量级可访问性与强大性能。有关更多信息,请查看技术报告。
开始使用
Gemma 2现已在Google AI Studio中可用,您无需任何硬件即可测试其27B的完整功能。您还可以从Kaggle和Hugging Face Models下载Gemma 2的模型权重,Vertex AI Model Garden即将推出。
为了支持研究和开发,Gemma 2通过Kaggle或Colab笔记本的免费层免费提供。首次使用Google Cloud的客户可能有资格获得300美元的信用。学术研究人员可以申请Gemma 2学术研究计划,获得Google Cloud信用以加速使用Gemma 2的研究。申请现已开放,至8月9日截止。
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
As a student working on my first NLP project, having access to lightweight open models like Gemma 2 feels like a game-changer! 🙌 Finally something that won't require supercomputing resources. Curious if the training datasets will be equally accessible though? Still, excited to experiment with this! 🤖
Gemma 2가 개발자들에게 공개되었다니 기대되네요! 경량 모델이라서 스타트업이나 개인 개발자도 활용하기 좋을 것 같아요. 근데 진짜 빨리 써보고 싶은데 한국어 지원은 언제될까요? ㄷㄷ
Wow, Gemma 2 sounds like a game-changer for researchers! Open models like this could spark some wild innovations. Anyone else excited to see what devs cook up with this? 🚀
Gemma 2 é uma revolução para pesquisadores! É tão acessível e fácil de usar. O único ponto negativo é a curva de aprendizado para iniciantes. Mas, uma vez que você pega o jeito, é incrível! 🚀





首页






