Google的Gemma 3仅使用一个GPU实现了DeepSeek准确性的98%
人工智能经济学近期备受关注,尤其是初创公司DeepSeek AI展示的GPU芯片规模经济令人印象深刻。但Google不甘示弱。周三,这家科技巨头发布了最新的开源大型语言模型Gemma 3,其准确性几乎与DeepSeek的R1模型相当,但计算资源消耗显著减少。
Google使用“Elo”评分衡量性能,这是一种常用于国际象棋和体育的排名系统。Gemma 3得分1338,略低于R1的1363,意味着R1技术上优于Gemma 3。然而,Google估计达到R1的得分需要32个Nvidia H100 GPU芯片,而Gemma 3仅用一个H100 GPU即可实现。Google称这种计算与Elo评分的平衡为“最佳点”。
在博客文章中,Google描述Gemma 3为“可在单一GPU或TPU上运行的最强大模型”,指的是其定制AI芯片“张量处理单元”。公司宣称Gemma 3“在其规模下提供顶尖性能”,在LMArena排行榜的人类偏好评估中超越Llama-405B、DeepSeek-V3和o3-mini等模型。这种性能使其更容易在单一GPU或TPU主机上创建引人入胜的用户体验。
Google
Google的模型在Elo评分上也超越了Meta的Llama 3,Google估计后者需16个GPU。值得注意的是,这些竞争模型的数据是Google的估计;DeepSeek AI仅透露R1使用了1814个性能较低的Nvidia H800 GPU。
更多详细信息可在HuggingFace的开发者博客文章中找到,Gemma 3仓库也已开放。Gemma 3专为设备端使用而非数据中心设计,参数数量远少于R1和其他开源模型。Gemma 3的参数从10亿到270亿不等,相比当前标准较为适中,而R1拥有高达6710亿参数,尽管可选择性使用370亿参数。
Gemma 3效率的关键在于广泛使用的AI技术——蒸馏,即将大模型的训练权重转移到较小的模型以提升其能力。此外,蒸馏模型经过三项质量控制措施:基于人类反馈的强化学习(RLHF)、基于机器反馈的强化学习(RLMF)和基于执行反馈的强化学习(RLEF)。这些措施优化模型输出,使其更实用,并提升数学和编码能力。
Google的开发者博客详细介绍了这些方法,另一篇文章讨论了针对最小10亿参数模型的优化技术,面向移动设备,包括量化、更新键值缓存布局、改进变量加载时间和GPU权重共享。
Google不仅基于Elo评分比较Gemma 3,还与前代Gemma 2及其闭源Gemini模型在LiveCodeBench等基准测试中进行对比。虽然Gemma 3在准确性上通常不及Gemini 1.5和Gemini 2.0,但Google指出,尽管参数较少,其“与闭源Gemini模型相比表现出色”。
Google
Gemma 3相较Gemma 2的重大升级是其“上下文窗口”从8000个令牌扩展到128000个令牌,可处理整篇论文或书籍等大型文本。Gemma 3还支持多模态,可处理文本和图像输入,不同于前代。此外,它支持超过140种语言,远超Gemma 2的仅英语能力。
除主要功能外,Gemma 3还有其他有趣特点。大型语言模型可能记住训练数据部分内容,导致隐私泄露风险。Google的研究人员测试发现,Gemma 3对长文本的记忆率低于前代,表明隐私保护有所改进。
对细节感兴趣的用户可参阅Gemma 3技术论文,全面了解模型能力和开发过程。
相关文章
Snowflake 斥资逾 6 亿美元开发 AWS 定制芯片,以推动企业人工智能发展
云数据巨头Snowflake宣布,计划在未来六年内投资超过6亿美元,用于采购由亚马逊网络服务(AWS)开发的Graviton系列CPU和AI加速器。 这项重大基础设施投资是首席执行官斯里达尔·拉马斯瓦米(Sridhar Ramaswamy)领导下的核心举措,标志着公司全面转向“AI优先”战略,旨在大幅提升其数据云平台上处理大规模AI工作负载的成本效率。拉马斯瓦米强调,构建企业级AI平台需要将高质量
中国电信投资面壁智能,为大型语言模型及数据基础设施筹集71.3万元资金
在大模型领域,这支“国家队”与来自清华大学的领军人物正在深化战略合作。据企查查最新企业注册数据显示,2026年3月1日,北京面壁智能科技有限公司进行了重大股权重组,正式引入了电信巨头和行业基金的投资。这一转变不仅关乎资金注入——更预示着国内大模型在公共数据平台及智能硬件领域的商业化进程将大幅提速。核心亮点:电信巨头与本土基金的双重背书此次股权变更后,面壁智能的股东结构迎来了数家重要新成员:中国电信
陶天集团加速推进AI原生转型,向实习生发放免费代币配额
陶天集团近期推出了“AI生产力计划”,旨在通过资源配置和工具补贴,加速将AI技术融入电商运营及研发工作流程。该计划现已向所有实习生开放,使其在实习期间享有与正式员工同等的AI权限、计算配额及审批流程。自3月17日起,淘天集团员工已获授权免费使用多款付费AI工具,包括悟空和Qoder系列。这些工具支持从基础技术研发到日常办公效率提升等广泛应用场景。 通过直接提供Token配额,公司降低了使用大型语言
相关专题推荐
评论 (12)
0/500
¡Estas mejoras en eficiencia son una locura! 🔥 Si Google logra casi el mismo rendimiento con solo una GPU, ¿esto cambiará por completo el acceso a la IA para pequeños desarrolladores? Aun así, me pregunto cómo manejarán temas como el consumo energético real en uso masivo... 😅
Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Curious how this'll shake up the AI startup scene. 🚀
Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Curious how this stacks up in real-world apps! 😎
Google's Gemma 3 sounds like a game-changer! Achieving 98% of DeepSeek's accuracy with just one GPU is wild. Makes me wonder how this’ll shake up the AI race—more power to the little guys? 🤔
人工智能经济学近期备受关注,尤其是初创公司DeepSeek AI展示的GPU芯片规模经济令人印象深刻。但Google不甘示弱。周三,这家科技巨头发布了最新的开源大型语言模型Gemma 3,其准确性几乎与DeepSeek的R1模型相当,但计算资源消耗显著减少。
Google使用“Elo”评分衡量性能,这是一种常用于国际象棋和体育的排名系统。Gemma 3得分1338,略低于R1的1363,意味着R1技术上优于Gemma 3。然而,Google估计达到R1的得分需要32个Nvidia H100 GPU芯片,而Gemma 3仅用一个H100 GPU即可实现。Google称这种计算与Elo评分的平衡为“最佳点”。
在博客文章中,Google描述Gemma 3为“可在单一GPU或TPU上运行的最强大模型”,指的是其定制AI芯片“张量处理单元”。公司宣称Gemma 3“在其规模下提供顶尖性能”,在LMArena排行榜的人类偏好评估中超越Llama-405B、DeepSeek-V3和o3-mini等模型。这种性能使其更容易在单一GPU或TPU主机上创建引人入胜的用户体验。
Google
Google的模型在Elo评分上也超越了Meta的Llama 3,Google估计后者需16个GPU。值得注意的是,这些竞争模型的数据是Google的估计;DeepSeek AI仅透露R1使用了1814个性能较低的Nvidia H800 GPU。
更多详细信息可在HuggingFace的开发者博客文章中找到,Gemma 3仓库也已开放。Gemma 3专为设备端使用而非数据中心设计,参数数量远少于R1和其他开源模型。Gemma 3的参数从10亿到270亿不等,相比当前标准较为适中,而R1拥有高达6710亿参数,尽管可选择性使用370亿参数。
Gemma 3效率的关键在于广泛使用的AI技术——蒸馏,即将大模型的训练权重转移到较小的模型以提升其能力。此外,蒸馏模型经过三项质量控制措施:基于人类反馈的强化学习(RLHF)、基于机器反馈的强化学习(RLMF)和基于执行反馈的强化学习(RLEF)。这些措施优化模型输出,使其更实用,并提升数学和编码能力。
Google的开发者博客详细介绍了这些方法,另一篇文章讨论了针对最小10亿参数模型的优化技术,面向移动设备,包括量化、更新键值缓存布局、改进变量加载时间和GPU权重共享。
Google不仅基于Elo评分比较Gemma 3,还与前代Gemma 2及其闭源Gemini模型在LiveCodeBench等基准测试中进行对比。虽然Gemma 3在准确性上通常不及Gemini 1.5和Gemini 2.0,但Google指出,尽管参数较少,其“与闭源Gemini模型相比表现出色”。
Google
Gemma 3相较Gemma 2的重大升级是其“上下文窗口”从8000个令牌扩展到128000个令牌,可处理整篇论文或书籍等大型文本。Gemma 3还支持多模态,可处理文本和图像输入,不同于前代。此外,它支持超过140种语言,远超Gemma 2的仅英语能力。
除主要功能外,Gemma 3还有其他有趣特点。大型语言模型可能记住训练数据部分内容,导致隐私泄露风险。Google的研究人员测试发现,Gemma 3对长文本的记忆率低于前代,表明隐私保护有所改进。
对细节感兴趣的用户可参阅Gemma 3技术论文,全面了解模型能力和开发过程。
Snowflake 斥资逾 6 亿美元开发 AWS 定制芯片,以推动企业人工智能发展
云数据巨头Snowflake宣布,计划在未来六年内投资超过6亿美元,用于采购由亚马逊网络服务(AWS)开发的Graviton系列CPU和AI加速器。 这项重大基础设施投资是首席执行官斯里达尔·拉马斯瓦米(Sridhar Ramaswamy)领导下的核心举措,标志着公司全面转向“AI优先”战略,旨在大幅提升其数据云平台上处理大规模AI工作负载的成本效率。拉马斯瓦米强调,构建企业级AI平台需要将高质量
中国电信投资面壁智能,为大型语言模型及数据基础设施筹集71.3万元资金
在大模型领域,这支“国家队”与来自清华大学的领军人物正在深化战略合作。据企查查最新企业注册数据显示,2026年3月1日,北京面壁智能科技有限公司进行了重大股权重组,正式引入了电信巨头和行业基金的投资。这一转变不仅关乎资金注入——更预示着国内大模型在公共数据平台及智能硬件领域的商业化进程将大幅提速。核心亮点:电信巨头与本土基金的双重背书此次股权变更后,面壁智能的股东结构迎来了数家重要新成员:中国电信
陶天集团加速推进AI原生转型,向实习生发放免费代币配额
陶天集团近期推出了“AI生产力计划”,旨在通过资源配置和工具补贴,加速将AI技术融入电商运营及研发工作流程。该计划现已向所有实习生开放,使其在实习期间享有与正式员工同等的AI权限、计算配额及审批流程。自3月17日起,淘天集团员工已获授权免费使用多款付费AI工具,包括悟空和Qoder系列。这些工具支持从基础技术研发到日常办公效率提升等广泛应用场景。 通过直接提供Token配额,公司降低了使用大型语言
¡Estas mejoras en eficiencia son una locura! 🔥 Si Google logra casi el mismo rendimiento con solo una GPU, ¿esto cambiará por completo el acceso a la IA para pequeños desarrolladores? Aun así, me pregunto cómo manejarán temas como el consumo energético real en uso masivo... 😅
Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Curious how this'll shake up the AI startup scene. 🚀
Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Curious how this stacks up in real-world apps! 😎
Google's Gemma 3 sounds like a game-changer! Achieving 98% of DeepSeek's accuracy with just one GPU is wild. Makes me wonder how this’ll shake up the AI race—more power to the little guys? 🤔





首页






