选项
首页
新闻
Google的Gemma 3仅使用一个GPU实现了DeepSeek准确性的98%

Google的Gemma 3仅使用一个GPU实现了DeepSeek准确性的98%

2025-05-01
217

人工智能经济学近期备受关注,尤其是初创公司DeepSeek AI展示的GPU芯片规模经济令人印象深刻。但Google不甘示弱。周三,这家科技巨头发布了最新的开源大型语言模型Gemma 3,其准确性几乎与DeepSeek的R1模型相当,但计算资源消耗显著减少。

Google使用“Elo”评分衡量性能,这是一种常用于国际象棋和体育的排名系统。Gemma 3得分1338,略低于R1的1363,意味着R1技术上优于Gemma 3。然而,Google估计达到R1的得分需要32个Nvidia H100 GPU芯片,而Gemma 3仅用一个H100 GPU即可实现。Google称这种计算与Elo评分的平衡为“最佳点”。

在博客文章中,Google描述Gemma 3为“可在单一GPU或TPU上运行的最强大模型”,指的是其定制AI芯片“张量处理单元”。公司宣称Gemma 3“在其规模下提供顶尖性能”,在LMArena排行榜的人类偏好评估中超越Llama-405B、DeepSeek-V3和o3-mini等模型。这种性能使其更容易在单一GPU或TPU主机上创建引人入胜的用户体验。

Google 2025 Gemma 3 Elo比较 Google

Google的模型在Elo评分上也超越了Meta的Llama 3,Google估计后者需16个GPU。值得注意的是,这些竞争模型的数据是Google的估计;DeepSeek AI仅透露R1使用了1814个性能较低的Nvidia H800 GPU。

更多详细信息可在HuggingFace的开发者博客文章中找到,Gemma 3仓库也已开放。Gemma 3专为设备端使用而非数据中心设计,参数数量远少于R1和其他开源模型。Gemma 3的参数从10亿到270亿不等,相比当前标准较为适中,而R1拥有高达6710亿参数,尽管可选择性使用370亿参数。

Gemma 3效率的关键在于广泛使用的AI技术——蒸馏,即将大模型的训练权重转移到较小的模型以提升其能力。此外,蒸馏模型经过三项质量控制措施:基于人类反馈的强化学习(RLHF)、基于机器反馈的强化学习(RLMF)和基于执行反馈的强化学习(RLEF)。这些措施优化模型输出,使其更实用,并提升数学和编码能力。

Google的开发者博客详细介绍了这些方法,另一篇文章讨论了针对最小10亿参数模型的优化技术,面向移动设备,包括量化、更新键值缓存布局、改进变量加载时间和GPU权重共享。

Google不仅基于Elo评分比较Gemma 3,还与前代Gemma 2及其闭源Gemini模型在LiveCodeBench等基准测试中进行对比。虽然Gemma 3在准确性上通常不及Gemini 1.5和Gemini 2.0,但Google指出,尽管参数较少,其“与闭源Gemini模型相比表现出色”。

Google 2025 Gemma 3与Gemma 2比较 Google

Gemma 3相较Gemma 2的重大升级是其“上下文窗口”从8000个令牌扩展到128000个令牌,可处理整篇论文或书籍等大型文本。Gemma 3还支持多模态,可处理文本和图像输入,不同于前代。此外,它支持超过140种语言,远超Gemma 2的仅英语能力。

除主要功能外,Gemma 3还有其他有趣特点。大型语言模型可能记住训练数据部分内容,导致隐私泄露风险。Google的研究人员测试发现,Gemma 3对长文本的记忆率低于前代,表明隐私保护有所改进。

对细节感兴趣的用户可参阅Gemma 3技术论文,全面了解模型能力和开发过程。

相关文章
Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易 Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易 随着人工智能的飞速发展,Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验,展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判,并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场,Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈,收集了他们的买卖意向及个性化指示,随后
DeepSeek Code 即将发布 DeepSeek Code 即将发布 随着人工智能技术的加速发展,DeepSeek正处于一个激动人心的关键时刻。这家人工智能公司近日透露,已获得超过700亿元的融资。公司管理层强调,将致力于开创性的人工智能研究,而非追求眼前的商业利益。这一战略转型表明,DeepSeek将全力投入新产品的开发,尤其是备受期待的DeepSeek Code。DeepSeek Code的规划已初具雏形,公司招聘页面上已发布多个相关职位,例如“Agent Ha
马斯克的Grok:1.5万亿参数与光标代码吸收——颠覆性突破还是虚张声势? 马斯克的Grok:1.5万亿参数与光标代码吸收——颠覆性突破还是虚张声势? 埃隆·马斯克终于开始行动了。在人工智能编程竞赛中,OpenAI和Anthropic正加速前进,而xAI似乎有些落后。马斯克曾多次表示要与Claude一较高下,尽管Grok4.X系列已多次更新,但其成果在理论上看似不错,实际应用中却未能达到预期,双方的差距几乎未见缩小。不过,这次他手中握有一张新牌。马斯克在X平台确认,Grok的新版本即将问世。 这款基础模型第九版的内部代号已确定,参数规模高达1.5
相关专题推荐
商业 最佳人工智能招聘工具:筛选简历并自动安排候选人面试
最佳人工智能招聘工具:筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案,可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名,对比免费与付费选项。立即找到最适合您的招聘助手,优化您的招聘流程!

10 个工具
xix.ai
生产率 AI个人健康与专注力教练:缓解倦怠,提升精神能量
AI个人健康与专注力教练:缓解倦怠,提升精神能量

立即访问 XIX.AI,探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具,助您缓解倦怠、提升精神能量。通过真实案例分析,对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具
xix.ai
聊天机器人 备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系
备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人,助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人,并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣,立即开始建立联系吧。

10 个工具
xix.ai
教育与学习 最佳AI数据科学导师:精通SQL、Pandas及机器学习工作流程
最佳AI数据科学导师:精通SQL、Pandas及机器学习工作流程

探索2026年最优秀的人工智能数据科学导师,帮助他们掌握SQL、Pandas以及机器学习工作流程。在XIX.AI上查看我们精心挑选的顶级导师名单,获得强大而具有变革性的指导。通过对比免费和付费选项,并结合实际应用案例进行了解,今天就开启你的数据科学精通之路吧。

10 个工具
xix.ai
聊天机器人 最佳AI调情与对话训练工具:实时提升社交魅力与自信
最佳AI调情与对话训练工具:实时提升社交魅力与自信

在 XIX.AI 上探索 2026 年最优秀的 AI 调情与对话训练工具。我们精心挑选的高评分工具助您实时提升社交魅力与自信。探索这些必试的、颠覆性的工具,查看免费版与付费版的对比,并了解每周更新的排行榜。立即开启您的社交优势。

10 个工具
xix.ai
代码 最适合自动化单元测试的最佳AI工具:一键生成Jest、PyTest和JUnit测试用例
最适合自动化单元测试的最佳AI工具:一键生成Jest、PyTest和JUnit测试用例

探索2026年最新评选出的顶级AI工具,这些工具专为自动化单元测试而设计。我们精心挑选了那些功能强大、能够改变开发流程的工具,它们能够帮助您快速生成Jest、PyTest和JUnit测试用例。在XIX.AI平台上,您可以免费查看各种选项,并通过实际测试结果以及每周更新的排名来了解它们的优劣。立即利用这些AI工具,提升您的开发效率吧!

10 个工具
xix.ai
评论 (12)
0/500
StephenGreen
StephenGreen 2026-03-13 14:00:30

Googleも結構追いついてきたんだね…ただ、オープンソースなのは良いけど、本当に個人開発者が活用できる環境整ってるのかな?🤔 最近は色んなモデルが出てきて混乱しそうだわ。

JonathanKing
JonathanKing 2025-11-18 18:30:44

¡Estas mejoras en eficiencia son una locura! 🔥 Si Google logra casi el mismo rendimiento con solo una GPU, ¿esto cambiará por completo el acceso a la IA para pequeños desarrolladores? Aun así, me pregunto cómo manejarán temas como el consumo energético real en uso masivo... 😅

RonaldMartinez
RonaldMartinez 2025-08-17 17:00:59

Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Curious how this'll shake up the AI startup scene. 🚀

GaryJones
GaryJones 2025-08-16 01:00:59

Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Curious how this stacks up in real-world apps! 😎

JonathanDavis
JonathanDavis 2025-08-13 21:00:59

Google's Gemma 3 sounds like a game-changer! Achieving 98% of DeepSeek's accuracy with just one GPU is wild. Makes me wonder how this’ll shake up the AI race—more power to the little guys? 🤔

ArthurSanchez
ArthurSanchez 2025-08-05 09:00:59

Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's like getting a sports car for the price of a bike! 😎 Can't wait to see how this shakes up the AI race.

OR