NVIDIA主导AI基准测试,表现优于两个竞争对手AI芯片
英伟达的通用GPU芯片再次在人工智能芯片性能评估的广泛认可基准测试中占据主导地位,这次聚焦于生成式人工智能应用,如大型语言模型(LLM)。竞争呈现出一边倒的态势。
来自SuperMicro、惠普企业、联想等公司的系统,每台配备多达八块英伟达芯片,在由行业联盟MLCommons组织的MLPerf基准测试中占据了大部分顶级位置。该测试衡量机器生成令牌、处理查询或输出数据样本的速度——即人工智能推理——是多年来进行的预测基准测试系列中的第五次。
此次MLPerf基准测试的最新版本包括针对常见生成式人工智能任务量身定制的新测试。其中一项测试评估了芯片在Meta的开源大型语言模型Llama 3.1 405b上的性能,这是一个在该领域广泛使用的庞大模型。另一项测试引入了Meta较小型号Llama 2 70b的交互版本,旨在模拟聊天机器人交互,其中响应时间至关重要。该测试专门衡量系统生成首个输出令牌的速度,反映了对用户提示的快速响应需求。
第三个新测试评估了处理图神经网络的速度,这些网络处理实体之间的复杂关系,如社交网络中的关系。这些网络在生成式人工智能中变得越来越重要,例如谷歌DeepMind部门在2021年取得蛋白质折叠预测重大进展的AlphaFold 2模型中使用了图网络。此外,第四项测试评估了使用MLCommons从现有开源技术开发的定制神经网络,将LiDAR感知数据编译为汽车道路地图的速度。

MLCommons MLPerf竞赛涉及由联想、惠普企业等公司构建的计算机,需遵守神经网络输出精度的严格要求。每台系统报告其每秒生成输出的最高速度,部分基准测试还测量平均延迟,即从服务器返回响应的时间。
英伟达的GPU在封闭组别中几乎所有测试中表现出色,该组别的软件设置规则最为严格。

MLCommons 然而,AMD凭借其MI300X GPU在两项Llama 2 70b测试中获得最高分,每秒生成103,182个令牌,显著优于英伟达的较新型Blackwell GPU。这套获胜的AMD系统由MangoBoost组装,这是一家专注于增强GPU机架间数据传输的插件卡初创公司,并使用了其专为提升生成式人工智能性能设计的LLMboost软件。
英伟达对AMD结果与Blackwell得分的比较提出异议,指出需根据每套系统使用的芯片数量和计算机“节点”进行调整。英伟达加速计算产品总监戴夫·萨尔瓦托在给ZDNET的电子邮件中强调:
“MangoBoost的结果并未反映与英伟达结果的准确性能比较。AMD的测试使用了4倍数量的GPU——32块MI300X GPU——对阵8块英伟达B200,但仅比英伟达的提交结果高出3.83%。英伟达的8x B200提交实际上在Llama 2 70B服务器提交中超过了MangoBoost的32块AMD MI300X GPU。”
谷歌也参与了竞争,展示了其第六代自研张量处理单元(TPU)Trillium芯片。然而,在测量Stable Diffusion图像生成测试查询响应速度的测试中,该芯片显著落后于英伟达的Blackwell。
最新一轮MLPerf基准测试的竞争对手数量少于往年。值得注意的是,英特尔的Habana部门和Qualcomm均未提交测试结果,而这两家公司在过去几年均有参与。
尽管如此,英特尔仍有理由庆祝。在数据中心封闭组别中,英特尔的Xeon微处理器为前11名系统中的7个提供动力,超越了AMD的EPYC服务器微处理器,后者仅取得3次胜利。这标志着英特尔相较于往年的进步。
第11名高性能系统,负责处理Meta的大型Llama 3.1 405b,由英伟达构建,未使用英特尔或AMD微处理器,而是采用了集成的Grace-Blackwell 200芯片,将英伟达的Blackwell GPU与其自有的Grace微处理器封装在单一芯片中。
相关文章
Z世代的真实考验:AI伪造与批判性思维
在当今快节奏的数字世界中,成长过程中始终拥有互联网的Z世代面临着独特的挑战。随着人工智能生成内容的兴起,这种内容难以与现实区分开来,导致错误信息的增加和批判性思维能力的下降。本文探讨了Z世代的现状、由人工智能生成虚假内容带来的风险以及提高媒体素养和事实核查的迫切需求。它挑战了这一数字化土著世代天生精通技术的观点,并分析了更广泛的社会影响。关键点由于人工智能内
亚历克斯·霍尔莫齐揭示冷邮件成功的秘密用于潜在客户生成
如果你渴望提升你的客户获取策略,掌握冷邮件营销可能是你的转折点。然而,许多企业发现从冷邮件活动中获得显著收益具有挑战性。在本指南中,我们将深入探讨受亚历克斯·霍尔莫齐(Alex Hormozi)等专家启发的实用建议,帮助你提升冷邮件游戏,确保稳定的新客户流。发现制作引人入胜的邮件、个性化你的外联以及将潜在客户转化为忠实客户的艺术。这里是你在2025年实现冷邮
使用Gen AI工具解锁讲故事魔术的指南
在当今快节奏的数字世界中,讲故事的艺术从未如此重要。无论您是管理项目,营销产品还是简单地表达自己的创造力,讲故事都可以真正吸引您的受众并促进有意义的互动。生成AI的出现是转换
相关专题推荐
评论 (44)
0/500
Nvidia bleibt einfach unschlagbar in diesem Bereich. Klar, die Konkurrenz versucht aufzuholen, aber wenn es um LLMs und generative KI geht, scheint der Vorsprung riesig. Interessant wäre, ob sich das in ein paar Jahren ändert, wenn spezialisierte Chips vielleicht effizienter werden. Aber momentan... Respekt! 🚀
Nvidia's killing it again with their GPUs! 😎 Those benchmarks for generative AI are insane—makes me wonder if anyone can catch up in the LLM race.
Os chips da Nvidia estão dominando o mundo da IA! Quer dizer, quem mais pode dizer que está dominando os benchmarks assim? É como assistir um gamer profissional totalmente dominar o leaderboard. Mas, um pouco de competição seria bom, né? Continue empurrando os limites, Nvidia! 🚀
英伟达的通用GPU芯片再次在人工智能芯片性能评估的广泛认可基准测试中占据主导地位,这次聚焦于生成式人工智能应用,如大型语言模型(LLM)。竞争呈现出一边倒的态势。
来自SuperMicro、惠普企业、联想等公司的系统,每台配备多达八块英伟达芯片,在由行业联盟MLCommons组织的MLPerf基准测试中占据了大部分顶级位置。该测试衡量机器生成令牌、处理查询或输出数据样本的速度——即人工智能推理——是多年来进行的预测基准测试系列中的第五次。
此次MLPerf基准测试的最新版本包括针对常见生成式人工智能任务量身定制的新测试。其中一项测试评估了芯片在Meta的开源大型语言模型Llama 3.1 405b上的性能,这是一个在该领域广泛使用的庞大模型。另一项测试引入了Meta较小型号Llama 2 70b的交互版本,旨在模拟聊天机器人交互,其中响应时间至关重要。该测试专门衡量系统生成首个输出令牌的速度,反映了对用户提示的快速响应需求。
第三个新测试评估了处理图神经网络的速度,这些网络处理实体之间的复杂关系,如社交网络中的关系。这些网络在生成式人工智能中变得越来越重要,例如谷歌DeepMind部门在2021年取得蛋白质折叠预测重大进展的AlphaFold 2模型中使用了图网络。此外,第四项测试评估了使用MLCommons从现有开源技术开发的定制神经网络,将LiDAR感知数据编译为汽车道路地图的速度。
MLPerf竞赛涉及由联想、惠普企业等公司构建的计算机,需遵守神经网络输出精度的严格要求。每台系统报告其每秒生成输出的最高速度,部分基准测试还测量平均延迟,即从服务器返回响应的时间。
英伟达的GPU在封闭组别中几乎所有测试中表现出色,该组别的软件设置规则最为严格。
然而,AMD凭借其MI300X GPU在两项Llama 2 70b测试中获得最高分,每秒生成103,182个令牌,显著优于英伟达的较新型Blackwell GPU。这套获胜的AMD系统由MangoBoost组装,这是一家专注于增强GPU机架间数据传输的插件卡初创公司,并使用了其专为提升生成式人工智能性能设计的LLMboost软件。
英伟达对AMD结果与Blackwell得分的比较提出异议,指出需根据每套系统使用的芯片数量和计算机“节点”进行调整。英伟达加速计算产品总监戴夫·萨尔瓦托在给ZDNET的电子邮件中强调:
“MangoBoost的结果并未反映与英伟达结果的准确性能比较。AMD的测试使用了4倍数量的GPU——32块MI300X GPU——对阵8块英伟达B200,但仅比英伟达的提交结果高出3.83%。英伟达的8x B200提交实际上在Llama 2 70B服务器提交中超过了MangoBoost的32块AMD MI300X GPU。”
谷歌也参与了竞争,展示了其第六代自研张量处理单元(TPU)Trillium芯片。然而,在测量Stable Diffusion图像生成测试查询响应速度的测试中,该芯片显著落后于英伟达的Blackwell。
最新一轮MLPerf基准测试的竞争对手数量少于往年。值得注意的是,英特尔的Habana部门和Qualcomm均未提交测试结果,而这两家公司在过去几年均有参与。
尽管如此,英特尔仍有理由庆祝。在数据中心封闭组别中,英特尔的Xeon微处理器为前11名系统中的7个提供动力,超越了AMD的EPYC服务器微处理器,后者仅取得3次胜利。这标志着英特尔相较于往年的进步。
第11名高性能系统,负责处理Meta的大型Llama 3.1 405b,由英伟达构建,未使用英特尔或AMD微处理器,而是采用了集成的Grace-Blackwell 200芯片,将英伟达的Blackwell GPU与其自有的Grace微处理器封装在单一芯片中。
Z世代的真实考验:AI伪造与批判性思维
在当今快节奏的数字世界中,成长过程中始终拥有互联网的Z世代面临着独特的挑战。随着人工智能生成内容的兴起,这种内容难以与现实区分开来,导致错误信息的增加和批判性思维能力的下降。本文探讨了Z世代的现状、由人工智能生成虚假内容带来的风险以及提高媒体素养和事实核查的迫切需求。它挑战了这一数字化土著世代天生精通技术的观点,并分析了更广泛的社会影响。关键点由于人工智能内
亚历克斯·霍尔莫齐揭示冷邮件成功的秘密用于潜在客户生成
如果你渴望提升你的客户获取策略,掌握冷邮件营销可能是你的转折点。然而,许多企业发现从冷邮件活动中获得显著收益具有挑战性。在本指南中,我们将深入探讨受亚历克斯·霍尔莫齐(Alex Hormozi)等专家启发的实用建议,帮助你提升冷邮件游戏,确保稳定的新客户流。发现制作引人入胜的邮件、个性化你的外联以及将潜在客户转化为忠实客户的艺术。这里是你在2025年实现冷邮
Nvidia bleibt einfach unschlagbar in diesem Bereich. Klar, die Konkurrenz versucht aufzuholen, aber wenn es um LLMs und generative KI geht, scheint der Vorsprung riesig. Interessant wäre, ob sich das in ein paar Jahren ändert, wenn spezialisierte Chips vielleicht effizienter werden. Aber momentan... Respekt! 🚀
Nvidia's killing it again with their GPUs! 😎 Those benchmarks for generative AI are insane—makes me wonder if anyone can catch up in the LLM race.
Os chips da Nvidia estão dominando o mundo da IA! Quer dizer, quem mais pode dizer que está dominando os benchmarks assim? É como assistir um gamer profissional totalmente dominar o leaderboard. Mas, um pouco de competição seria bom, né? Continue empurrando os limites, Nvidia! 🚀





首页






