opção
Lar Notícias Nvidia domina os benchmarks da Gen AI, superando dois chips rivais da AI

Nvidia domina os benchmarks da Gen AI, superando dois chips rivais da AI

Data de lançamento Data de lançamento 16 de Abril de 2025
Autor Autor FredLewis
visualizações visualizações 123

Os chips de GPU de uso geral da NVIDIA dominaram mais uma vez um dos benchmarks mais amplamente reconhecidos para avaliar o desempenho dos chips em inteligência artificial, desta vez focando aplicativos generativos de IA, como modelos de linguagem grandes (LLMs). A competição foi relativamente unilateral.

Sistemas da Supermicro, Hewlett Packard Enterprise, Lenovo e outras empresas, cada uma equipada com até oito chips da NVIDIA, garantiram a maioria dos principais pontos no teste de benchmark MLPerf organizado pelo MLCommons, um consórcio da indústria. Este teste, que mede a velocidade na qual as máquinas podem produzir tokens, processar consultas ou amostras de dados de saída-conhecidas como inferência de IA-foi a quinta em uma série de benchmarks de fabricação de previsão que foram realizados ao longo dos anos.

Essa última iteração do benchmark MLPerf incluiu novos testes adaptados a tarefas generativas comuns de IA. Um teste avaliou o desempenho dos chips no LLM de código aberto da Meta, LLAMA 3.1 405B, um modelo substancial amplamente utilizado no campo. Outro teste introduziu uma versão interativa da menor llama 2 70B da Meta, projetada para simular interações com chatbot, onde o tempo de resposta é crucial. Este teste mede especificamente a rapidez com que o sistema pode gerar o primeiro token da saída, refletindo a necessidade de respostas rápidas aos prompts do usuário.

Um terceiro novo teste avaliou a velocidade do processamento de redes neurais gráficas, que lidam com relacionamentos complexos entre entidades, como as de uma rede social. These networks have become increasingly vital in generative AI, exemplified by Google's DeepMind unit's use of graph nets in its AlphaFold 2 model, which made significant strides in protein-folding predictions in 2021. Additionally, a fourth test gauged the speed at which LiDAR sensing data can be compiled into an automobile's road map, using a custom neural net developed by MLCommons from existing open-source technologies.

MLCommons

MLCommons

A competição MLPerf envolve computadores construídos por Lenovo, HPE e outros, aderindo a requisitos rigorosos para a precisão das saídas da rede neural. Cada sistema relata sua velocidade máxima na produção de saída por segundo, com alguns benchmarks medindo a latência média ou o tempo necessário para que uma resposta volte do servidor.

As GPUs da NVIDIA se destacaram em quase todos os testes da divisão fechada, onde as regras de configuração do software são as mais rigorosas.

MLCommons

MLCommons

No entanto, a AMD, com sua GPU MI300X, reivindicou a pontuação máxima em dois testes LLAMA 2 70B, alcançando 103.182 tokens por segundo, o que foi significativamente melhor que o novo Blackwell GPU da Nvidia. Esse sistema AMD vencedor foi montado pelo Mangoboost, uma startup especializada em cartões de plug-in que aprimoram a transferência de dados entre os racks da GPU e o LLMBOOST, seu software projetado para melhorar o desempenho generativo da IA.

A NVIDIA contestou a comparação dos resultados da AMD com suas pontuações em Blackwell, apontando a necessidade de ajustar o número de chips e "nós" do computador usados ​​em cada sistema. Dave Salvator, diretor de produtos de computação acelerado da Nvidia, enfatizada em um email para o ZDNET:

"Os resultados de Mangoboost não refletem uma comparação precisa de desempenho com os resultados da NVIDIA. O teste da AMD aplicou 4x o número de GPUs - 32 mi300x GPUs - contra 8 nVidia B200S, mas ainda conseguiu um submissão de 3,83% mais alto do que o NVIDIMED. GPUs na lhama 2 70B Server Submission. "

O Google também entrou na competição, mostrando seu chip Trillium, a sexta iteração de sua unidade interna de processamento de tensores (TPU). No entanto, ficou significativamente para trás, para trás da Blackwell da Nvidia, em um teste, medindo a velocidade de resposta da consulta para o teste de geração de imagem estável de difusão.

Os últimos benchmarks do MLPERF viram menos concorrentes desafiando a NVIDIA em comparação com as rodadas anteriores. Notavelmente ausentes foram as submissões da Unidade Habana da Intel e da Qualcomm, ambas participaram dos últimos anos.

Apesar disso, a Intel tinha motivos para comemorar. Na divisão fechada do datacenter, o microprocessador Xeon da Intel foi alimentado sete dos 11 principais sistemas, superando o microprocessador do servidor EPYC da AMD, que garantiu apenas três vitórias. Isso marca uma melhoria para a Intel em comparação com os anos anteriores.

O 11º sistema de melhor desempenho, encarregado de processar o META da LLAMA 3.1 405B da Meta, foi construído pela NVIDIA sem usar um microprocessador Intel ou AMD. Em vez disso, utilizou o chip integrado Grace-Blackwell 200, combinando a GPU Blackwell da NVIDIA com seu próprio microprocessador GRACE em um único pacote.

Artigo relacionado
Hướng dẫn mở khóa Ma thuật kể chuyện với các công cụ Gen AI Hướng dẫn mở khóa Ma thuật kể chuyện với các công cụ Gen AI Trong thế giới kỹ thuật số có nhịp độ nhanh ngày nay, nghệ thuật kể chuyện chưa bao giờ quan trọng hơn. Cho dù bạn đang quản lý các dự án, sản phẩm tiếp thị hoặc đơn giản là thể hiện sự sáng tạo của mình, cách kể chuyện có thể thực sự thu hút khán giả của bạn và thúc đẩy các tương tác có ý nghĩa. Sự ra đời của AI thế hệ là transfo
Geração de Consultas SQL Potencializada por IA Melhora Análise de Dados Geração de Consultas SQL Potencializada por IA Melhora Análise de Dados A análise de dados é uma ferramenta vital para empresas e pesquisadores, mas a complexidade das consultas SQL pode ser uma barreira para aqueles sem habilidades técnicas. É aí que
Rizz Arriscado de Goku e Erros de IA no Chat de Voz do Roblox Rizz Arriscado de Goku e Erros de IA no Chat de Voz do Roblox Já se perguntou que caos surge quando uma IA do Goku se descontrola no chat de voz do Roblox? Prepare-se para uma viagem emocionante cheia de risos, momentos constrangedores e até
Comentários (40)
0/200
JustinScott
JustinScott 17 de Abril de 2025 à31 10:43:31 GMT

Nvidia's chips are just crushing it in the AI world! I mean, who else can keep up with their performance in generative AI? It's like watching a one-sided race, but hey, if you're into tech, you gotta appreciate the dominance. Maybe it's time for the others to step up their game! 🚀

WillGarcía
WillGarcía 17 de Abril de 2025 à32 23:12:32 GMT

NvidiaのチップはAI分野で圧倒的ですね!生成AIでのパフォーマンスは他社が追いつけないレベル。まるで一方的なレースを見ているようですが、テクノロジーに興味があるなら、この優位性を評価せざるを得ません。他の会社も頑張ってほしいですね!🚀

DonaldSanchez
DonaldSanchez 17 de Abril de 2025 à31 02:14:31 GMT

Nvidia의 칩은 AI 분야에서 정말 압도적이에요! 생성 AI에서의 성능은 다른 회사들이 따라잡을 수 없는 수준이에요. 마치 일방적인 경주를 보는 것 같지만, 기술에 관심이 있다면 이 우위를 인정하지 않을 수 없어요. 다른 회사들도 힘내야겠죠! 🚀

BrianThomas
BrianThomas 17 de Abril de 2025 à43 12:21:43 GMT

Os chips da Nvidia estão dominando o mundo da IA! Quer dizer, quem mais consegue acompanhar o desempenho deles em IA generativa? É como assistir a uma corrida unilateral, mas, ei, se você gosta de tecnologia, tem que apreciar essa dominância. Talvez seja hora dos outros aumentarem o jogo! 🚀

JustinAnderson
JustinAnderson 16 de Abril de 2025 à14 19:17:14 GMT

¡Los chips de Nvidia están dominando el mundo de la IA! Quiero decir, ¿quién más puede seguir su rendimiento en IA generativa? Es como ver una carrera unilateral, pero, oye, si te gusta la tecnología, tienes que apreciar esta dominancia. ¡Quizás es hora de que los demás suban su juego! 🚀

JuanLopez
JuanLopez 16 de Abril de 2025 à8 18:01:08 GMT

Nvidia's GPU chips are just unreal! They absolutely crushed it in the gen AI benchmarks. I mean, who even comes close? It's like watching a race where one car laps the others twice. Still, I wish they'd focus more on energy efficiency too. 🤓🔥

De volta ao topo
OR