O Centro de Supercomputação de Barcelona e a Universidade Estadual de Nova York publicaram benchmarks mostrando a capacidade do novo Grace Superchip da Nvidia, que não conseguiu igualar duas das CPUs Sapphire Rapids de 48 núcleos da Intel. Apesar de não atingir um desempenho incrível, o Grace promete ser competitivo como um processador HPC em datacenters devido à sua eficiência.
O Grace é a primeira CPU de servidor da Nvidia, construída na arquitetura Arm. Uma única CPU Grace vem com 72 núcleos e 480 GB de memória LPDDR5X. Embora não seja possível comprar uma única CPU Grace isoladamente, ela vem em conjunto com GPUs Hopper em processadores Grace-Hopper, e a Nvidia também oferece o Grace Superchip com duas CPUs Grace combinadas em uma única placa, totalizando 144 núcleos e 960 GB de LPDDR5X.
Os benchmarks apresentados na conferência HPC Ásia na semana passada são talvez os mais detalhados que vimos até agora, com os pesquisadores de Barcelona e de Nova Iorque apresentando suas descobertas na conferência. Cada grupo realizou testes diferentes, com os benchmarks de Barcelona focando no desempenho do Grace em relação ao Skylake-X, e os testes de Nova York comparando o Grace com uma variedade de outras CPUs AMD e Intel.
Os pesquisadores de Barcelona testaram o Grace-Hopper (sem a parte da GPU – efetivamente uma única CPU Grace) e o Grace Superchip contra um par de Xeon Platinum 8160 de 24 núcleos. Dado que o Skylake-X completa sete anos em 2024, não foi surpreendente que o Grace Superchip em seu pior desempenho ainda fosse 67% mais rápido do que o servidor Skylake-X de 48 núcleos; o melhor resultado do Superchip foi uma vantagem de 4,49x. A escolha da comparação de CPU é estranha, mas não arbitrária, já que o Centro de Supercomputação de Barcelona está substituindo seu MareNostrum 4 com tecnologia Intel pelo Grace da Nvidia.
Os benchmarks de Nova York são mais interessantes porque incluem comparações com Intel Sapphire Rapids e Ice Lake, Milan da AMD e CPUs rivais baseadas em Arm na forma de Graviton 3 da Amazon e A64FX da Fujitsu. O Grace Superchip venceu facilmente o Graviton 3, o A64FX, uma configuração Ice Lake de 80 núcleos e até mesmo uma configuração de 128 núcleos do Milan em todos os benchmarks. No entanto, o servidor Sapphire Rapids com dois Xeon Max 9468 de 48 núcleos interrompeu a sequência de vitórias do Grace.