Um site de benchmarking Linux chamado Phoronix realizou testes na CPU escalonável Xeon Emerald Rapids de 5ª geração da Intel para avaliar a melhoria de desempenho ao utilizar instruções AVX-512. O resultado mostrou um aumento médio de desempenho em até o dobro, com alguns casos de até dez vezes mais rápido, sem um consumo substancialmente maior de energia.
Os testes foram realizados em um servidor com duas CPUs Xeon Platinum 8592+ de 64 núcleos da Intel, 1 TB de memória DDR5, um SSD de 3 TB e utilizando o Intel Eagle Stream com a distribuição Ubuntu Linux. Diversas cargas de trabalho, como Embree, OpenVKL e Y-Cruncher, foram comparadas, e o uso do AVX-512 mostrou em média um aumento significativo de desempenho.
Os resultados de desempenho do OpenVINO foram a principal base para o aumento da média, com a maioria das execuções do OpenVINO utilizando AVX-512 mostrando pelo menos o dobro de desempenho, chegando até a dez vezes mais rápido. Isso se deve ao suporte do OpenVINO para AVX-VNNI e BF16, especialmente útil para cargas de trabalho de IA. A diferença na frequência de pico com AVX-512 habilitado e desabilitado foi mínima. Com AVX-512 ligado, o Xeon Platinum 8592+ atingiu 2,95 GHz em todos os núcleos, em comparação com 3,01 GHz quando desativado. O chip Emerald Rapids de 64 núcleos atingiu o clock boost de 3,9 GHz, independentemente da ativação do AVX-512.
Em média, o consumo de energia permaneceu praticamente o mesmo com ou sem AVX-512, embora algumas cargas de trabalho individuais tenham exigido até 10% mais energia. O consumo máximo de energia foi cerca de 120 watts maior, o que é típico, visto que é difícil obter desempenho gratuito sem compromissos. Esse aumento no consumo de energia também resultou em temperaturas ligeiramente mais altas. Além disso, a ativação do AVX-512 resultou em uma ligeira diminuição na frequência, possivelmente devido ao maior consumo de energia e temperaturas mais altas.
O suporte a uma ampla variedade de instruções AVX-512 é o principal destaque do Emerald Rapids. Apesar de perder em desempenho bruto para o chip EPYC Genoa de 4ª geração da AMD com 96 núcleos, como demonstrado na análise do Emerald Rapids, as instruções AVX podem alterar a dinâmica entre as CPUs de servidor da Intel e da AMD, especialmente para IA. Isso pode ser uma das razões pelas quais a Microsoft escolheu os chips Sapphire Rapids de última geração em vez do EPYC para emparelhar com as GPUs MI300X da AMD.