Supercomputing 2023: Intel traz novidades para HPC e IA
Na Supercomputing 2023, a Intel forneceu uma série de atualizações sobre suas mais recentes iniciativas de HPC e IA, incluindo novas informações sobre suas CPUs Emerald Rapids de quinta geração e futuras CPUs Granite Rapids Xeon, aceleradores Guadi, novos benchmarks de GPUs da série Max contra GPUs H100 da Nvidia e o o trabalho da empresa no modelo de IA de 1 trilhão de parâmetros ‘genAI’ que roda no supercomputador Aurora.
Após a conclusão, espera-se que o Aurora leve a coroa como o supercomputador mais rápido do mundo com dois Exaflop/s (EFlop/s) de desempenho. No entanto, a Intel ainda não compartilhou detalhes sobre o envio formal de benchmark da Aurora para a lista Top500 – a empresa diz que está deixando esse anúncio para o Departamento de Energia e o Laboratório Nacional de Argonne. Se a tradição se mantiver, a organização Top500 divulgará os tão esperados resultados ainda hoje. Enquanto isso, a atualização da Intel inclui muitas novidades para refletir.
Benchmarks do supercomputador Aurora
Em plena capacidade, o supercomputador Aurora da Intel terá 21.248 CPUs Sapphire Rapids Xeon Max equipadas com HBM2E e 60.000 GPUs Xeon Max, tornando-se a maior implantação de GPU conhecida no mundo. Conforme mencionado, a Intel ainda não está lançando benchmarks para o Top500, mas a empresa compartilhou o desempenho de algumas cargas de trabalho com um complemento parcial do sistema em execução.
Argonne executou quatro instâncias do modelo em paralelo em 256 nós no total. Essa carga de trabalho será eventualmente dimensionada para 10.000 nós depois que as cargas de trabalho forem ajustadas.
A Intel também destacou o forte dimensionamento de 128 para 256 nós em um aplicativo de inferência de IA para triagem de drogas, ESP-ML, mas o benchmarking de Argonne contra GPUs concorrentes é muito mais interessante: a Intel afirma que uma única GPU Max 1550 oferece uma aceleração de 56% em relação aos aceleradores MI250 da AMD e uma vantagem de 2,3X sobre as GPUs A100 da geração anterior da Nvidia no treinamento CosmicTagger com PyTorch/FP32. Os resultados também indicam forte dimensionamento, com uma nó de teste Sunspot de seis GPUs exibindo escala de desempenho de 83%.
Xeon ‘Emeralds Rapids’ de quinta geração, Granite Rapids
O roteiro do data center da Intel continua no caminho certo, com os chips Emerald Rapids de quinta geração programados para lançamento em 14 de dezembro. A Intel divulgou benchmarks do carro-chefe Xeon 8592+ de 64 núcleos em comparação com seu antecessor, o Xeon 8480+ de quarta geração de 56 núcleos . Como sempre, considere os benchmarks fornecidos pelo fornecedor com cautela (você pode encontrar as notas de teste no último álbum deste artigo).
A Intel também forneceu projeções de desempenho para seus futuros Granite Rapids Xeons, que serão fabricados no nó ‘Intel 3’. Esses chips adicionarão mais núcleos, frequências mais altas, aceleração de hardware para FP16 e suportarão 12 canais de memória – incluindo os novos DIMMs de memória MCR que aumentam tremendamente o rendimento da memória. Ao todo, a Intel afirma uma melhoria de 2 a 3X nas cargas de trabalho de IA, um aumento de 2,8X no rendimento de memória e uma melhoria de 2,9X na carga de trabalho de inferência de IA DeepMD + LAMMPS.
Gaudí 3 e Falcon Shores
A Intel compartilhou alguns detalhes sobre o próximo Gaudi 3, que marcará o último acelerador Guadi antes da empresa fundir suas linhas Gaudi e GPU em um único produto – Falcon Shores. O Gaudi 3 de 5nm terá quatro vezes mais desempenho em cargas de trabalho BF16 do que o Gaudi 2, o dobro da rede (Gaudi 2 tem 24x Nics RoCE de 100 GbE integrados) e 1,5 vezes mais capacidade HBM (Gaudi 2 tem 96 GB de HBM2E).
A série Data Center GPU Max da Intel agora está sendo enviada aos clientes, com sistemas com oito CPUs de formato OAM disponíveis na Supermicro, enquanto Dell e Lenovo oferecem quatro servidores OAM em oferta. As placas GPU Max Series 1100 PCIe também estão amplamente disponíveis em vários fornecedores.