A Nvidia está lançando uma nova GPU para o mercado chinês em conformidade com as restrições de exportação impostas pelo governo dos EUA, que baniram muitos dos chips da empresa. O H20 baseado em Hopper finalmente chegou para preencher a lacuna deixada pelo H800, que agora não é mais permitido, restaurando assim a disponibilidade das GPUs de datacenter da Nvidia na China, conforme relatado pela Reuters. Além disso, as GPUs L20 e L2 com tecnologia Lovelace estão listadas em pelo menos um site de varejo, sinalizando que também estão a caminho.
O H20, L20 e L2 são a segunda rodada de GPUs da Nvidia projetadas para estar em conformidade com as sanções do governo dos EUA à China. A empresa já deveria estar limpa com modelos como o A800 e o H800, que apresentavam especificações reduzidas do A100 e H100 originais. No entanto, no final do ano passado, uma alteração nas regras de exportação proibiu todas as GPUs de datacenter exclusivas da Nvidia na China, forçando a Nvidia a fabricar outro conjunto de placas que estivessem em conformidade com a lei.
Rumores sugeriam que a Nvidia pretendia lançar essas três GPUs em 2023, mas as placas só serão lançadas agora devido a atrasos. Aparentemente, o H20 estará disponível apenas em “pequenos lotes” até que uma maior disponibilidade aconteça em algum momento do segundo trimestre. Embora a Reuters não tenha conseguido verificar se o L20 e o L2 serão lançados junto com o H20 ou se estão ainda mais atrasados, conseguimos encontrar listagens para todas as três GPUs é Vipera. As listagens incluem especificações detalhadas (que se alinham com rumores anteriores) e marketing, embora Vipera diga que os cartões “chegarão em breve”.
Linha 0 – Célula 0 | HGX H20 | L20 PCIe | PCIe L2 |
Arquitetura | Funil | Aí está Lovelace | Aí está Lovelace |
Memória | 96GB HBM3 | 48 GB GDDR6 com ECC | 24 GB GDDR6 com ECC |
Largura de banda de memória | 4,0 TB/s | 864GB/s | 300GB/s |
Tensor INT8 e FP8 | 296 e 296 TFLOPS | 239 e 239 TFLOPS | 193 e 193 TFLOPS |
Tensor BF16 e FP16 | 148 e 148 TFLOPS | 119,5 e 119,5 TFLOPS | 96,5 e 96,5 TFLOPS |
Tensor TF32 | 74 TFLOPS | 59,8 TFLOPS | 48,3 TFLOPS |
FP32 | 44 TFLOPS | 59,8 TFLOPS | 24,1 TFLOPS |
FP64 | 1TFLOPS | N / D | N / D |
Núcleo RT | N / D | Sim | Sim |
MEU | Até 7 MIG | Sim | Sim |
Cache L2 | 60MB | 96MB | 36MB |
Mecanismo de mídia | 7 NVDEC, 7 NVJPEG | 3 NVENC (+AV1), 3 NVDEC, 4 NVJPEG | 2 NVENC (AVI), 4 NVDEC, 4 NVJPEG |
Poder | 400W | 275 W | A definir |
Fator de forma | HGX de 8 vias | FHFL de 2 slots | LP de 1 vaga |
Interface | PCIe Gen5 x16: 128 GB/s | PCle Gen4 x16: 64 GB/s | PCle Gen4 x16: 64 GB/s |
NVLink | 900GB/s | N / D | N / D |
As sanções dos EUA tornaram-se cada vez mais problemáticas para os negócios de GPU de datacenter da Nvidia na China. O problema mais imediato é a interrupção causada pelo banimento das GPUs; a Nvidia esteve efetivamente ausente do segmento de ponta por cerca de quatro meses após a mais recente onda de restrições. As preocupações com possíveis proibições no futuro provavelmente também afetarão as vendas da Nvidia.
A maior questão de longo prazo para a Nvidia, porém, é como ela pode competir com os rivais chineses, que não estão sujeitos a tais restrições na China. Segundo a Reuters, a Nvidia tinha mais de 90% de participação de mercado antes das sanções atingirem a China, mas a empresa poderia perder grande parte disso. O H20 é um downgrade tão grande em relação ao H100 e ao H800 que o Ascend 910B da Huawei é surpreendentemente competitivo. O 910B aparentemente tem melhor desempenho FP32 que o H20, mas uma largura de banda de interconexão mais lenta, de acordo com o relatório da Reuters.
Além disso, a Nvidia também está vendendo o H20 por menos que o 910B, com o H20 tendo disponibilidade de US$ 12.000 a US$ 15.000, enquanto o 910B aparentemente custa cerca de US$ 17.000. Servidores Octuple-GPU usando o H20 estão custando US$ 200.000, abaixo dos US$ 280.000 que a Nvidia poderia obter por um servidor H800.
Em última análise, as mesmas regras de exportação que visam limitar o acesso da China à tecnologia de ponta tornaram muito mais difícil para a Nvidia e outros competirem na China. Se os EUA adicionarem mais restrições às exportações de GPU, isso poderá tirar a Nvidia do primeiro lugar.