O renomado vazador de hardware @kopite7kimi corrigiu sua previsão anterior de que a principal unidade de processamento gráfico da próxima geração da Nvidia baseada na arquitetura Blackwell teria uma interface de memória de 512 bits. Não será assim. A GPU da Nvidia, conhecida atualmente como GB202, continuará a usar um barramento de memória de 384 bits e adotará o tipo de memória GDDR7.
A GPU GB202 da Nvidia foi projetada para apresentar até 24.576 núcleos CUDA, um aumento de 33% em relação ao número de núcleos CUDA incluídos na GPU AD102 (18.432 núcleos CUDA). Rumores sugerem que a empresa usará um dos processos de fabricação da classe 3nm da TSMC para fabricar suas GPUs baseadas na arquitetura Blackwell, mas ainda não se sabe se a Nvidia e a TSMC personalizarão os nós da classe 3nm da TSMC para GPUs ou se continuarão o padrão.
“Droga, devemos ajustar nossa avaliação de [GeForce] RTX 5090/5080″, escreveu kopite7kimi em um Postagem X (anteriormente Twitter).
“Acho que provavelmente cometi um erro empírico”, disse kopite7kimi em outro publicar. “Eu apliquei erroneamente a proporção de L2 de Ada Lovelace [cache] e [memory controller] para Blackwell, [which led to an incorrect assumption regarding GB202’s 512-bit memory interface].”
Quando questionados se se referiam a uma interface de memória de 384 bits para a unidade de processamento gráfico GB202, eles responderam positivamente, esclarecendo que a peça também utilizará GDDR7. Embora um barramento de 512 bits permitiria à Nvidia aumentar enormemente a largura de banda disponível para suas principais placas gráficas de próxima geração (presumivelmente chamadas de Nvidia GeForce RTX 5090), o uso de GDDR7 em uma interface de 384 bits também fornecerá benefícios tangíveis.
nulo | GPC | TPC por GPC | SM por TPC | Núcleos CUDA por SM | Contagem de núcleos CUDA | Linha 0 – Célula 6 |
GA100 | 8 | 8 | 2 | 64 | 8192 | Linha 1 – Célula 6 |
Se a Nvidia usar ICs de 32 GT/s e 16 Gb da Micron, então seu RTX 5090 terá 1,536 TB/s de largura de banda de memória – isso é superior aos 1,008 TB/s que o RTX 4090, a melhor placa gráfica disponível hoje, obtém. No entanto, com ICs de 16 Gb, a Nvidia ainda terá que manter 24 GB de memória em sua placa de consumo premium.