A arquitetura Ada Lovelace da Nvidia apresenta um novo nível de desempenho no topo da pilha, com o RTX 4090 superando o RTX 3090 Ti da geração anterior em 52% em média em nossos benchmarks de rasterização e 70% em benchmarks de rastreamento de raios – ambos em 4K , naturalmente. O 4090 agora está confortavelmente no topo de nossa hierarquia de benchmarks de GPU e é classificado como uma das melhores placas gráficas do mercado, pelo menos se você tiver bolsos cheios.
Infelizmente, a redução do 4090 para o RTX 4080 é bastante precipitada, diminuindo o desempenho em 23% para rasterização e 30% para rastreamento de raios. Descer outro nível para o novo RTX 4070 Ti reduz 22% a mais o desempenho em relação ao 4080. Se você está acompanhando – e nós definitivamente gostamos de anotar – isso significa que o cartão Ada de terceira linha ostenta a GPU AD104 é mais lento que o 3090 Ti da geração anterior, não importa as afirmações da Nvidia em contrário, que dependem de benchmarks usando a geração de quadros do DLSS 3.
Talvez o mais alarmante com o RTX 4070 Ti seja que ele possui apenas uma interface de memória de 192 bits. Ele ainda tem 12 GB de memória GDDR6X, e o grande cache L2 em geral significa que o barramento mais estreito não é um problema, mas as coisas não parecem tão boas quando olhamos para as futuras peças da série RTX 40 de nível inferior, como o 4060 e 4050.
A Nvidia anunciou recentemente a linha completa de GPUs para laptop da série RTX 40, desde o RTX 4090 móvel que usa a GPU AD103 (basicamente um móvel 4080) até o RTX 4050 de som anêmico. Aqui está a lista completa de especificações para as peças móveis .
Placa de vídeo | RTX 4090 para notebooks | RTX 4080 para notebooks | RTX 4070 para portáteis | RTX 4060 para notebooks | RTX 4050 para portáteis |
---|---|---|---|---|---|
Arquitetura | AD103 | AD104 | AD106? | AD106? | AD107? |
Processo tecnológico | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N |
Transistores (bilhões) | 45,9 | 35,8 | ? | ? | ? |
Tamanho da matriz (mm^2) | 378,6 | 294,5 | ? | ? | ? |
SMS | 76 | 58 | 36 | 24 | 20 |
Shaders de GPU | 9728 | 7424 | 4608 | 3072 | 2560 |
Núcleos tensores | 304 | 232 | 144 | 96 | 80 |
Ray Tracing “Núcleos” | 76 | 58 | 36 | 24 | 20 |
Boost Clock (MHz) | 1455-2040 | 1350-2280 | 1230-2175 | 1470-2370 | 1605-2370 |
Velocidade VRAM (Gbps) | 18? | 18? | 18? | 18? | 18? |
VRAM (GB) | 16 | 12 | 8 | 8 | 6 |
Largura do barramento VRAM | 256 | 192 | 128 | 128 | 96 |
Cache L2 | 64 | 48 | 32 | 32 | 24 |
ROPs | 112 | 80 | 48 | 32 | 32 |
TMUs | 304 | 232 | 144 | 96 | 80 |
TFLOPS FP32 (aumento) | 28.3-39.7 | 20,0-33,9 | 11,3-20,0 | 9,0-14,6 | 8.2-12.1 |
TFLOPS FP16 (FP8) | 226-318 (453-635) | 160-271 (321-542) | 91-160 (181-321) | 72-116 (145-233) | 66-97 (131-194) |
Largura de banda (GBps) | 576 | 432 | 288 | 288 | 216 |
TDP (watts) | 80-150 | 60-150 | 35-115 | 35-115 | 35-115 |
É uma aposta razoavelmente segura que o desktop RTX 4070 usará o mesmo AD104 que o RTX 4070 Ti, apenas com menos SMs e shaders. Desktop RTX 4060 Ti, supondo que consigamos isso em breve, pode ou não usar AD104; a única outra opção presumivelmente seria a GPU AD106 usada no 4070/4060 móvel. E isso é um problema.
A geração anterior RTX 3060 Ti veio com 8 GB de GDDR6 em uma interface de 256 bits. Não ficamos particularmente satisfeitos com a falta de VRAM, especialmente quando a AMD começou a fornecer RX 6700 XT (e posteriormente 6750 XT) com 12 GB de VRAM. A Nvidia basicamente fez uma correção de curso com o RTX 3060 e deu a ele 12 GB de VRAM, tornando-o um bom avanço em relação ao RTX 2060 anterior – e até o 2060 acabou vendo modelos de 12 GB, embora os preços os tornassem pouco atraentes.
Agora estamos falando de RTX 4060 provavelmente voltando para 8 GB, e isso seria péssimo. Existem muitos jogos agora que podem exceder 8 GB de uso de VRAM, e esse número só aumentará nos próximos dois anos. Mas a Nvidia não tem muitas outras opções, já que as capacidades de memória GDDR6 e GDDR6X chegam a 2 GB por canal de 32 bits.
Há potencial para fazer o modo “clamshell” com dois chips de memória por canal, um em cada lado do PCB, mas isso é muito confuso e não é algo que esperaríamos ver em uma GPU convencional. Isso poderia levar a interface de 128 bits a até 16 GB de VRAM, o que novamente seria estranho, pois as peças de nível superior, como o 4070 Ti, têm apenas 12 GB. Ainda assim, isso soa melhor do que um modelo RTX 4060 de 8 GB para mim!
E a RTX 4050? Talvez a Nvidia continue com a interface de 128 bits na GPU AD106 e pule o uso do AD107 em uma parte do desktop – foi basicamente o que aconteceu com o GA107, que foi usado quase exclusivamente para laptop RTX 3050. Mas se tentar usar o AD107 em um desktop, ele teria apenas até 6 GB de VRAM, novamente com o clamshell VRAM sendo uma saída em potencial.
Não são apenas as capacidades de memória que suscitam alguma preocupação. Dissemos na análise da RTX 4070 Ti que o desempenho não era ruim, mas também não era incrível. É basicamente uma versão mais barata de um RTX 3090, com metade da VRAM e menor consumo de energia. O 4070 Ti sobrevive com 60 Streaming Multiprocessors (SMs) e 7680 CUDA cores (GPU shaders), um pouco mais do que o RTX 3070 Ti de saída. Mas o AD106 poderia atingir apenas 40 SMs, talvez até 36 SMs, o que o colocaria em território semelhante ao RTX 3060 Ti em contagens de núcleo, deixando apenas os clocks da GPU como um aumento de desempenho.
Junte essas duas coisas – VRAM insuficiente e aumentos relativamente pequenos nas contagens de sombreamento da GPU – e provavelmente veremos melhorias de desempenho modestas em comparação com as GPUs da geração Ampere anterior.
A Nvidia apresentará as melhorias de desempenho do DLSS 3, que se aplicam apenas a um subconjunto de jogos e também não oferecem aumentos reais de desempenho, e as coisas começam a parecer ainda piores. Parte do benefício de ter uma GPU que pode rodar jogos a 120 fps hoje é que, à medida que os jogos ficam mais exigentes, ela ainda será capaz de fazer 60 fps na maioria dos jogos daqui a alguns anos. Mas o que acontece quando esses não são real taxas de quadros?
Vamos supor um jogo rodando a 120 fps, cortesia da tecnologia Frame Generation do DLSS 3, com um desempenho básico de 70 fps. Tudo está bem por enquanto, mas no futuro o desempenho básico cairá abaixo de 40 fps à medida que os jogos se tornarem mais exigentes e, eventualmente, cairá abaixo de 30 fps. O que experimentamos é que a geração de quadros com uma taxa de quadros básica inferior a 30 fps ainda parece abaixo de 30 fps, mesmo que o monitor esteja recebendo o dobro de atualizações de quadros por segundo.
Essa mesma lógica também se aplica a taxas de quadros mais altas, portanto, o DLSS 3 a 120 fps com uma base de 70 fps ainda parecerá 70 fps, mesmo que pareça um pouco mais suave aos olhos. A maioria das pessoas não será capaz de dizer a diferença entre taxas de entrada em 70 amostras por segundo e entradas em 120 amostras por segundo. Mas quando você começa a cair abaixo de 40, mesmo os jogadores não profissionais começam a sentir a diferença.
Ou, para ser mais direto: DLSS 3 e Geração de quadros não são uma panaceia. Eles podem ajudar a suavizar os visuais e talvez melhorar um pouco a sensação dos jogos, mas o benefício não será tão perceptível quanto os quadros reais totalmente renderizados com a nova entrada do usuário, principalmente quando o desempenho cai abaixo de 60 fps.
Isso não quer dizer que seja uma tecnologia ruim – na verdade, é bastante inteligente – e não nos importamos que ela exista. Mas a Nvidia precisa parar de comparar as pontuações do DLSS 3 com os resultados não DLSS 3 e agir como se fossem a mesma coisa. Pegue a taxa de quadros básica antes da geração de quadros e adicione talvez 10 a 20 por cento e é assim que um jogo se parece, não os fps 60 a 100 por cento mais altos que os benchmarks mostrarão.
Voltando ao assunto em questão, as futuras GPUs convencionais e econômicas da série RTX 40 sem dúvida superarão os modelos existentes em desempenho puro e também oferecerão suporte a DLSS 3. Esperançosamente, a Nvidia retornará aos preços mais próximos da geração anterior, porque se o RTX 4060 custa $ 499 e o RTX 4050 custa $ 399, eles acabarão sendo atualizações menores em comparação com os cartões existentes nesses pontos de preço.