A Nvidia GeForce RTX 4060 reduz o preço de entrada da arquitetura Ada Lovelace e das GPUs da série RTX 40 para US$ 299. Ele fica entre o antigo RTX 3060 e o RTX 3050 em preços e, embora sempre haja concessões à medida que você desce a escada de preço e desempenho, representa uma proposta de valor potencialmente grande. Para aqueles com orçamento limitado, pode ser uma das melhores placas gráficas, assumindo que o desempenho é bom.
Há reclamações merecidas sobre limitar a GPU AD107 no coração desta placa a uma interface de memória de 128 bits, embora o preço mais baixo em comparação com o RTX 4060 Ti elimine parte da dor. Ainda assim, o RTX 3060 da geração anterior vinha com uma interface de 192 bits e 12 GB de memória, o que representa um claro retrocesso nessa área. Discutiremos mais sobre isso na próxima página, pois é um tópico importante.
Atualizaremos a hierarquia de benchmarks de GPU ainda hoje, agora que o embargo acabou. O resultado final não deve ser muito surpreendente: na grande maioria dos jogos, o novo RTX 4060 supera facilmente o RTX 3060 da geração anterior e quase pega a RTX 3060 Ti. Acrescente a geração de quadros do DLSS 3 e a eficiência dramaticamente aprimorada e você pode fazer um caso razoável para comprar um RTX 4060 em vez de um cartão de geração anterior. Você não alcançará novos níveis de desempenho, mas obterá todos os recursos e atualizações mais recentes da Nvidia.
A principal competição da AMD vem de dois colocados. A última geração Radeon RX 7600 reduz o preço da Nvidia em até US$ 50 agora, enquanto a geração anterior RX 6700 XT a partir de US$ 309, basicamente igualando o preço do RTX 4060, mas fornecendo 50% a mais de memória e desempenho geral potencialmente melhor. Dependendo do preço e da disponibilidade, a RTX 3060 Ti (e outras GPUs da série 30) também pode ser uma opção interessante, mas não esperamos que permaneça por muito tempo e, de fato, já está claramente saindo.
Vamos conferir as especificações, que foram reveladas há mais de um mês com o anúncio da RTX 4060 Ti. A Nvidia permite análises dos cartões MSRP de $ 299 hoje, enquanto os modelos mais caros estão sob embargo até amanhã. Recebemos um modelo Asus RTX 4060 Dual OC da Nvidia, que vem com um modesto overclock de fábrica, mas ainda custa US $ 299.
Placa de vídeo | RTX 4060 | RTX 4060 Asus Dual OC | RTX 4060Ti | RTX 4070 | RTX 3050 | RTX 3060 | RTX 3060Ti | RTX 3070 | RX 7600 | RX 6700 XT | Arc A770 16GB | Arco A750 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Arquitetura | AD107 | AD107 | AD106 | AD104 | GA106 | GA106 | GA104 | GA104 | Navi 33 | Navi 22 | ACM-G10 | ACM-G10 |
Processo tecnológico | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N | Samsung 8N | Samsung 8N | Samsung 8N | Samsung 8N | TSMC N6 | TSMC N7 | TSMC N6 | TSMC N6 |
Transistores (bilhões) | 18.9 | 18.9 | 22.9 | 32 | 12 | 12 | 17.4 | 17.4 | 13.3 | 17.2 | 21.7 | 21.7 |
Tamanho da matriz (mm^2) | 158,7 | 158,7 | 187,8 | 294,5 | 276 | 276 | 392,5 | 392,5 | 204 | 336 | 406 | 406 |
SMs / CUs / Xe-Cores | 24 | 24 | 34 | 46 | 20 | 28 | 38 | 46 | 32 | 40 | 32 | 28 |
Núcleos GPU (Shaders) | 3072 | 3072 | 4352 | 5888 | 2560 | 3584 | 4864 | 5888 | 2048 | 2560 | 4096 | 3584 |
Tensores / Núcleos de IA | 96 | 96 | 136 | 184 | 80 | 112 | 152 | 184 | 64 | N / D | 512 | 448 |
Ray Tracing “Núcleos” | 24 | 24 | 34 | 46 | 20 | 28 | 38 | 46 | 32 | 40 | 32 | 28 |
Boost Clock (MHz) | 2460 | 2505 | 2535 | 2475 | 1777 | 1777 | 1665 | 1725 | 2625 | 2581 | 2100 | 2050 |
Velocidade VRAM (Gbps) | 17 | 17 | 18 | 21 | 14 | 15 | 14 | 14 | 18 | 16 | 17.5 | 16 |
VRAM (GB) | 8 | 8 | 8 | 12 | 8 | 12 | 8 | 8 | 8 | 12 | 16 | 8 |
Largura do barramento VRAM | 128 | 128 | 128 | 192 | 128 | 192 | 256 | 256 | 128 | 192 | 256 | 256 |
Cache L2 / Infinito | 24 | 24 | 32 | 36 | 2 | 3 | 4 | 4 | 32 | 96 | 16 | 16 |
ROPs | 48 | 48 | 48 | 64 | 48 | 48 | 80 | 96 | 64 | 64 | 128 | 128 |
TMUs | 96 | 96 | 136 | 184 | 80 | 112 | 152 | 184 | 128 | 160 | 256 | 224 |
TFLOPS FP32 (aumento) | 15.1 | 15.4 | 22.1 | 29.1 | 9.1 | 12.7 | 16.2 | 20.3 | 21.5 | 13.2 | 17.2 | 14.7 |
TFLOPS FP16 (FP8) | 121 (242) | 123 (246) | 177 (353) | 233 (466) | 36 (73) | 51 (102) | 65 (130) | 81 (163) | 43 | 26.4 | 138 | 118 |
Largura de banda (GBps) | 272 | 272 | 288 | 504 | 224 | 360 | 448 | 448 | 288 | 384 | 560 | 512 |
TDP (watts) | 115 | 115 | 160 | 200 | 130 | 170 | 200 | 220 | 165 | 230 | 225 | 225 |
Data de lançamento | julho de 2023 | julho de 2023 | maio de 2023 | abril de 2023 | janeiro de 2022 | fevereiro de 2021 | dezembro de 2020 | outubro de 2020 | maio de 2023 | março de 2021 | Set 2022 | Set 2022 |
Preço de Lançamento | $ 299 | $ 299 | $ 399 | $ 599 | $ 249 | $ 329 | $ 399 | $ 499 | $ 269 | $ 479 | $ 349 | $ 289 |
Preço on-line | $ 300 | $ 300 | $ 380 | $ 585 | $ 220 | $ 260 | $ 275 | $ 400 | $ 250 | $ 310 | $ 340 | $ 240 |
Há doze GPUs listadas na tabela acima se você rolar para a direita, mas a primeira coluna é a mais pertinente. A nova GeForce RTX 4060 usa a GPU AD107 da Nvidia, que também é o mesmo chip encontrado nas GPUs RTX 4060 e 4050 Laptop.
O RTX 4060 usa o chip AD107 completo, com 24 multiprocessadores de streaming (SMs), cada um com 128 núcleos CUDA. Isso dá a contagem total de shaders de 3.072. Matemáticos astutos notarão que isso é menos do que os 3.584 shaders do RTX 3060 da geração anterior. No entanto, como no restante da linha da série RTX 40, as velocidades de clock são significativamente maiores em 2.460 MHz, em comparação com 1.777 MHz no 3060. O resultado é que o desempenho máximo da computação acaba sendo 19% maior.
A largura de banda da memória é menor para taxa de transferência bruta, em 272 GB/s em comparação com os 360 GB/s do RTX 3060. Mas o cache L2 aumentou de 3 MB no 3060 para 24 MB no 4060, e a Nvidia diz que melhora a largura de banda efetiva em 67% – para 453 GB/s. Discutiremos mais o subsistema de memória e suas ramificações na próxima página.
Uma coisa a observar é que o RTX 4060 vem com uma interface PCIe x8, enquanto o RTX 4060 Ti e superior usa uma largura de link x16. Isso é semelhante ao RX 7600 e ao RTX 3050 da geração anterior, onde cortar as pistas PCIe adicionais ajuda a manter o tamanho da matriz menor. Isso não deve importar muito com a maioria dos PCs modernos, mas se você planeja atualizar um PC mais antigo que suporta apenas PCIe 3.0 com um RTX 4060, pode perder um pouco de desempenho em comparação com o que mostraremos em nossos benchmarks.
Olhando para a concorrência com base em preços relativamente semelhantes, temos muitas opções. A AMD tem a nova placa RX 7600 8GB, juntamente com a geração anterior RX 6700 XT 12GB e RX 6700 10GB. Da Intel, há o Arc A770 8GB e o Arc A750. Então a Nvidia também tem que lidar com as placas existentes como RTX 3060, RTX 3060 Ti e RTX 3070. É uma aposta segura que a Nvidia pode igualar ou superar as placas da AMD e da Intel quando se trata de desempenho de rastreamento de raios e cargas de trabalho de IA, mas provavelmente perderá para o 3060 Ti e superior nessas mesmas tarefas. O desempenho da rasterização deve ser uma batalha mais difícil para o recém-chegado.
Também incluiremos os resultados do RTX 2060, lançado no início de 2019. Muitos jogadores pulam uma geração ou duas no hardware, e a Nvidia (como AMD e RX 7600) está lançando o RTX 4060 como um ótimo caminho de atualização para pessoas ainda usando placas como GTX 1060, RTX 2060 ou RX 570/580/590. Apesar de todas as reclamações sobre a série RTX 40 e seu preço geracional mais alto, também é bom ver a Nvidia igualar ou superar o preço das duas GPUs da geração anterior. O RTX 2060 foi lançado a $ 349 e depois caiu para $ 299, enquanto o RTX 3060 foi lançado a $ 329, mas raramente viu esse preço até os últimos meses.
O diagrama de blocos para o RTX 4060 / AD107 mostra o quanto a Nvidia reduziu as coisas para atingir os preços convencionais. A maioria dos outros chips Ada possui vários blocos NVDEC / NVENC, mas o AD107 possui apenas um de cada. Conforme observado acima, também existem apenas 24 SMs no total, distribuídos entre três GPCs (Graphics Processing Clusters). Por fim, a Nvidia fornece até 8 MB de cache L2 por canal de memória de 32 bits, mas o RTX 4060 possui apenas 6 MB habilitados para um total de 24 MB. (O RTX 4060 móvel obtém os 32 MB completos, se você estiver se perguntando.)
Assim como outros chips Ada Lovelace, o RTX 4060 inclui os núcleos Tensor de 4ª geração da Nvidia, núcleos RT de 3ª geração, unidades NVENC/NVDEC novas e aprimoradas para codificação e decodificação de vídeo com suporte a AV1 e um Acelerador de fluxo óptico significativamente mais poderoso (OFA ). O último é usado para DLSS 3, e todas as indicações são de que a Nvidia não tem intenção de tentar habilitar a geração de quadros em Ampere e GPUs RTX anteriores.
Os núcleos tensores agora suportam FP8 com esparsidade. Não está claro o quão útil isso é para várias cargas de trabalho, mas a IA e o aprendizado profundo certamente aproveitaram os formatos numéricos de menor precisão para aumentar o desempenho sem alterar significativamente a qualidade dos resultados – pelo menos em alguns casos. Em última análise, dependerá do trabalho que está sendo feito, e descobrir exatamente o que usa FP8 versus FP16, mais esparsidade, pode ser complicado.
Obviamente, executar modelos de IA em uma placa convencional de baixo custo como a RTX 4060 não é realmente o objetivo principal. Sim, a difusão estável funcionará e mostraremos os resultados do teste mais tarde. Outros modelos AI que cabem no VRAM de 8 GB também funcionarão. No entanto, qualquer pessoa que leve a sério a IA e o aprendizado de máquina quase certamente desejará uma GPU com mais capacidade de processamento e mais VRAM.