Análise da Nvidia GeForce RTX 4060: verdadeiramente popular por US $ 299

A Nvidia GeForce RTX 4060 reduz o preço de entrada da arquitetura Ada Lovelace e das GPUs da série RTX 40 para US$ 299. Ele fica entre o antigo RTX 3060 e o RTX 3050 em preços e, embora sempre haja concessões à medida que você desce a escada de preço e desempenho, representa uma proposta de valor potencialmente grande. Para aqueles com orçamento limitado, pode ser uma das melhores placas gráficas, assumindo que o desempenho é bom.

Há reclamações merecidas sobre limitar a GPU AD107 no coração desta placa a uma interface de memória de 128 bits, embora o preço mais baixo em comparação com o RTX 4060 Ti elimine parte da dor. Ainda assim, o RTX 3060 da geração anterior vinha com uma interface de 192 bits e 12 GB de memória, o que representa um claro retrocesso nessa área. Discutiremos mais sobre isso na próxima página, pois é um tópico importante.

Atualizaremos a hierarquia de benchmarks de GPU ainda hoje, agora que o embargo acabou. O resultado final não deve ser muito surpreendente: na grande maioria dos jogos, o novo RTX 4060 supera facilmente o RTX 3060 da geração anterior e quase pega a RTX 3060 Ti. Acrescente a geração de quadros do DLSS 3 e a eficiência dramaticamente aprimorada e você pode fazer um caso razoável para comprar um RTX 4060 em vez de um cartão de geração anterior. Você não alcançará novos níveis de desempenho, mas obterá todos os recursos e atualizações mais recentes da Nvidia.

A principal competição da AMD vem de dois colocados. A última geração Radeon RX 7600 reduz o preço da Nvidia em até US$ 50 agora, enquanto a geração anterior RX 6700 XT a partir de US$ 309, basicamente igualando o preço do RTX 4060, mas fornecendo 50% a mais de memória e desempenho geral potencialmente melhor. Dependendo do preço e da disponibilidade, a RTX 3060 Ti (e outras GPUs da série 30) também pode ser uma opção interessante, mas não esperamos que permaneça por muito tempo e, de fato, já está claramente saindo.

Vamos conferir as especificações, que foram reveladas há mais de um mês com o anúncio da RTX 4060 Ti. A Nvidia permite análises dos cartões MSRP de $ 299 hoje, enquanto os modelos mais caros estão sob embargo até amanhã. Recebemos um modelo Asus RTX 4060 Dual OC da Nvidia, que vem com um modesto overclock de fábrica, mas ainda custa US $ 299.

Comparação de especificações de GPU
Placa de vídeo	RTX 4060	RTX 4060 Asus Dual OC	RTX 4060Ti	RTX 4070	RTX 3050	RTX 3060	RTX 3060Ti	RTX 3070	RX 7600	RX 6700 XT	Arc A770 16GB	Arco A750
Arquitetura	AD107	AD107	AD106	AD104	GA106	GA106	GA104	GA104	Navi 33	Navi 22	ACM-G10	ACM-G10
Processo tecnológico	TSMC 4N	TSMC 4N	TSMC 4N	TSMC 4N	Samsung 8N	Samsung 8N	Samsung 8N	Samsung 8N	TSMC N6	TSMC N7	TSMC N6	TSMC N6
Transistores (bilhões)	18.9	18.9	22.9	32	12	12	17.4	17.4	13.3	17.2	21.7	21.7
Tamanho da matriz (mm^2)	158,7	158,7	187,8	294,5	276	276	392,5	392,5	204	336	406	406
SMs / CUs / Xe-Cores	24	24	34	46	20	28	38	46	32	40	32	28
Núcleos GPU (Shaders)	3072	3072	4352	5888	2560	3584	4864	5888	2048	2560	4096	3584
Tensores / Núcleos de IA	96	96	136	184	80	112	152	184	64	N / D	512	448
Ray Tracing “Núcleos”	24	24	34	46	20	28	38	46	32	40	32	28
Boost Clock (MHz)	2460	2505	2535	2475	1777	1777	1665	1725	2625	2581	2100	2050
Velocidade VRAM (Gbps)	17	17	18	21	14	15	14	14	18	16	17.5	16
VRAM (GB)	8	8	8	12	8	12	8	8	8	12	16	8
Largura do barramento VRAM	128	128	128	192	128	192	256	256	128	192	256	256
Cache L2 / Infinito	24	24	32	36	2	3	4	4	32	96	16	16
ROPs	48	48	48	64	48	48	80	96	64	64	128	128
TMUs	96	96	136	184	80	112	152	184	128	160	256	224
TFLOPS FP32 (aumento)	15.1	15.4	22.1	29.1	9.1	12.7	16.2	20.3	21.5	13.2	17.2	14.7
TFLOPS FP16 (FP8)	121 (242)	123 (246)	177 (353)	233 (466)	36 (73)	51 (102)	65 (130)	81 (163)	43	26.4	138	118
Largura de banda (GBps)	272	272	288	504	224	360	448	448	288	384	560	512
TDP (watts)	115	115	160	200	130	170	200	220	165	230	225	225
Data de lançamento	julho de 2023	julho de 2023	maio de 2023	abril de 2023	janeiro de 2022	fevereiro de 2021	dezembro de 2020	outubro de 2020	maio de 2023	março de 2021	Set 2022	Set 2022
Preço de Lançamento	$ 299	$ 299	$ 399	$ 599	$ 249	$ 329	$ 399	$ 499	$ 269	$ 479	$ 349	$ 289
Preço on-line	$ 300	$ 300	$ 380	$ 585	$ 220	$ 260	$ 275	$ 400	$ 250	$ 310	$ 340	$ 240

Há doze GPUs listadas na tabela acima se você rolar para a direita, mas a primeira coluna é a mais pertinente. A nova GeForce RTX 4060 usa a GPU AD107 da Nvidia, que também é o mesmo chip encontrado nas GPUs RTX 4060 e 4050 Laptop.

O RTX 4060 usa o chip AD107 completo, com 24 multiprocessadores de streaming (SMs), cada um com 128 núcleos CUDA. Isso dá a contagem total de shaders de 3.072. Matemáticos astutos notarão que isso é menos do que os 3.584 shaders do RTX 3060 da geração anterior. No entanto, como no restante da linha da série RTX 40, as velocidades de clock são significativamente maiores em 2.460 MHz, em comparação com 1.777 MHz no 3060. O resultado é que o desempenho máximo da computação acaba sendo 19% maior.

A largura de banda da memória é menor para taxa de transferência bruta, em 272 GB/s em comparação com os 360 GB/s do RTX 3060. Mas o cache L2 aumentou de 3 MB no 3060 para 24 MB no 4060, e a Nvidia diz que melhora a largura de banda efetiva em 67% – para 453 GB/s. Discutiremos mais o subsistema de memória e suas ramificações na próxima página.

Uma coisa a observar é que o RTX 4060 vem com uma interface PCIe x8, enquanto o RTX 4060 Ti e superior usa uma largura de link x16. Isso é semelhante ao RX 7600 e ao RTX 3050 da geração anterior, onde cortar as pistas PCIe adicionais ajuda a manter o tamanho da matriz menor. Isso não deve importar muito com a maioria dos PCs modernos, mas se você planeja atualizar um PC mais antigo que suporta apenas PCIe 3.0 com um RTX 4060, pode perder um pouco de desempenho em comparação com o que mostraremos em nossos benchmarks.

O AMD RX 7600 é atualmente o principal concorrente da AMD. (Crédito da imagem: Tom’s Hardware)

Olhando para a concorrência com base em preços relativamente semelhantes, temos muitas opções. A AMD tem a nova placa RX 7600 8GB, juntamente com a geração anterior RX 6700 XT 12GB e RX 6700 10GB. Da Intel, há o Arc A770 8GB e o Arc A750. Então a Nvidia também tem que lidar com as placas existentes como RTX 3060, RTX 3060 Ti e RTX 3070. É uma aposta segura que a Nvidia pode igualar ou superar as placas da AMD e da Intel quando se trata de desempenho de rastreamento de raios e cargas de trabalho de IA, mas provavelmente perderá para o 3060 Ti e superior nessas mesmas tarefas. O desempenho da rasterização deve ser uma batalha mais difícil para o recém-chegado.

Também incluiremos os resultados do RTX 2060, lançado no início de 2019. Muitos jogadores pulam uma geração ou duas no hardware, e a Nvidia (como AMD e RX 7600) está lançando o RTX 4060 como um ótimo caminho de atualização para pessoas ainda usando placas como GTX 1060, RTX 2060 ou RX 570/580/590. Apesar de todas as reclamações sobre a série RTX 40 e seu preço geracional mais alto, também é bom ver a Nvidia igualar ou superar o preço das duas GPUs da geração anterior. O RTX 2060 foi lançado a $ 349 e depois caiu para $ 299, enquanto o RTX 3060 foi lançado a $ 329, mas raramente viu esse preço até os últimos meses.

Imagem 1 de 1

Diagrama de blocos RTX 4060 / AD107 (Crédito da imagem: Nvidia)

O diagrama de blocos para o RTX 4060 / AD107 mostra o quanto a Nvidia reduziu as coisas para atingir os preços convencionais. A maioria dos outros chips Ada possui vários blocos NVDEC / NVENC, mas o AD107 possui apenas um de cada. Conforme observado acima, também existem apenas 24 SMs no total, distribuídos entre três GPCs (Graphics Processing Clusters). Por fim, a Nvidia fornece até 8 MB de cache L2 por canal de memória de 32 bits, mas o RTX 4060 possui apenas 6 MB habilitados para um total de 24 MB. (O RTX 4060 móvel obtém os 32 MB completos, se você estiver se perguntando.)

Assim como outros chips Ada Lovelace, o RTX 4060 inclui os núcleos Tensor de 4ª geração da Nvidia, núcleos RT de 3ª geração, unidades NVENC/NVDEC novas e aprimoradas para codificação e decodificação de vídeo com suporte a AV1 e um Acelerador de fluxo óptico significativamente mais poderoso (OFA ). O último é usado para DLSS 3, e todas as indicações são de que a Nvidia não tem intenção de tentar habilitar a geração de quadros em Ampere e GPUs RTX anteriores.

Os núcleos tensores agora suportam FP8 com esparsidade. Não está claro o quão útil isso é para várias cargas de trabalho, mas a IA e o aprendizado profundo certamente aproveitaram os formatos numéricos de menor precisão para aumentar o desempenho sem alterar significativamente a qualidade dos resultados – pelo menos em alguns casos. Em última análise, dependerá do trabalho que está sendo feito, e descobrir exatamente o que usa FP8 versus FP16, mais esparsidade, pode ser complicado.

Obviamente, executar modelos de IA em uma placa convencional de baixo custo como a RTX 4060 não é realmente o objetivo principal. Sim, a difusão estável funcionará e mostraremos os resultados do teste mais tarde. Outros modelos AI que cabem no VRAM de 8 GB também funcionarão. No entanto, qualquer pessoa que leve a sério a IA e o aprendizado de máquina quase certamente desejará uma GPU com mais capacidade de processamento e mais VRAM.

Análise da Nvidia GeForce RTX 4060: verdadeiramente popular por US $ 299

Links rápidos