Os servidores DGX da Nvidia de próxima geração terão refrigeração líquida, de acordo com os comentários do CEO da Nvidia, Jensen Huang, na Cimeira Econômica SIEPR 2024. Entre dizer que o próximo sistema era “magnífico” e “lindo”, Huang também mencionou que os próximos servidores DGX estão “chegando em breve”, indicando que talvez a próxima geração de placas gráficas da Nvidia também esteja no horizonte.
Os comentários de Huang não foram totalmente claros e ele não mencionou explicitamente nada sobre a DGX. Em vez disso, durante um monólogo sobre o poder das GPUs modernas e dos processadores de IA, ele disse “um de nossos computadores” e “o próximo, que chegará em breve, é refrigerado a líquido”. Como a única linha de computadores focados em IA da Nvidia é o DGX, provavelmente é seguro dizer que Huang está se referindo ao DGX, ou pelo menos essa é a opinião de alguns analistas do setor de TI.
Os servidores, mesmo aqueles em data centers grandes e de última geração, ainda dependem principalmente de refrigeração a ar para CPUs e GPUs, incluindo a geração atual DGX. Mesmo as placas gráficas H100 e H200 de última geração da Nvidia funcionam bem sob refrigeração a ar, então o ímpeto para mudar para líquido não foi tão grande. No entanto, como a Dell afirma que as próximas GPUs Blackwell da Nvidia consomem até 1.000 watts, o resfriamento líquido pode ser necessário. Alegações de que a Blackwell consumia 1.400 watts também foram divulgadas.
Processadores de 2.000 watts podem até ser possíveis, já que os pesquisadores da Intel estão tentando projetar um cooler líquido que possa suportar tanto calor. Durante anos, os processadores têm ficado mais quentes e com maior consumo de energia e, para manter essa tendência, a indústria precisará investir em soluções de refrigeração de ponta.
Tudo isto é no interesse de aumentar o desempenho, mas nem todos ficam impressionados com os TDPs de quatro dígitos. O analista da indústria Patrick Moorhead foi particularmente contundente sobre a ideia de um DGX refrigerado a líquido, dizendo “Então, puxamos quase todas as alavancas até agora para otimizar o desempenho em um grau razoável de calor/potência… O que vem a seguir, nitrogênio líquido?” Moorhead sugeriu apertar “o botão de reset” e deu a entender que a integração dessa tecnologia simplesmente não seria sustentável.
Realisticamente, provavelmente terá de haver um ponto em que a potência já não possa ser aumentada para aumentar o desempenho, mas o consumo de energia tem aumentado constantemente de geração em geração. Há uma década, 300 watts eram considerados excessivos e agora as CPUs e GPUs de última geração ultrapassam facilmente esse número. Aumentos adicionais de potência não parecem desaparecer tão cedo, desde que não haja melhor maneira de aumentar o desempenho de maneira confiável.