De acordo com Joongang.co.kr, a SK Hynix iniciou o recrutamento de profissionais na área de design de semicondutores lógicos, como CPUs e GPUs. A empresa está considerando a possibilidade de empilhar o HBM4 diretamente nos processadores, o que pode não apenas alterar a forma como dispositivos lógicos e de memória são normalmente interconectados, mas também a maneira como são fabricados. Se for bem-sucedida, essa abordagem pode ter um impacto significativo na indústria de fundição.
Atualmente, as pilhas HBM integram oito, 12 ou 16 dispositivos de memória, assim como uma camada lógica que funciona como um hub. Elas são colocadas próximo às CPUs ou GPUs e conectadas aos processadores usando uma interface de 1024 bits. A SK Hynix planeja colocar as pilhas HBM4 diretamente nos processadores, eliminando completamente os intermediários. Em certo sentido, essa abordagem se assemelha ao 3D V-Cache da AMD, que é colocado diretamente nas matrizes da CPU, porém a HBM apresentará capacidades consideravelmente maiores e será mais barata (embora mais lenta).
A SK Hynix está discutindo seu método de design de integração HBM4 com várias empresas sem fábrica, incluindo a Nvidia. É provável que a SK Hynix e a Nvidia projetem conjuntamente o chip desde o início e o produzam na TSMC, que também colocará o dispositivo HBM4 da SK Hynix em chips lógicos usando uma tecnologia de ligação de wafer. Um projeto conjunto é inevitável para que a memória e os semicondutores lógicos funcionem como um só corpo na mesma matriz.
A memória HBM4 usará uma interface de 2.048 bits para se conectar aos processadores host, o que tornará os intermediários extremamente complexos e caros. Isso torna economicamente viável a conexão direta de memória e lógica. No entanto, colocar pilhas HBM4 diretamente em chips lógicos apresenta desafios térmicos significativos.
Processadores lógicos modernos, como o H100 da Nvidia, consomem centenas de watts de energia e dissipam centenas de watts de energia térmica. A memória HBM também consome bastante energia. Portanto, o resfriamento de um pacote contendo lógica e memória pode exigir métodos sofisticados, incluindo resfriamento líquido e/ou submersão.
Kim Jung-ho, professor do Departamento de Elétrica e Eletrônica da KAIST, afirmou: “Se o problema de aquecimento for resolvido duas a três gerações mais tarde do que agora, HBM e GPU serão capazes de operar como um só corpo sem um intermediário”.
A integração da memória diretamente nos processadores também impactará o design e a fabricação dos chips. Produzir DRAM usando a mesma tecnologia de processo que a lógica e na mesma fábrica garantirá o melhor desempenho, mas também aumentará drasticamente os custos de memória, o que não é seriamente considerado no momento. Parece que a memória e a lógica estão prestes a se aproximar, tanto literalmente quanto no nível da tecnologia de processo.
Um membro da indústria disse ao Joongang.co.kr: “Dentro de 10 anos, as ‘regras do jogo’ para semicondutores podem mudar, e a distinção entre memória e semicondutores lógicos pode se tornar insignificante”.