Fabricante chinês de GPU Moore Threads anunciou a mais recente placa gráfica para cargas de trabalho de computação de IA e data center, o MTT S4000. Este novo carro-chefe estará no KUAE Intelligent Computing Center, um data center contendo clusters de 1.000 GPUs S4000 cada. A Moore Threads está fazendo parceria com várias empresas chinesas, incluindo a Lenovo, para lançar seu ecossistema de hardware e software KUAE.
Especificações do MTT S4000:
– GPU: MTT S4000
– Arquitetura: MUSA de 3ª geração
– SPUs (núcleos de GPU): 4096
– Relógio central: 1,8–1,9 GHz
– TFLOPs (FP32): 25
– TOPO (INT8): 200
– Capacidade de memória: 48GB GDDR6
– Largura do barramento de memória: 384 bits
– Largura de banda de memória: 768GB/s
– TDP: 250 W
Comparado aos modelos da Nvidia, o S4000 é melhor do que as GPUs de servidor Tesla baseadas em Turing de 2018, mas ainda atrás de Ampere e Ada Lovelace, lançadas em 2020 e 2022, respectivamente. O S4000 carece especialmente de potência bruta, mas ainda tem bastante capacidade de memória e largura de banda, o que pode ser útil para as cargas de trabalho de IA e modelo de linguagem grande (LLM) que Moore Threads prevê que seu carro-chefe será usado.
O S4000 também possui recursos críticos de dados de GPU para GPU, com um link de dados de 240 GB/s de uma placa para outra e suporte RDMA. Juntamente com o S4000, a Moore Threads também revelou seu KUAE Intelligent Computing Center, uma solução full-stack integrando software e hardware, com a GPU S4000 completa como peça central. Os clusters KUAE usam servidores GPU MCCX D800, cada um com oito placas S4000. No lado do software, o KUAE oferece suporte a grandes modelos de linguagem como GPT e estruturas como DeepSpeed, e a ferramenta MUSIFY da empresa permite que o S4000 funcione com o ecossistema de software CUDA baseado em GPUs Nvidia.
Apoiar esse tipo de ecossistema de hardware e software seria um desafio para qualquer empresa, mas seria quase impossível para a Moore Threads fazer isso sozinha, especialmente depois de ter demitido muitos de seus funcionários. Presumivelmente, é por isso que a empresa estabeleceu a Aliança Ecológica de Computação Inteligente e Grandes Modelos, uma parceria entre a Moore Threads e várias outras empresas chinesas, principalmente a Lenovo.