A Tesla deve lançar seu tão aguardado supercomputador na segunda-feira, de acordo com @SawyerMerritt. A máquina será usada para vários aplicativos de inteligência artificial (IA), mas o cluster é tão poderoso que também poderá ser usado para cargas de trabalho exigentes de computação de alto desempenho (HPC). Na verdade, o supercomputador baseado no Nvidia H100 será uma das máquinas mais poderosas do mundo.
O novo cluster da Tesla empregará 10.000 GPUs de computação Nvidia H100, que oferecerão um desempenho máximo de 340 FP64 PFLOPS para computação técnica e 39,58 INT8 ExaFLOPS para aplicações de IA. Na verdade, os 340 FPLOPS FP64 da Tesla são superiores aos 309 PFLOPS FP64 oferecidos pela Salao terceiro supercomputador de maior desempenho do mundo.
Com o seu novo supercomputador, a Tesla está a melhorar significativamente as suas capacidades de computação para treinar a sua tecnologia de condução totalmente autónoma (FSD) mais rapidamente do que nunca. Isto não só poderia tornar a Tesla mais competitiva do que outras montadoras, mas também tornaria a empresa proprietária de um dos supercomputadores mais rápidos do mundo.
“Devido ao treinamento em vídeo do mundo real, podemos ter os maiores conjuntos de dados de treinamento do mundo, capacidade de cache de nível quente superior a 200 PB – ordens de magnitude maiores que LLMs”, explicado Tim Zaman, gerente de engenharia de infraestrutura de IA e plataforma de IA da Tesla.
Embora o novo cluster baseado em H100 deva melhorar drasticamente a velocidade de treinamento da Tesla, a Nvidia está lutando para atender à demanda por essas GPUs. Como resultado, a Tesla está investindo mais de US$ 1 bilhão para desenvolver seu próprio supercomputador, Dojo, que é construído em sistemas em chips altamente otimizados e personalizados.
Dojo não apenas acelerará o treinamento FSD, mas também gerenciará o processamento de dados de toda a frota de veículos da Tesla. A Tesla está simultaneamente colocando on-line seu cluster de GPU Nvidia H100 junto com o Dojo, um movimento que dará à empresa um poder de computação incomparável na indústria automotiva.
Elon Musk revelou recentemente que a Tesla planeja gastar mais de US$ 2 bilhões em treinamento em IA em 2023 e outros US$ 2 bilhões em 2024 especificamente em computação para treinamento em FSD. Isto sublinha o compromisso da Tesla em superar os estrangulamentos computacionais e deverá proporcionar vantagens substanciais sobre os seus rivais.