A Nvidia publicou um vídeo na quinta-feira que oferece a primeira visão pública da arquitetura do Eos, seu mais novo supercomputador voltado para empresas, projetado para desenvolvimento avançado de IA em escala de datacenter, e o supercomputador de IA mais rápido da empresa.
O Eos, atualmente usado pela própria Nvidia, é classificado como o nono supercomputador de melhor desempenho no último Top 500 e é considerado o mais rápido em tarefas puras de IA. Além disso, o projeto pode ser usado para construir supercomputadores voltados para empresas para outras empresas.
“Todos os dias a EOS surge para enfrentar os desafios de milhares de desenvolvedores internos da Nvidia que fazem pesquisas de IA, ajudando-os a resolver o que antes era insolúvel”, afirmou a Nvidia no vídeo.
O Eos da Nvidia está equipado com 576 sistemas DGX H100, cada um contendo oito GPUs Nvidia H100 para cargas de trabalho de inteligência artificial (IA) e computação de alto desempenho (HPC). No total, o sistema inclui 1.152 processadores Intel Xeon Platinum 8480C (com 56 núcleos por CPU), bem como 4.608 GPUs H100, permitindo que a Eos alcance um desempenho impressionante de Rmax 121,4 FP64 PetaFLOPS, bem como 18,4 FP8 ExaFLOPS para HPC e AI, respectivamente.
O design do Eos foi desenvolvido especificamente para cargas de trabalho de IA, bem como para escalabilidade, por isso usa Mellanox Quantum-2 InfiniBand da Nvidia com tecnologia In-Network Computing que apresenta velocidades de transferência de dados de até 400 Gb/ s, o que é crucial para o treinamento eficaz de grandes modelos de IA, bem como para a expansão.
Além de hardware poderoso, o Eos da Nvidia também vem com software potente, mais uma vez, desenvolvido especificamente para desenvolvimento e implantação de IA, diz a empresa. Como resultado, o Eos da Nvidia pode atender a uma variedade de aplicações, desde uma IA generativa semelhante ao ChatGPT até uma fábrica de IA.
“Eos tem uma pilha de software integrada que inclui software de desenvolvimento e implantação de IA, [including] orquestração e gerenciamento de cluster, armazenamento de computação acelerado e bibliotecas de rede e um sistema operacional otimizado para cargas de trabalho de IA”, disse a Nvidia no vídeo. “Eos – construído a partir do conhecimento adquirido com supercomputadores Nvidia DGX anteriores, como Saturn 5 e Selene – é o exemplo mais recente da experiência em IA da Nvidia em ação. […] Ao criar uma fábrica de IA como a Eos, as empresas podem assumir os seus projetos mais exigentes e alcançar as suas aspirações de IA hoje e no futuro.”
Não sabemos quanto custa o Eos, e não ajuda que o preço dos sistemas DGX H100 da Nvidia seja confidencial e dependa de muitos fatores, como volumes. Considerando o fato de que cada Nvidia H100 pode custar US$ 30.000 – US$ 40.000 dependendo do volume, podemos começar a pensar em quão altos são os números que chegamos aqui.