Atualmente, a plataforma CUDA da Nvidia é incomparável em seu suporte à inteligência artificial (IA), resultando em uma alta demanda por infraestrutura de IA baseada em Nvidia. Para atender a essa demanda, a Amazon Web Services e a Nvidia firmaram uma parceria estratégica. Como parte dessa parceria, a AWS oferecerá infraestrutura baseada em Nvidia para IA generativa e as duas empresas colaborarão em vários projetos importantes.
A AWS oferece a mais ampla gama de soluções de GPU da Nvidia para cargas de trabalho, incluindo gráficos, jogos, computação de alto desempenho, aprendizado de máquina e agora, IA generativa. A parceria também inclui o Projeto Ceiba, que tem como objetivo criar o supercomputador de IA alimentado por GPU mais rápido do mundo, hospedado pela AWS e disponível exclusivamente para Nvidia.
O supercomputador integrará 16.384 Superchips Nvidia GH200 e o Nuvem Nvidia DGX hospedada na AWS é outro componente importante da parceria. Além disso, a AWS será a primeira a oferecer um serviço baseado em nuvem Supercomputador de IA baseado nos superchips GH200 Grace Hopper da Nvidia. A colaboração também apresentará novas instâncias Amazon EC2 com tecnologia Nvidia e software avançado da Nvidia para acelerar o desenvolvimento generativo de IA na AWS.
Jensen Huang, fundador e CEO da Nvidia, afirmou que a IA generativa está transformando as cargas de trabalho na nuvem e colocando a computação acelerada na base da geração diversificada de conteúdo. E, impulsionadas por uma missão comum de fornecer IA generativa de última geração e econômica para todos os clientes, a Nvidia e a AWS estão colaborando em toda a pilha de computação, abrangendo infraestrutura de IA, bibliotecas de aceleração, modelos básicos, até serviços de IA generativa.