O Google lançou o Google I/O esta tarde falando por mais de uma hora sobre seus inúmeros avanços em inteligência artificial. A empresa discutiu seu novo modelo de linguagem grande PaLM 2 (LLM) para IA generativa, que alimenta a ferramenta Bard chatbot. Este é um pilar fundamental para adicionar recursos com infusão de IA ao portfólio de produtos do Google, incluindo Google Maps, Google Fotos e Gmail (entre outros).
Com isso em mente, há a necessidade de uma grande potência na nuvem para alimentar modelos em estado selvagem, já que milhões (e eventualmente bilhões) de usuários enviam solicitações para operações tão mundanas quanto remover uma pessoa que permanece no fundo de uma imagem para redigir um e-mail inteiro para você com base em um prompt de texto curto. É aí que o novo supercomputador A3 GPU do Google entra em foco. O Google diz que os novos supercomputadores A3 são “propositadamente construídos para treinar e atender aos modelos de IA mais exigentes que potencializam a IA generativa e a inovação de modelos de linguagem ampla”, ao mesmo tempo em que oferecem 26 exaFlops de desempenho de IA.
Cada supercomputador A3 está equipado com processadores Intel Xeon Scalable de 4ª geração com 2 TB de memória DDR5-4800. Mas o verdadeiro “cérebro” da operação vem das oito GPUs Nvidia H100 “Hopper”, que têm acesso a 3,6 TBps de largura de banda bissecional aproveitando o NVLink 4.0 e o NVSwitch.
De acordo com o Google, o A3 representa a primeira implantação em nível de produção de sua interface de dados GPU-para-GPU, que permite o compartilhamento de dados a 200 Gbps enquanto ignora a CPU do host. Essa interface, que o Google chama de Unidade de Processamento de Infraestrutura (IPU), resulta em um aumento de 10 vezes na largura de banda de rede disponível para máquinas virtuais (VM) A3 em comparação com VMs A2.
“As VMs A3 do Google Cloud, equipadas com GPUs NVIDIA H100 de última geração, acelerarão o treinamento e o fornecimento de aplicativos de IA generativos”, disse Ian Buck, vice-presidente de computação de hiperescala e alto desempenho da NVIDIA. “Na sequência das instâncias G2 lançadas recentemente pelo Google Cloud, estamos orgulhosos de continuar nosso trabalho com o Google Cloud para ajudar a transformar empresas em todo o mundo com infraestrutura de IA criada especificamente.”
Se sua empresa deseja aproveitar as máquinas virtuais A3, a única maneira de obter acesso é preenchendo o formulário do Google Formulário de interesse de visualização A3 para participar do Programa de Acesso Antecipado. Mas, como o Google afirma claramente, inserir suas informações não garante uma vaga no programa.