Intel fala sobre Falcon Shores Flub e encerra o roteiro de Habana Gaudi

A Intel planejou originalmente que seus chips Falcon Shores tivessem núcleos de GPU e CPU sob o capô, criando o primeiro ‘XPU’ da empresa para computação de alto desempenho. No entanto, seu anúncio surpresa, há alguns meses, de que mudaria para um design apenas de GPU e atrasaria os chips para 2025, deixou os observadores da indústria chocados – isso deixa a Intel incapaz de competir com os processadores Instinct MI300 da AMD e Grace Hopper da Nvidia, que apresentam uma combinação Projeto CPU+GPU.

Hoje, a Intel forneceu algumas de suas razões um tanto questionáveis por trás da decisão de reduzir seus planos para o Falcon Shores para torná-lo o sucessor apenas da GPU da série Xeon Max GPU. A Intel também esboçou alguns dos primeiros detalhes de seu novo design Falcon Shores somente para GPU, que abordaremos mais abaixo.

A Intel também lançou um novo roteiro de HPC e AI que não mostra um sucessor para o processador Gaudi3 – em vez disso, Gaudi e GPUs se fundem com a GPU Falcon Shores, uma vez que assume o manto do principal chip HPC e AI da Intel. A Intel nos disse que ‘planeja integrar o produto Habana e AXG [GPU] roteiros’, mas os detalhes são mínimos.

A arquitetura de computação Gaudi varia significativamente de uma GPU padrão, portanto não parece que sua arquitetura de computação possa ser totalmente integrada às GPUs. Isso significaria que a Intel está incorporando partes menores do design Gaudi, como sua interface de rede ou outros blocos de IP, em suas GPUs enquanto se afasta dos principais aspectos da arquitetura de computação Gaudi. Além disso, não ouvimos falar dos produtos de inferência Goya Greco de segunda geração há algum tempo.

Como lembrete, a Intel pagou US$ 2 bilhões pelo Habana Labs e eliminou produtos de sua aquisição de US$ 350 milhões da Nervana para se concentrar nos chips Gaudi. Fomos informados de que Jeff McVeigh, vice-presidente e gerente geral do grupo de computação acelerada da Intel, fornecerá mais detalhes hoje.

(Crédito da imagem: Intel)

Primeiro, a Intel compartilhou alguns detalhes básicos sobre o novo design do Falcon Shores, que continuará a se concentrar em cargas de trabalho de HPC e IA, mas emprega apenas núcleos de GPU. Os Falcon Shores XPUs focados em HPC foram projetados para aplicativos de supercomputação com planos de mesclar a tecnologia de CPU e GPU em um pacote de chips de combinação e combinação, mas agora eles chegarão pela primeira vez como uma arquitetura somente de GPU em 2025.

O Falcon Shores empregará comutação ethernet padrão, muito parecido com a arquitetura Gaudi com foco em IA da Intel, uma quantidade não especificada de memória HBM3 e “E/S projetada para escalar”, provavelmente significando que o Falcon Shores virá com diferentes opções de capacidade de memória.

O esboço básico do dispositivo também inclui uma interface de programação baseada em GPU comum, OneAPI, que permitirá ampla compatibilidade com outras CPUs e arquiteturas. A Intel também lista o suporte CXL como um diferenciador chave, o que nos leva à sua lógica por trás da retirada dos núcleos da CPU do pacote Falcon Shores.

A Intel diz que seu objetivo inicial de misturar núcleos de CPU e GPU no mesmo pacote Falcon Shores era prematuro. Conforme mostrado no slide acima, a Intel diz que a combinação ideal de núcleos de CPU e GPU mudou ao longo do tempo conforme as cargas de trabalho evoluíram, e a empresa espera que ocorram mudanças ainda mais rápidas e radicais na relação CPU/GPU ideal com a explosão de IA generativa e LLMs no espaço HPC. Como tal, a Intel diz que não sente que é o momento certo para prender os clientes em proporções específicas de CPU e GPU.

Imagem 1 de 2

(Crédito da imagem: Intel)

No entanto, como mostrado acima, o plano original para Falcon Shores incluía a capacidade de ajustar as taxas de CPU/GPU colocando um número diferente de blocos de CPU ou GPU no design de quatro blocos, permitindo assim configurar a combinação ideal para várias cargas de trabalho. Além disso, por design, os supercomputadores de ponta são designs altamente especializados para a tarefa em questão, e o ajuste de software para a arquitetura é simplesmente uma parte rotineira do negócio de operar um supercomputador. Esses fatores implicam que as proporções de CPU/GPU não são a única razão pela qual a Intel removeu os núcleos de CPU do design.

A Intel também aponta para permitir que seus clientes usem várias CPUs diferentes, que logicamente incluiriam os chips x86 da AMD e os chips Arm da Nvidia, com seu design de GPU, não impedindo os clientes de escolher os núcleos x86 da Intel em vez de outras empresas. Mas, novamente, os planos originais da Intel também incluíam variantes somente de GPU e CPU do Falcon Shores, então esse raciocínio também não parece convincente.

A Intel diz que aproveitará a interface CXL para permitir que seus clientes aproveitem uma arquitetura combinável que pode unir várias proporções de CPU/GPU em seus projetos personalizados. No entanto, a interface CXL fornece apenas 64 GB/s de taxa de transferência entre os elementos, enquanto os designs personalizados de CPU+GPU, como o Grace Hopper da Nvidia, podem fornecer até 1 TB/s de taxa de transferência de memória entre a CPU e a GPU. Isso confere vantagens de desempenho e eficiência em relação a uma implementação CXL para muitos tipos de cargas de trabalho, especialmente cargas de trabalho de IA que consomem muita largura de banda de memória. Isso sem falar nas conexões inerentemente de baixa latência entre os elementos e outras vantagens, como maior densidade de desempenho.

Isso quer dizer que, embora a ideia da Intel de uma arquitetura mais composta seja boa para algumas cargas de trabalho, provavelmente não será capaz de competir com o MI300 da AMD ou o Grace da Nvidia em potência, custo ou desempenho para determinados aplicativos.

Da mesma forma, a decisão da Intel de diminuir a cadência de lançamento de sua GPU não é ideal, pois terá que alavancar produtos mais antigos para competir com arquiteturas muito mais avançadas para HPC, como o Grace Superchips da Nvidia e o próximo APU de exascale da AMD, o Instinct MI300, ambos lançados em 2023.

Apesar do raciocínio da Intel para mudar seus objetivos, é difícil não ver a redefinição da Intel de Falcon Shores em um produto apenas de GPU, já que a empresa perdeu um ponto de inflexão arquitetônica que a colocará em desvantagem competitiva no futuro.

Intel fala sobre Falcon Shores Flub e encerra o roteiro de Habana Gaudi

Links rápidos