Ampere Computação hoje apresentou seu roteiro para os próximos anos, incluindo novas CPUs e colaborações com terceiros. Em particular, a empresa disse que lançaria seu novo processador AmpereOne de 256 núcleos no próximo ano, fabricado com a tecnologia de processo N3 da TSMC. Além disso, a Ampere está se unindo à Qualcomm para construir servidores de inferência de IA com os aceleradores da empresa. Aparentemente, a Huawei também está pensando em integrar chips de terceiros compatíveis com UCIe em suas próprias plataformas.
Entrada de CPUs de 256 núcleos
A Ampere começou a fornecer processadores AmpereOne de 192 núcleos com um subsistema de memória DDR5 de oito canais lançado há um ano. Ainda este ano, a empresa planeja lançar CPUs AmpereOne de 192 núcleos com um subsistema de memória DDR5 de 12 canais, exigindo uma plataforma totalmente nova.
No próximo ano, a empresa usará esta plataforma para sua CPU AmpereOne de 256 núcleos, que será fabricada usando um dos processos de fabricação N3 da TSMC. A empresa não divulga se o novo processador também contará com uma nova microarquitetura, embora pareça que continuará a contar com 2 MB de cache L2 por núcleo.
“Estamos ampliando nossa família de produtos para incluir um novo produto de 256 núcleos que oferece 40% mais desempenho do que qualquer outro CPU no mercado”, disse Renee James, CEO da Ampere. “Não se trata apenas de núcleos. Trata-se do que você pode fazer com a plataforma. Temos vários novos recursos que permitem desempenho, memória, cache e computação de IA eficientes.”
A empresa afirma que sua CPU de 256 núcleos usará o mesmo sistema de resfriamento de suas ofertas existentes, o que implica que sua potência de design térmico permanecerá na casa dos 350 watts.
Juntando-se à Qualcomm para servidores de IA
Embora o Ampere certamente possa atender a muitas instâncias de nuvem de uso geral, seus recursos para IA são bastante limitados. A própria empresa afirma que sua CPU AmpereOne de 128 núcleos com suas duas unidades vetoriais de 128 bits por núcleo (e suportando os formatos INT8, INT16, FP16 e BFloat16) pode oferecer desempenho comparável ao GPU A10 da Nvidia, embora com menor consumo de energia. Ampere certamente precisa de algo melhor para competir com o A100, H100 ou B100/B200 da Nvidia.
Então ela se uniu à Qualcomm e as duas empresas planejam construir plataformas para inferência LLM baseadas nas CPUs da Ampere e Aceleradores Cloud AI 100 Ultra da Qualcomm. Não há informações sobre quando a plataforma estará pronta, mas isso demonstra que as ambições da Ampere não se limitam à computação de uso geral.
Planos de chips
Por último, mas não menos importante, Ampere anunciou a formação de um grupo de trabalho UCIe dentro da AI Platform Alliance. A empresa pretende aproveitar a flexibilidade de suas CPUs com a tecnologia de interface aberta UCIe e incorporar IPs desenvolvidos pelo cliente em CPUs futuras, o que essencialmente lhe permitirá construir silício personalizado para seus clientes.