O processador Occamy, que usa uma arquitetura chiplet, embala 432 aceleradores RISC-V e AI e vem com 32 GB de memória HBM2E, foi gravado. O chip é apoiado pela Agência Espacial Europeia e desenvolvido por engenheiros da ETH Zürich e da Universidade de Bolonha, informa Fio HPC.
O processador Occamy apoiado pela ESA usa dois chiplets com 216 núcleos RISC-V de 32 bits, um número desconhecido de FPUs de 64 bits para cálculos de matriz e carrega dois pacotes de memória HBM2E de 16 GB da Micron. Os núcleos são interconectados usando um interposer de silício, e a CPU dual-tile pode oferecer 0,75 FP64 TFLOPS de desempenho e 6 FP8 TFLOPS de capacidade de computação.
Nem a ESA nem seus parceiros de desenvolvimento divulgaram o consumo de energia das CPUs Occamy, mas dizem que o chip pode ser resfriado passivamente, o que significa que pode ser um processador de baixo consumo de energia.
Cada chiplet Occamy tem 216 núcleos RISC-V e FPUs de matriz, totalizando cerca de um bilhão de transistores espalhados por 73mm^2 de silício. As telhas são feitas pela GlobalFoundries usando seu processo de fabricação 14LPP.
O chiplet de 73mm^2 não é um dado particularmente grande. Por exemplo, o Alder Lake da Intel (com seis núcleos de alto desempenho) tem um tamanho de matriz de 163 mm^2. No que diz respeito ao desempenho, a GPU A30 da Nvidia com 24 GB de memória HBM2 oferece 5,2 FP64/10,3 FP64 Tensor TFLOPS, bem como 330/660 (com esparsidade) INT8 TOPS.
Enquanto isso, uma das vantagens dos projetos de chiplet é que a ESA e seus parceiros da ETH Zürich e da Universidade de Bolonha podem adicionar outros chiplets ao pacote para acelerar certas cargas de trabalho, se necessário.
A CPU Occamy é desenvolvida como parte do programa EuPilot e é um dos muitos chips que a ESA está considerando para a computação de voos espaciais. No entanto, não há garantias de que o processo seja realmente usado a bordo de naves espaciais.
O design do Occamy visa oferecer suporte a cargas de trabalho de alto desempenho e IA por meio de um tempo de execução bare-metal, mas ainda não está claro se o tempo de execução será no nível do contêiner ou no nível do metal puro. O processador Occamy pode ser emulado em FPGAs. A implementação foi testada em dois FPGAs AMD Xilinx Virtex UltraScale+ HBM e o FPGA Virtex UltraScale+ VCU1525.