A AMD anunciou na semana passada que os seus APU (Accelerated Processing Unit) da classe Exascale para aceleração de aplicações de inteligência artificial, os Instinct MI300A, entraram na fase de produção em série. A produção começou este trimestre e espera-se que os APU estejam disponível em 2024 como a solução de HPC (High Power Computing) mais rápida do mundo.
Os APU AMD Instinct MI300A combinam diferentes arquitecturas e tecnologias de interligação, como Zen 4, CDNA 3 e a última geração da arquitectura Infinity.
As capacidades principais dos APU MI300A são as seguintes:
Até 61 TFLOPS FP64 de computação;
Até 122 TFLOPS cálculo FP32;
Até 128 GB de memória HBM3;
Até 5,3 TB/s de largura de banda de armazenamento;
146 biliões de transístores.
O MI300A é muito semelhante ao MI300X, mas com a diferença de que usa núcleos optimizados para memória HBM3 e arquitectura Zen 4. Nos novos APU, a AMD substituiu dois GCD (Graphics Compute Chip) de arquitectura CDNA 3 por três GCD de arquitectura Zen 4, cada um dos quais com os seus próprios pools de cache e IP principais. Nos novos chips há agora um total de 24 núcleos e 48 threads no chip, divididos em 8 núcleos e 16 threads por GCD. Além disso, há um pool de cache separado por GCD com um tamanho de 32 MB e uma cache L2 de 24 MB (1 MB por núcleo). Os GCD CDNA 3 também tinham uma cache L2 separada.
A AMD activou um total de 228 unidades de computação no lado da GPU, que são baseadas na arquitectura CDNA 3. Isto corresponde a 14592 núcleos, o que significa que há 38 unidades de computação por chiplet de GPU. Aqui estão algumas das características técnicas do AMD Instinct MI300:
Primeiro pacote de GPU de CPU integrado;
Segmentar o mercado de supercomputadores Exascale;
AMD MI300A (GPU CPU integrada);
146 biliões de transístores;
Até 24 Zen de 4 núcleos;
Arquitectura de GPU CDNA 3 228 unidades de computação (14592 núcleos);
Até 128 GB de memória HBM3;
Até 8 chiplets, 8 pilhas de memória (processo de 5 nm, 6 nm).
A AMD comparou o MI300A com o H100, mas desta vez em trabalhos específicos típicos em HPC. Em termos de números de desempenho, a APU Instinct MI300A no OpenFOAM foi capaz de alcançar um aumento de até 4 vezes no desempenho. Isso se deve principalmente ao layout de memória unificado, desempenho do GPU e capacidade geral de memória disponível e largura de banda. Em comparação com os chips com arquitectura Grace Hopper da Nvidia, o sistema também oferece até 2x desempenho por watt.
Foi confirmado que as APUs Instinct MI300A serão usadas para fazer funcionar o próximo supercomputador El Capitan. Espera-se que isso ofereça até 2 exaflops de poder de computação. Vale destacar que a AMD é a única empresa a quebrar a barreira do 1 exaflop até agora com o supercomputador Frontier e também possui o sistema mais eficiente do mundo.