maio 10, 2024

Atibaia Connection

Encontre todos os artigos mais recentes e assista a programas de TV, reportagens e podcasts relacionados ao Brasil

2 ExaFLOPS, dezenas de milhares de CPUs e GPUs

2 ExaFLOPS, dezenas de milhares de CPUs e GPUs

O Argonne National Laboratory e a Intel disseram na quinta-feira que instalaram todas as 10.624 cifras do supercomputador Aurora, uma máquina anunciada em 2015 com uma história particularmente acidentada. O sistema promete oferecer o mais alto desempenho de computação teórica em 2 FP64 ExaFLOPS usando uma combinação de dezenas de milhares de CPUs Xeon Max ‘Sapphire Rapids’ com memória HBM2E integrada e uma GPU Max ‘Ponte Vecchio’ para o data center. O sistema ficará online ainda este ano.

“Aurora é a primeira implantação de GPU da série Max da Intel, o maior sistema baseado em CPU Xeon Max e o maior cluster de GPU do mundo”, disse Jeff McPhee, vice-presidente corporativo da Intel e gerente geral do Super Compute Group.

O supercomputador Aurora parece impressionante, mesmo pelos números. O dispositivo é alimentado por 21.248 processadores de uso geral com mais de 1,1 milhão de núcleos para cargas de trabalho que exigem potência de CPU tradicional e 63.744 GPUs de computação que atendem a cargas de trabalho de IA e HPC. Em termos de memória, o Aurora tem 1,36 petabytes de memória HBM2E integrada e 19,9 petabytes de memória DDR5 usada pelas CPUs, além dos 8,16 petabytes de HBM2E mantidos pelas GPUs Ponte Vecchi.

O Aurora usa 166 racks com 66 lâminas cada. Ele se estende por oito fileiras e ocupa uma área equivalente a duas quadras de basquete. Enquanto isso, o subsistema de armazenamento Aurora, que usa 1.024 nós de armazenamento totalmente flash que fornecem 220 TB de armazenamento e uma largura de banda total de 31 TB/s, não conta. Atualmente, o Argonne National Laboratory não divulga números oficiais de consumo de energia para o Aurora ou seu subsistema de armazenamento.

READ  O Microsoft Teams armazena códigos de autenticação de texto simples e eles não serão depurados rapidamente

O supercomputador, que será usado para uma variedade de cargas de trabalho, de simulações de fusão nuclear a previsões e de aerodinâmica a pesquisa médica, usa a arquitetura de supercomputador Shasta da HPE com conexões Slingshot. Enquanto isso, antes que o sistema passe nos testes de aceitação da ANL, ele será usado para modelos de IA generativos científicos em larga escala.

Enquanto trabalhamos nos testes de aceitação, usaremos o Aurora para treinar alguns modelos de IA geradora de código aberto em grande escala para a ciência”, disse Rick Stevens, diretor associado de laboratório do Argonne National Laboratory. “Com mais de 60.000 GPUs Intel Max, um sistema de I/O muito rápido e um enorme sistema de armazenamento em estado sólido completo, o Aurora é o ambiente perfeito para treinar esses modelos.

Mesmo com os blades Aurora instalados, o supercomputador ainda precisa passar por uma série de testes de aceitação, que é um procedimento comum para supercomputadores. Depois de digitalizado com sucesso e colocado on-line no final do ano, espera-se que atinja um desempenho teórico superior a 2 ExaFLOPS (dois bilhões de operações de ponto flutuante por segundo). Com desempenho fenomenal, espera-se garantir a primeira posição na lista Top500.

A instalação do supercomputador Aurora marca vários marcos: é o primeiro supercomputador da indústria com desempenho acima de 2 ExaFLOPS e o primeiro dispositivo da classe ExaFLOPS baseado em Intel. Por fim, marca a conclusão da saga Aurora, que começou há oito anos, quando a jornada do supercomputador passou por alguns percalços.

Originalmente revelado em 2015, o Aurora foi inicialmente planejado para ser alimentado por coprocessadores Intel Xeon Phi e deveria entregar aproximadamente 180 PetaFLOPS em 2018. No entanto, a Intel decidiu abandonar o Xeon Phi em favor de módulos de computação. precisa renegociar o acordo com o Argonne National Laboratory para fornecer o sistema ExaFLOPS até 2021.

READ  Google Bard é banido por todos os países da UE

A entrega do sistema foi atrasada por complicações com os ladrilhos de computação Ponte Vecchio devido ao atraso do nó de produção de 7nm da Intel (agora conhecido como Intel 4) e a necessidade de redesenhar os ladrilhos para a tecnologia de processo N5 (classe de 5nm) da TSMC. A Intel finalmente apresentou seus produtos de centro de dados GPU Max no final do ano passado e já despachou mais de 60.000 dessas GPUs para a ANL.