Cumulus-2: o novo sistema HPC ao serviço da investigação climática

Foi planeado e produzido num par de anos para o Oak Ridge National Laboratory, nos Estados Unidos da América. Mais pequeno e poderoso, está pronto a servir a comunidade científica na recolha e disponibilização de dados e na otimização de simulações de modelos atmosféricos.

O Cumulus-2 começou a ser pensado em 2020 pelo Oak Ridge National Laboratory (ORNL), que também acolhe o Frontier, o atual supercomputador mais rápido do mundo. Dois anos mais tarde, já está em funcionamento.

Este novo sistema foi lançado pelo departamento de energia (DOE), em Abril, com o propósito de apoiar a investigação climática, nomeadamente na recolha, divulgação e disponibilização de dados à comunidade científica.

Trata-se de um cluster HPC, desenhado para a unidade de Medição da Radiação Atmosférica (ARM) do departamento de energia (DOE), cuja missão é, desde 1986, criar uma série de ferramentas que gravem dados atmosféricos, para melhor estudar o clima do planeta.

Com 16 384 cores de processamento, o Cumulus-2 tornou-se mais poderoso que qualquer outro sistema do ORNL previamente construído para este efeito. Ultrapassa os dois sistemas anteriores, compostos por 1 080 e 4 032 cores, respetivamente. Na prática, terá quatro vezes o poder do seu antecessor Cumulus-1.

“Este novo cluster vai acelerar de forma significativa as velocidades de processamento para simulações e aumentar as capacidades de interpretação do armazenamento de dados do ARM” – Giri Prakash, diretor do ARM Data Center no ORNL

Mais pequeno e com arquitetura bastante diferente, o sistema consiste em 32 chassis, sendo que 28 deles estão equipados individualmente com quatro nós. Cada nó tem 7713 CPUs e 256 GB de memória. Os restantes chassis apresentam o mesmo número de nós mas são equipados com 512 GB de memória.

Este é um importante passo para garantir ao DOE a infraestrutura HPC necessária para impulsionar o trabalho que é desenvolvido. Giri Prakash, diretor do data-center do ARM, lida com mais de 450 instrumentos que recolhem fenómenos atmosféricos e garante que, diariamente, milhares de dados chegam às instalações para a sua equipa recolher, processar e arquivar, estando, por norma, disponíveis ao utilizador passadas 24 horas. “Este novo cluster vai acelerar de forma significativa as velocidades de processamento para simulações e aumentar as capacidades de interpretação do armazenamento de dados do ARM”, adianta.

De forma concreta, a chegada do Cumulus-2 traduz melhores simulações de modelos atmosféricos, armazenamento de dados em petascale, análise de quantidades massivas de dados e machine-learning para a investigação das ciências climáticas e atmosféricas.

O seu sistema de ficheiros paralelo de quatro petabytes para o armazenamento de dados complementa o sistema, de forma a garantir que este aumento da potência computacional continue a servir o propósito de chegar “a um modelo robusto de previsões dos sistemas climáticos e ambientais da Terra”, bem como o de alcançar soluções sustentáveis para os principais desafios nesta matéria.

À direita, Giri Prakash, diretor do data center do ARM, do DOE e Ryan Prout, engenheiro de análise de dados HPC, NCCS, com o Cumulus-2. (Carlos Jones)