El pasado 15 de enero, se inauguró en el NLHPC de la Universidad de Chile el cluster Guacolda (2019) que se suma a Leftraru (2014), con una inversión cercana a 630.000 USD.
Guacolda es una mezcla de tres tipos de unidades.
- 12 unidades densas de CPU DELL PowerEdge C6420: 2U, 4N, 8P, con procesadores de Intel Skylake Gold 6152 de 22 núcleos y 192 GiB de RAM por nodo de 2 procesadores.
- 2 unidades GPU DELL PowerEdge R740: 2U, 1N, 2P con el mismo procesador y memorias, agregando 2 GPU NVIDIA Tesla V100 PCIe.
- 9 fatnodes DELL PowerEdge R640: 1U, 1N, 2P con el mismo procesador y 768 GB de memoria RAM por nodo de 2 procesadores.
La conexión es infiniband FDR de 56 Gbps y tiene 312 TiB de almacenamiento Lustre a través de un equipo DDN EXAScaler.
Respecto al cómputo puro, los 37U de espacio en rack contienen 118 pastillas Intel Gold 6152 que totalizan 2596 núcleos Skylake. Teniendo en cuenta la documentación «Intel ® Xeon ® Processor Scalable Family, Specification Update, November 2019«, se indica que para los 22 núcleos funcionando con AVX-512 la frecuencia máxima es de 2.0 GHz con una frecuencia base de 1.4 GHz. Suponiendo condiciones inmejorables de disipación de calor y poca corriente de fuga, la Rpeak por pastilla es de 22*4*(512/64)*2.0GHz = 1408 GFLOPS en frecuencia máxima y 22*4*(512/64)*1.4 GHz = 985.6 GFLOPS en base frequency. El conjunto de 118 processor SKUs erogan un Rpeak de 166 TFLOPS a máxima frecuencia y como mínimo tiene 116 TFLOPS. Con una eficiencia aproximada de 0.94 en HPL para estos procesadores, el Rmax está en un rango de 109 a 156 TFLOPS.
Teniendo en cuenta las 4 Tesla V100 que tienen un Rpeak de 7 TFLOPS y Rmax de 5 TFLOPS, el conjunto total debería erogar un máximo de 176 TFLOPS Rmax.
Ginés Guerrero, Director Ejecutivo del NLHPC, gentilmente nos facilitó el HPL.dat
que arrojó 111 TFLOPS efectivos de Rmax de CPU pura. También nos facilitó una muy buena galería de fotos.