Con un puñado de usuarios, se llenó Serafín

A poco de abrirse Serafín en beta-test, un puñado de usuarios llenó el cluster de trabajos, muchos de ellos de una cantidad grande de nodos. Lo que esperábamos se cumplió. Aunque Serafín tiene 3x más capacidad que todos nuestros clusters anteriores, se necesita más, mucho más. Mostramos quienes fueron, que hacen y que sensación tuvieron.

El jueves pasado el CPA Profesional Principal de CONICET, Lic. Carlos S. Bederián, pudo compilar de manera correcta OpenMPI en Serafín para que trabaje con la red Infiniband HDR de 100 Gbps y así convertir un conjunto de servidores potentes en una supercomputadora.

La mañana del viernes, el cluster mostraba este panorama.

Los 60 nodos estaban trabajando a pleno. Martín Zoloff (FCQ), Diego Masone (IHEM-CONICET), Rafael A. Jara Toro (FCQ), Fabio Negreiros Ribeiro (FCQ), Mario Agustín Sgró (OAC, IATE-CONICET) trabajando con Federico A. Stasyszyn y Dante Paz del mismo instituto.

No solo tuvimos 60 nodos a pleno y que aun siguen así, sino que además son jobs relativamente grandes. Martín Zoloff con uno de 24 nodos, Mario Agustín Sgró con uno de 8 nodos y el resto entre 3 y 4 nodos. La minoría son los de un solo nodo. Eso es una gran noticia, porque gran parte del costo de Serafín está en su red de alta velocidad que permite utilizar varios nodos como una computadora a través de MPI.

Esta no es una situación nueva, en marzo de 2018 cuando abrimos Eulogia a las y los usuarios de Mendieta, se llenó en menos de un día.

Los beta-testers resultan cruciales para comprobar tanto los sistemas de refrigeración, como para certificar que todos los sistemas de redes, cómputo y almacenamiento, tengan los parámetros e infraestructura óptima para la etapa de producción, asi los usuarios finales tienen un entorno de trabajo de alta calidad.

Hicimos una breve entrevista a algunos de los beta-testers de Serafín.

Diego Masone

CCAD: ¿Nos podés contar cuál es tu campo de estudio?
DM: Me dedico a la biología computacional, que abarca modelos matemáticos y técnicas de simulación numéricas para el estudio de sistemas biológicos, como las proteínas humanas y las membranas celulares.

CCAD: ¿Desde hace cuánto usás HPC para hacer ciencia?
DM: ¡Desde que era joven! Empecé con HPC al inicio del doctorado en el Barcelona Supercomputing Center.

CCAD: ¿Qué paquetes de software usás?
DM: GROMACS y PLUMED abarcan más del 90% de lo que hago.

CCAD: ¿Contanos cuál fue la primera impresión al hacer corridas en Serafín con toda su funcionalidad al 100%?
DM: ¡De lujo! ¡Me estoy frotando las manos! Ahora sí que va a aumentar la generación de conocimiento.

CCAD: ¿Qué tenés planeado hacer con el nuevo poder de cómputo?
DM: Vamos a estudiar el poro de fusión. Esta es la maquinaria que tiene la naturaleza para transportar moléculas entre organelas, dentro de células como las neuronas o entre espermatozoides y ovocitos. Las implicancias son importantísimas para el avance de la biomedicina en el estudio de neuropatologías y de la reproducción humana.

Martin E. Zoloff Michoff

CCAD: ¿Nos podés contar cuál es tu campo de estudio?
MZ: Estudio las propiedades de materiales activos para baterías de litio de la próxima generación a partir de cálculos de estructura electrónica de primeros principios.

CCAD: ¿Desde hace cuánto usás HPC para hacer ciencia?
MZ: HPC «en serio» hace aproximadamente 10 años, desde que entró en servicio «Cristina«.

CCAD: ¿Qué paquetes de software usás?
MZ: Principalmente Quantum Espresso, pero también Siesta, AIMD y Gaussian, todas diferentes implementaciones de la Teoría del Funcional de la Densidad Electrónica (DFT).

CCAD: ¿Contanos cuál fue la primera impresión al hacer corridas en Serafín con toda su funcionalidad al 100%?
MZ: Qué es entre 2 a 3 veces más rápido que los clusters que estaba usando hasta ahora.

CCAD: ¿Qué tenés planeado hacer con el nuevo poder de cómputo?
MZ: Dada la posibilidad de escalar a muchos más cores, tengo pensado modelar sistemas con muchos más átomos. Para los sistemas que me interesan es de crucial importancia poder incluir al solvente de manera explícita, por ejemplo, lo cual es muy costoso desde el punto de vista computacional.

Federico A. Stasyszyn

CCAD: ¿Nos podés contar cuál es tu campo de estudio?
FS: Estudio los efectos y evolución de campos magnéticos en astrofísica. En particular en cosmología.

CCAD: ¿Desde hace cuánto usás HPC para hacer ciencia?
FS: Desde mi doctorado. Justamente mi trabajo de doctorado fue la implementación de las ecuaciones de la magnetohidrodinámica en códigos cosmológicos.

CCAD: ¿Qué paquetes de software usás?
FS: La mayoría son códigos propios o desarrollados entre varios grupos internacionales, pero específicos del área (SWIFT, Gizmo, Enzo, GADGET-4, etc). En cuanto a bibliotecas comunes, son clásicas como FFTW, GSL, HDF5, METIS, etc.

CCAD: ¿Contanos cuál fue la primera impresión al hacer corridas en Serafín con toda su funcionalidad al 100%?
FS: Que actualmente estamos testeando Serafín con simulaciones que antes eran de producción. Como que se corrió la vara, aunque aún no la pude usar 100%.

CCAD: ¿Qué tenés planeado hacer con el nuevo poder de cómputo?
FS: Hay grupos de simulaciones que no pudimos completar anteriormente por falta de tiempo de computo (ya usábamos la mitad de los clusters). Pensamos en añadirles procesos astrofísicos para que sean más realistas y esperamos llegar a tener mejor estadística que con las que ya trabajamos. Asimismo, pensamos en diseñar grupos de simulaciones nuevas pensando en las resoluciones y objetos que estudian y necesitan los grupos del trabajo del OAC-IATE.

Fabio Negreiros Ribeiro

CCAD: ¿Nos podés contar cuál es tu campo de estudio?
FNR: Simulación computacional atomística de nanomateriales.

CCAD: ¿Desde hace cuánto usás HPC para hacer ciencia?
FNR: 15 años.

CCAD: ¿Qué paquetes de software usás?
FNR: Quantum Espresso, CP2K, Berkeley-GW.

CCAD: ¿Contanos cuál fue la primera impresión al hacer corridas en Serafín con toda su funcionalidad al 100%?
FNR: Muy rápido y dinámico. Nada de negativo a declarar.

CCAD: ¿Qué tenés planeado hacer con el nuevo poder de cómputo?
FNR: El nuevo cluster permitirá estudiar otras propiedades de nanomateriales, como la estabilidad estructural y las propiedades ópticas, que no podían ser analizadas en los otros HPCs. Esto permitirá una caracterización mas completa de los materiales, y por lo tanto será más fácil hacer un puente con la aplicación o conexión con la industria.