CCAD UX: Experiencia como usuario del CCAD

Finalmente después de 5 años de desarrollo pudimos enviar a una revista nuestro trabajo titulado: «Guess the cheese flavour by the size of its holes: A cosmological test using the abundance of Popcorn voids«. El 13 de Diciembre del 2022 al mismo tiempo que el árbitro pitaba el comienzo del partido entre Argentina y Croacia, nosotros estábamos enviando el artículo a arxiv.org (link al articulo), buscando colarnos en los primeros lugares del listado de preprints que este sitio publica día a día.

Nuestro objetivo: desarrollar un software (link al repositorio open source) que permitiera medir en simulaciones cosmológicas la forma y el volumen de los grandes intersticios en la estructura a gran escala del universo, los llamados vacíos cósmicos. Estas regiones con densidades de materia hasta un 90% menores que la media universal se expanden a una tasa mucho mayor que el resto del cosmos y resultan por diversas razones laboratorios ideales para analizar el contenido de energía y materia oscura del Universo.

Las zonas oscuras representan las regiones vacías de materia en esta visualización de una simulación cosmológica, las regiones brillantes se corresponden con los halos de materia oscura.

En el título de nuestro trabajo evocamos la imagen de un queso con agujeros: así como estando en la cola de la fiambrería uno observa un pedazo de queso gruyere o pategrás y ya puede saborearlo con los ojos, nuestra intención era desarrollar un test cosmológico que permitiera medir los valores de los parámetros cosmológicos mediante el estudio de la abundancia de vacíos según su tamaño. Las bases teóricas y prácticas de este tipo de test ya se venían desarrollando en diversos grupos en el mundo, y fueron la base de la tesis doctoral de Carlos Correa en FaMAF (link ads a la tesis).

Visualización de un vacío tipo Popcorn (click para ver la animación)

Cuando comenzamos a trabajar en el problema, hallamos una manera de definir a estos vacíos como la unión de multiples esferas, lo que facilitaba el cálculo de una cantidad importante para la teoría de formación de estas regiones (la densidad integrada en el volumen). No obstante nos encontrarnos con que el cálculo numérico de volúmenes de uniones de varias esferas  mediante Métodos de Montecarlo era sumamente prohibitivo (conocíamos solo fórmulas analíticas de uniones de hasta 3 esferas). Debíamos repetir este cálculo miles de veces para cada una de las decenas de miles de regiones vacías que se encuentran en un volumen cosmológico razonable, en un algoritmo recursivo. Debido a la cantidad de memoria requerida un enfoque basado en GPUs no era muy viable o al menos dado nuestro nivel de conocimiento (nuestras primeras armas en GPUs las habiamos adquirido en una Escuela organizada por el CCAD). Aquí es cuando el pertenecer a una comunidad científica diversa como la del CCAD nos da la primera ayuda: luego de haber sido expuestos durante varias reuniones de usuarios a los métodos desarrollados y utilizados en la comunidad de Ciencias Químicas se nos ocurrió preguntar y nos enteramos que el problema del cálculo de volúmenes de esferas ya se había resuelto en esta ciencia de manera óptima. El cálculo del volumen de macromoléculas en solventes, algo común para ellos, nos daba la pieza que nos faltaba para destrabar nuestro trabajo.

Aún así, luego de desarrollar un software robusto (o al menos eso pensamos) que nos daba resultados correctos científicamente, se nos dificultaba por limitaciones de hardware validar nuestros métodos en simulaciones cosmológicas medianamente competitivas. Eulogia y Mulatona habían sido claves en nuestro trabajo hasta el momento pero seguían siendo insuficientes y el analisis de simulaciones grandes era como remar en dulce de leche. Aquí es cuando el CCAD vuelve a ser determinante: la llegada de Serafín lo cambia todo. Aún no conseguimos explicarnos cómo, pero Serafín utilizando una cantidad equivalente de cores a la que usábamos en Mulatona nos daba un factor entre 20x y 30x en velocidad, permitiéndonos plantear por primera vez un estudio en una simulación suficientemente grande y con estadística adecuada como para plantear un test cosmológico.

Finalmente, en el último tramo de nuestro trabajo, cuando empezábamos a recibir indirectas de nuestros colegas usuarios, preguntando que estábamos haciendo y que podía necesitar tanto cómputo, llamamos la atención de Carlos Bederián, legendario administrador de los equipos del CCAD y autoridad en HPC del país, lo cual nos puso algo nerviosos. Charly, con su ojo clínico se dio cuenta de problemas en la performance de nuestro código, de los desbalances de carga que este tenía y de cómo a veces varios hilos, o incluso nodos enteros quedaban a la espera de que algún core terminara el trabajo que venía realizando. Gracias al trabajo de Charly el código aceleró aún más, entre 6 y 7 veces más rápido que antes, lo cual facilitaba enormemente la tarea: una corrida de más de un día pasaba a correr en el transcurso de una mañana. Esto permitió realizar muchas más corridas y ajustar los parámetros adecuados en el programa y fue determinante para poder redactar nuestro artículo.

Aún estamos a la espera del primer reporte del referee, y esperemos tener una respuesta positiva, no obstante a ello, no quería demorarme en escribir estas líneas en agradecimiento al CCAD. Este centro es más que un lugar que gestiona los equipos de cómputo de la universidad, es una comunidad que está abierta a cualquier científico del país y está pensada para facilitar la tarea de aquellos que investigan, buscando mejorar la ciencia que se realiza en Argentina. Es para mi un privilegio ser usuario del CCAD.

 

por Dante Paz, Instituto de Astronomía Teórica y Experimental, Observatorio Astronómico de la UNC.