CCAD Q&A ¿Cómo hago para …?

Tuvo lugar el primer encuentro Q&A de usurios/as con el objetivo de obtener mayor provecho de los recursos que brinda el Centro de Computación de Alto Desempeño de la UNC

El pasado 16 de mayo se realizó un encuentro virtual donde power users del CCAD ayudaron a resolver dudas de otros/as usuarios/as, de la más diversa índole, para poder sacar mejor provecho de nuestros recursos. A través del intercambio de preguntas y respuestas, la comunidad del CCAD -que suma un promedio de tres usurios/as por semana- continua fortaleciéndose y acrecentando sus capacidades.
Los/as power users que generosamente estuvieron a cargo del Q&A fueron: Ayelen Crespi del CETMIC (UNLP-CIC-CONICET), Sergio Rodríguez de la Facultad de Agronomía y Agroindustrias (UNSE), Ignacio José Chevallier-Boutell de FAMAF (UNC) e IFEG (CONICET-UNC) e Ignacio Scarinci de FAMAF (UNC), IFEG (CONICET-UNC) y LIIFAMIR.
Asistieron al encuentro virtual alrededor de 50 personas que pudieron evacuar dudas de todo tipo, siguiendo la consigna de la convocatoria: “Menú abierto, no hay nada que no se pueda preguntar, desde ¿Cómo me conecto? hasta ¿Cómo corro un container de Singularity para un workload de ML?”

Serafín suma un Nodo de Cómputo Interactivo

Serafín suma un nuevo nodo de Cómputo Interactivo. Este permitirá a las y los usuarios del CCAD, con la misma cuenta, realizar limpieza, análisis y visualización de datos, asi como cómputo liviano, utilizando las tecnologías de environments y Notebooks.

El rack central de Serafín tiene un nuevo nodo con características peculiares:

  • CPU: AMD Ryzen Threadripper PRO 3975WX de 32 núcleos Zen2, 280W de potencia máxima y 120 lanes PCIe 4.0 libres.
  • 8 canales a memoria RAM, conteniendo módulos de 16 GiB DDR4-3200, 128 GiB en total.
  • Placa Infiniband FDR (56 Gbps) NVIDIA Mellanox ConnectX-3.

Esta potente workstation está conectada al sistema de archivos de Serafín y permite realizar tareas interactivas relacionadas con limpieza, administración, análisis, inferencia, visualización y cómputo liviano.

Con este nodo completamos el flujo de trabajo que permite, por un lado, realizar simulaciones a gran escala en Serafín y, luego, analizarlas sin tener que traer a la computadora local los enormes conjuntos de datos que se generan.
Gracias a que está conectado directamente al BeeGFS de Serafín por Infiniband, se obtiene un ancho de banda de 1.6 GiB/s para leer información y muchos núcleos Zen2 para procesarla. La capacidad de ingestión y procesamiento de datos del nuevo nodo es un orden de magnitud superior a una computadora personal.

Este nodo de cómputo interactivo viene a cubrir una demanda creciente entre las y los usuarios del CCAD que además de cómputo pesado al estilo del HPC tradicional, también necesitan de cómputo interactivo para hacer su ciencia. A través de environments como MicroMamba, es posible desplegar la potencia de los Jupyter Notebooks, utilizando lenguajes de backend como Python, R o Julia. También admite el uso de herramientas modernas de desarrollo como VSCode y solo se requiere tener un login en el CCAD.

Próximamente anunciaremos actividades de capacitación para sacar provecho a esta nueva capacidad del CCAD.

Nicolás Wolovick
Director del CCAD-UNC
(para Juan)

Todo el poder de AMD CDNA2 en el CCAD

AMD Latinoamérica reconoce el liderazgo y la capacidad técnica del CCAD donando dos aceleradoras Instinct MI210, con tecnología CDNA2, la misma que usa Frontier, la supercomputadora #1 del mundo.

La primera de las dos aceleradoras MI210 llegó al CCAD. Este monstruo PCIe 4.0 16x consume 300W y tiene unas especificaciones a la altura de su consumo:

  • 64 GiB de DRAM HBM2e con un ancho de banda pico de 1.63 TiB/s, es decir tarda 39ms en leer toda su memoria.
  • 45.3 TFLOPS tanto en precisión simple como en precisión doble.
  • Soporte para un conector superior Infinity Fabric de hasta 4 GPUs para máxima velocidad de comunicación inter-placa.

Esta placa es comparable con una NVIDIA A100: mismo TDP, misma tecnología de memoria, mismo bus de conexión con la CPU. La única diferencia sustancial es que la MI210 dobla a la A100 en desempeño de punto flotante de doble precisión.

El ecosistema ROCm permite aprovechar este recurso con compiladores, bibliotecas, debuggers y herramientas de medición de desempeño.

Esta placa estará en periodo de pruebas y cuando llegue la segunda, ambas se integrarán a MendietaF2 para ofrecer mayor diversidad en la potencia de cómputo. En particular se podrán correr workloads de ML y MD que necesiten de mayor cantidad de RAM que los 24 GiB que ofrecen las A30.

Agradecemos a Juan Moscoso y a Hernán Sánchez que a través de Multitech, realizaron esta donación tan valiosa para el CCAD.

Podés ver un video en el que Nicolás Wolovick, director del CCAD, cuenta de qué se trata en Facebook, Instagram o Twitter

El CCAD participará en un proyecto que busca crear un servicio colaborativo de cómputo para América Latina y África

A través del financiamiento otorgado por la Chan Zuckerberg Initiative (CZI), un consorcio conformado por diversas organizaciones del mundo, busca fundar un servicio colaborativo e interactivo que facilite el acceso a la infraestructura en la nube para las investigaciones en ciencias biomédicas de la región.


Al igual que muchas otras disciplinas, las ciencias biomédicas están experimentando una rápida expansión en relación al alcance y volumen de los datos que deben utilizarse para responder a los diversos problemas de investigación que se presentan. Al mismo tiempo, se hace cada vez más necesaria -y fructífera- la colaboración entre los grupos de investigación, más allá de los límites institucionales y geográficos. La capacidad de compartir información permite replicar, completar y modificar los diversos ensayos necesarios para el avance del conocimiento, redundando en una administración más racional de los recursos. Además, por supuesto, favorece el debate y el intercambio de ideas.
Con este objetivo, desde hace ya algunos años, se vienen desarrollando una multiplicidad de OSCS (Open Science Cloud Services o, en castellano, Servicios de Ciencia Abierta en la Nube) que, a diferencia de propuestas similares de corte comercial, se basa en los principios de la ciencia abierta y de los desarrollos open-source.

Este tipo de iniciativas son especialmente relevantes para el desarrollo de las investigaciones que se llevan a cabo desde regiones periféricas que, sin embargo, como es de esperarse, también tienen menores posibilidades de acceder a la infraestructura necesaria para participar en la gran comunidad de intercambio en la nube. Justamente, ese es el punto del programa de financiamiento lanzado por CZI: “La representación de diferentes culturas y experiencias de vida llevan a mejores resultados de investigación para la comunidad científica. A pesar de la creciente evidencia de que una participación representativa mejora la calidad científica, el campo permanece dominado principalmente por participantes de sectores demográficos relativamente estrechos, y existen aún barreras significativas para las personas que investigan fuera de Norte América y Europa. En el mismo sentido, los esfuerzos para reclutar, sostener y construir el liderazgo de colaboradores científicos, a menudo no incluyen a investigadores de comunidades subrepresentadas.
Debido a que la ciencia abierta y los abordajes computacionales relacionados tienen un alcance inherentemente global y se benefician de una amplia representación geográfica y demográfica, el programa de Ciencia Abierta de CZI busca potenciar las habilidades de las poblaciones subrepresentadas para participar y liderar las investigaciones computacionales en biología, a través del financiamiento de iniciativas que desarrollen herramientas, plataformas y capacidades aplicables a investigaciones biomédicas.” (Ver más)
Así fue como se creó un programa tendiente a favorecer el desarrollo de un servicio colaborativo e interactivo que facilite el acceso a la infraestructura en la nube para las investigaciones en ciencias biomédicas de América Latina y África. La iniciativa es llevada adelante por : 2i2c, The Carpentries, The Center for Scientific Collaboration and Community Engagement (CSCCE), Invest in Open Infrastructure (IOI), MetaDocencia, and Open Life Science (OLS). “Nosotros vamos a estar trabajando con la gente de 2i2c, para hacer el despliegue de su infraestructura para LatAm y África, en el CCAD”, expresó Nicolás Wolovick, director del Centro de Computación de Alto Desempeño de la UNC.

2i2c es una organización sin fines de lucro que desarrolla y maneja OSCS para computación interactiva, tales como Jupyter Project y el ecosistema Scientific Python a partir de un modelo de servicios que sigue los principios de Ciencia Abierta y brinda a su comunidad el derecho de replicar su infraestructura. “Esta cooperación es muy importante porque marca una nueva pata que tiene el CCAD: brindar servicios de Computación Interactiva a través de Jupyter Notebooks, además de alojar los servidores que formarán parte de esta gran nube colaborativa”, concluyó Wolovick

* Crédito de las fotos: CZI