CCAD Q&A ¿Cómo hago para …?

Tuvo lugar el primer encuentro Q&A de usurios/as con el objetivo de obtener mayor provecho de los recursos que brinda el Centro de Computación de Alto Desempeño de la UNC

El pasado 16 de mayo se realizó un encuentro virtual donde power users del CCAD ayudaron a resolver dudas de otros/as usuarios/as, de la más diversa índole, para poder sacar mejor provecho de nuestros recursos. A través del intercambio de preguntas y respuestas, la comunidad del CCAD -que suma un promedio de tres usurios/as por semana- continua fortaleciéndose y acrecentando sus capacidades.
Los/as power users que generosamente estuvieron a cargo del Q&A fueron: Ayelen Crespi del CETMIC (UNLP-CIC-CONICET), Sergio Rodríguez de la Facultad de Agronomía y Agroindustrias (UNSE), Ignacio José Chevallier-Boutell de FAMAF (UNC) e IFEG (CONICET-UNC) e Ignacio Scarinci de FAMAF (UNC), IFEG (CONICET-UNC) y LIIFAMIR.
Asistieron al encuentro virtual alrededor de 50 personas que pudieron evacuar dudas de todo tipo, siguiendo la consigna de la convocatoria: “Menú abierto, no hay nada que no se pueda preguntar, desde ¿Cómo me conecto? hasta ¿Cómo corro un container de Singularity para un workload de ML?”

Serafín suma un Nodo de Cómputo Interactivo

Serafín suma un nuevo nodo de Cómputo Interactivo. Este permitirá a las y los usuarios del CCAD, con la misma cuenta, realizar limpieza, análisis y visualización de datos, asi como cómputo liviano, utilizando las tecnologías de environments y Notebooks.

El rack central de Serafín tiene un nuevo nodo con características peculiares:

  • CPU: AMD Ryzen Threadripper PRO 3975WX de 32 núcleos Zen2, 280W de potencia máxima y 120 lanes PCIe 4.0 libres.
  • 8 canales a memoria RAM, conteniendo módulos de 16 GiB DDR4-3200, 128 GiB en total.
  • Placa Infiniband FDR (56 Gbps) NVIDIA Mellanox ConnectX-3.

Esta potente workstation está conectada al sistema de archivos de Serafín y permite realizar tareas interactivas relacionadas con limpieza, administración, análisis, inferencia, visualización y cómputo liviano.

Con este nodo completamos el flujo de trabajo que permite, por un lado, realizar simulaciones a gran escala en Serafín y, luego, analizarlas sin tener que traer a la computadora local los enormes conjuntos de datos que se generan.
Gracias a que está conectado directamente al BeeGFS de Serafín por Infiniband, se obtiene un ancho de banda de 1.6 GiB/s para leer información y muchos núcleos Zen2 para procesarla. La capacidad de ingestión y procesamiento de datos del nuevo nodo es un orden de magnitud superior a una computadora personal.

Este nodo de cómputo interactivo viene a cubrir una demanda creciente entre las y los usuarios del CCAD que además de cómputo pesado al estilo del HPC tradicional, también necesitan de cómputo interactivo para hacer su ciencia. A través de environments como MicroMamba, es posible desplegar la potencia de los Jupyter Notebooks, utilizando lenguajes de backend como Python, R o Julia. También admite el uso de herramientas modernas de desarrollo como VSCode y solo se requiere tener un login en el CCAD.

Próximamente anunciaremos actividades de capacitación para sacar provecho a esta nueva capacidad del CCAD.

Nicolás Wolovick
Director del CCAD-UNC
(para Juan)

Todo el poder de AMD CDNA2 en el CCAD

AMD Latinoamérica reconoce el liderazgo y la capacidad técnica del CCAD donando dos aceleradoras Instinct MI210, con tecnología CDNA2, la misma que usa Frontier, la supercomputadora #1 del mundo.

La primera de las dos aceleradoras MI210 llegó al CCAD. Este monstruo PCIe 4.0 16x consume 300W y tiene unas especificaciones a la altura de su consumo:

  • 64 GiB de DRAM HBM2e con un ancho de banda pico de 1.63 TiB/s, es decir tarda 39ms en leer toda su memoria.
  • 45.3 TFLOPS tanto en precisión simple como en precisión doble.
  • Soporte para un conector superior Infinity Fabric de hasta 4 GPUs para máxima velocidad de comunicación inter-placa.

Esta placa es comparable con una NVIDIA A100: mismo TDP, misma tecnología de memoria, mismo bus de conexión con la CPU. La única diferencia sustancial es que la MI210 dobla a la A100 en desempeño de punto flotante de doble precisión.

El ecosistema ROCm permite aprovechar este recurso con compiladores, bibliotecas, debuggers y herramientas de medición de desempeño.

Esta placa estará en periodo de pruebas y cuando llegue la segunda, ambas se integrarán a MendietaF2 para ofrecer mayor diversidad en la potencia de cómputo. En particular se podrán correr workloads de ML y MD que necesiten de mayor cantidad de RAM que los 24 GiB que ofrecen las A30.

Agradecemos a Juan Moscoso y a Hernán Sánchez que a través de Multitech, realizaron esta donación tan valiosa para el CCAD.

Podés ver un video en el que Nicolás Wolovick, director del CCAD, cuenta de qué se trata en Facebook, Instagram o Twitter

El CCAD participará en un proyecto que busca crear un servicio colaborativo de cómputo para América Latina y África

A través del financiamiento otorgado por la Chan Zuckerberg Initiative (CZI), un consorcio conformado por diversas organizaciones del mundo, busca fundar un servicio colaborativo e interactivo que facilite el acceso a la infraestructura en la nube para las investigaciones en ciencias biomédicas de la región.


Al igual que muchas otras disciplinas, las ciencias biomédicas están experimentando una rápida expansión en relación al alcance y volumen de los datos que deben utilizarse para responder a los diversos problemas de investigación que se presentan. Al mismo tiempo, se hace cada vez más necesaria -y fructífera- la colaboración entre los grupos de investigación, más allá de los límites institucionales y geográficos. La capacidad de compartir información permite replicar, completar y modificar los diversos ensayos necesarios para el avance del conocimiento, redundando en una administración más racional de los recursos. Además, por supuesto, favorece el debate y el intercambio de ideas.
Con este objetivo, desde hace ya algunos años, se vienen desarrollando una multiplicidad de OSCS (Open Science Cloud Services o, en castellano, Servicios de Ciencia Abierta en la Nube) que, a diferencia de propuestas similares de corte comercial, se basa en los principios de la ciencia abierta y de los desarrollos open-source.

Este tipo de iniciativas son especialmente relevantes para el desarrollo de las investigaciones que se llevan a cabo desde regiones periféricas que, sin embargo, como es de esperarse, también tienen menores posibilidades de acceder a la infraestructura necesaria para participar en la gran comunidad de intercambio en la nube. Justamente, ese es el punto del programa de financiamiento lanzado por CZI: “La representación de diferentes culturas y experiencias de vida llevan a mejores resultados de investigación para la comunidad científica. A pesar de la creciente evidencia de que una participación representativa mejora la calidad científica, el campo permanece dominado principalmente por participantes de sectores demográficos relativamente estrechos, y existen aún barreras significativas para las personas que investigan fuera de Norte América y Europa. En el mismo sentido, los esfuerzos para reclutar, sostener y construir el liderazgo de colaboradores científicos, a menudo no incluyen a investigadores de comunidades subrepresentadas.
Debido a que la ciencia abierta y los abordajes computacionales relacionados tienen un alcance inherentemente global y se benefician de una amplia representación geográfica y demográfica, el programa de Ciencia Abierta de CZI busca potenciar las habilidades de las poblaciones subrepresentadas para participar y liderar las investigaciones computacionales en biología, a través del financiamiento de iniciativas que desarrollen herramientas, plataformas y capacidades aplicables a investigaciones biomédicas.” (Ver más)
Así fue como se creó un programa tendiente a favorecer el desarrollo de un servicio colaborativo e interactivo que facilite el acceso a la infraestructura en la nube para las investigaciones en ciencias biomédicas de América Latina y África. La iniciativa es llevada adelante por : 2i2c, The Carpentries, The Center for Scientific Collaboration and Community Engagement (CSCCE), Invest in Open Infrastructure (IOI), MetaDocencia, and Open Life Science (OLS). “Nosotros vamos a estar trabajando con la gente de 2i2c, para hacer el despliegue de su infraestructura para LatAm y África, en el CCAD”, expresó Nicolás Wolovick, director del Centro de Computación de Alto Desempeño de la UNC.

2i2c es una organización sin fines de lucro que desarrolla y maneja OSCS para computación interactiva, tales como Jupyter Project y el ecosistema Scientific Python a partir de un modelo de servicios que sigue los principios de Ciencia Abierta y brinda a su comunidad el derecho de replicar su infraestructura. “Esta cooperación es muy importante porque marca una nueva pata que tiene el CCAD: brindar servicios de Computación Interactiva a través de Jupyter Notebooks, además de alojar los servidores que formarán parte de esta gran nube colaborativa”, concluyó Wolovick

* Crédito de las fotos: CZI

El Centro de Computación de Alto desmpeño de la UNC firmó un convenio con el CONICET

El objetivo del acuerdo es consolidar la capacidad de super cómputo en la región.

El pasado viernes 21 de abril se culminó un largo proceso que había comenzado dos años atrás, durante la dirección de Oscar Reula, y se materializó en un convenio que busca propiciar la “Consolidación de las Capacidades de Supercómputo”, bajo la dirección de Nicolas Wolovicz. Además permitirá incluir al CCAD como lugar de trabajo para investigadores/as, Becarios/as y personal de apoyo del CONICET.

La firma tuvo lugar en el rectorado de la UNC y estuvieron presentes la presidenta del CONICET, Ana Franchi, la vicerrectora de la UNC, Mariela Marchisio, la directora y vicedirectora del Centro Científico Tecnológico (CCT) CONICET Córdoba María Angélica Perillo y Mónica Balzarini, respectivamente; el director y ex-director del CCAD Nicolás Wolovick y Oscar Reula, respectivamente; el secretario de Innovación y Vinculación Tecnológica de la UNC Santiago Palma y la gerenta de Desarrollo Científico Tecnológico del CONICET Liliana Sacco.

Durante la firma, la presidenta del CONICET Ana Franchi, expresó: “Con la firma de este convenio el CONICET estará presente en el Centro de Computación de Alto Desempeño de la UNC, en donde se desempeñan en su mayoría profesionales del CONICET. Estar presentes nos permitirá crecer en la utilización de los equipos y en la formación de nuevos recursos humanos especializados”.

Wolovick expresó al respecto, “Estamos contentos de que, mediante este convenio que se venía gestando desde la dirección anterior, finalmente se formalice nuestra relación de larga data, ya que el 80% del uso del CCAD de está dado por investigadores/as del Consejo. Esto genera un capital simbólico muy interesante”.

Desde su creación en 2010, el CCAD de la UNC brinda servicios y recursos de cómputo de alto desempeño al sistema científico-tecnológico argentino. Esto no sólo reduce los costos notablemente, poniendo al alcance de muchos grupos servicios a los que no podría acceder de otra manera; sino que, además, contribuye a la conformación de un sistema tecnológico y científico soberano.

Mulatona y Eulogia reinstaladas con software nuevo

Actualizamos los clusters más viejos con el software más nuevo posible. Una segunda y última vida a Mulatona y Eulogia, que gracias a las actualizaciones mejoraron su desempeño en aplicaciones muy usadas como Quantum Espresso.

Mulatona y Eulogia son nuestros clusters más viejos. Mulatona es algo asi como modelo 2016 y Eulogia 2018. Teniendo en cuenta que los clusters empiezan a calentar más de lo que producen al cabo de 5-8 años, ambos están en el periodo final de su vida útil (EOL).

En vez de dejar que se vuelvan inoperativos por potencia de cómputo, ancho de banda a memoria y stack de software obsoleto, hicimos lo que pudimos con el capital más importante que tenemos, los recursos humanos.

En enero y febrero baja mucho la demanda computacional por las vacaciones de verano, y por eso el CPA Principal de IFEG-CONICET, Carlos Bederián, aprovechó para reinstalar de cero, primero Mulatona y luego Eulogia.

El resultado fue que Mulatona pasó a Rocky Linux release 9.1 (Blue Onyx) y eso implica un Linux kernel@5.14 y un compilador gcc@11.3.1 de base. Sobre esto y usando Spack se compiló e instaló compiladores aun más nuevos: gcc@12.2.0 intel@2021.8.0 y oneapi@2023.0.0. Mulatona, la más vieja de todas tiene el stack de sistema operativo, bibliotecas base y compiladores más nuevos de todo el CCAD. Si la Ley de Proebsting se cumple, tendremos mejoras importantes en la eficiencia del código emitido por estos compiladores.

Eulogia siempre fue/es/será un caso especial. La arquitectura KNL tiene sus bemoles, no tanto en la instalación del sistema base, sino en la elección del compilador. Intel volvió obsoleta la arquitectura Knights Landing desde agosto de 2021 para sus compiladores y GCC no emite tan buen código de máquina como Intel en KNL. Para que intel@2021 funcione se necesitaba correr en Rocky Linux release 8.7 (Green Obsidian). Aunque Bederián trabajó para que corra en Blue Onyx, no hubo caso y tuvo que volver atrás una versión. Esto implicó que Eulogia, por más que es una arquitectura dos años más joven que Mulatona, requiera de software más viejo para poder correr y más del doble de trabajo. La lección ya la conocemos: arquitecturas raras, problemas por todos lados.
De todas maneras pruebas preliminares con QE@7.1 compilado con intel@2021 muestran una mejora de entre 2x y 3x respecto a la instalación anterior.

En ambos casos se necesitaron drivers del kernel para las placas InfiniBand QDR, y aunque estas placas tienen un excelente desempeño tanto en ancho de banda como en latencia, no están soportados por ninguna distribución de Linux actual. La placa MT26428 es hardware que salió en 2010. La comunidad siempre presente, esta vez a través de El Repo, le permitió a Bederián tener drivers de las versiones de Linux kernel correspondientes para estas placas obsoletas en software, pero tremendamente útiles en sus prestaciones.

Cuando pasan estas cosas, siempre se me viene a la cabeza la viñeta que la artista Christiann Macauley publicó en su sitio Sticky Comics.

por Nicolás Wolovick, Director del CCAD-UNC

Compras de fin de año

En el CCAD no le decimos que no a nada, y a fin de año hicimos un llamado para aprovechar los restos de proyectos PICT o SeCyT-UNC.

Cerraba diciembre y ya casi sin aliento pegamos el último empujón antes de que se terminara todo. Convocamos a las usuarias y usuarios del CCAD que tuvieran algún remanente de gastos de sus proyectos para que hicieran contribuciones para el funcionamiento del Centro.

Tuvimos varios aportes:

  • Germán Soldano, FCQ-INFIQC, PICT, 5 SSD 240 GiB para booteo.
  • Federico Pont, FaMAF-IFEG, PICT, 2 SSD 240 GiB para booteo.
  • Cristian Giuppone, FaMAF-IATE, PICT, 12 Arduino nano para monitoreo de los racks.
  • Carlos Kozameh, FaMAF-IFEG, SeCyT-UNC, 2823 horas-core Eulogia.
  • Gustavo Castellano, FaMAF, SeCyT-UNC, 10000 horas-core MendietaF2.
  • Reinaldo Pis Diez, UNLP, PICT 2017-1628, 16000 horas-core MendietaF2.

Todo suma, todo sirve.

por Nicolás Wolovick, director del CCAD

Día de la mujer: por un mundo digital inclusivo

En el marco del DÍA INTERNACIONAL DE LA MUJER, desde el CCAD nos sumamos a el lema propuesto desde la ONU: “Por un mundo digital inclusivo: Innovación y tecnología para la igualdad de género

Las mujeres estuvieron muy presentes en el desarrollo de la informática y la computación, en sus primeras etapas. De hecho, es bien conocido el caso del grupo compuesto por seis matemátcas que estuvieron encargadas de programar la primera computadora electrónica de Estados Unidos, lo que produjo una verdadera revolución informática. Sin embargo, lentamente, esto empezó a modificarse y con el boom de las computadora personales la presencia masculina fue abrumadora y la brecha de género en esta área se hizo casi infranqueable.

En la actualidad, según la ONU, un 37% de las mujeres del mundo no tienen acceso a internet y son las principales víctimas de acoso informático. Además, las mujeres siguen siendo minoría en las disciplinas STEM (Ciencia, Tecnología, Ingeniería y Matemática), tanto en el mundo laboral como en el académico, y constituyen sólo el 28 por ciento de las personas graduadas en ingeniería, el 22 por ciento de quienes trabajan en inteligencia artificial y menos de un tercio de la fuerza laboral en el sector tecnológico en todo el mundo.

Esta situación limita el empoderamiento digital de las mujeres y su participación en diversas maneras de activismo por sus derechos, pero también las deja afuera de un mercado laboral más que prometedor, ya que de acuerdo a las cifras de la ONU, para 2050, el 75% de los trabajos estarán relacionados con las áreas STEM.

El caso de la Computación de Alto Desempeño (HPC por sus siglas en inglés) es difícil de evaluar, dado que no existen cifras oficiales de la cantidad de mujeres que integran el campo porque muchas veces la HPC es una herramienta para otras disciplinas más que una carrera en sí. Sin embargo, algunos indicadores, como la participación en las principales conferencias indica que sólo el 10% de lxs autores son mujeres (aún más bajo que el 20 o 30% que se encuentran en otras áreas relacionadas a la tecnología), los hombres tienen roles más visibles y son más citados. Finalmente, la representación femenina cae fuertemente en niveles de mayor experiencia. (Ver paper)

 

Causas de la brecha de género y posibles soluciones.

La ONU explica que “Los estereotipos sobre qué personas están más o menos capacitadas para las disciplinas STEM tienen un peso enorme y disuaden a las niñas de decantarse por estos campos. Las que se deciden por entrar en el mundo de la tecnología a menudo se enfrentan a un entorno abiertamente hostil, con una notable brecha salarial (un 21 por ciento) y tasas de promoción considerablemente inferiores (52 mujeres por cada 100 hombres). Casi la mitad (un 48 por ciento) afirma haber sufrido acoso en el lugar de trabajo. Y un escalofriante 22 por ciento afirma haber valorado la posibilidad de dejar el trabajo debido al trato recibido en el sector. “

A todo esto se suma que la falta de representación genera una especie de círculo vicioso que repercute negativamente en la presencia de mujeres en el ámbito de la creación, el uso y la regulación de la tecnología.

Por último, la ONU afirma que “Para que las mujeres tengan éxito en un entorno laboral cambiante, es preciso crear programas específicos de mejora y ampliación de las competencias profesionales enfocados prioritariamente en los grupos con un mayor riesgo de exclusión. Además, necesitamos regulación laboral más sólida para garantizar que la transición del mercado de trabajo mejora la posición de las mujeres, en lugar de limitarse a reproducir las desigualdades existentes. Esto incluye un salario mínimo vital, leyes contra la discriminación salarial y sistemas de protección social que resuelvan, entre otros aspectos, las discrepancias entre las cargas de trabajo doméstico y de cuidados de las mujeres y de los hombres.”

*Por Mariela López Cordero

Workshop Simular para Experimentar: el lab 2.0

El CCAD (UNC) junto al IHEM (CONICET-UNCUYO) organizan un workshop virtual y gratuito sobre supercomputación aplicada a la investigación en biología, física y química. Jueves 9 de marzo, a partir de las 10 hs.

Simular para Experimentar: el lab 2.0 es una jornada de mesas redondas y charlas acerca de la supercomputación como herramienta transversal a la biología, la física y la química. El workshop, virtual y gratuito, está orientado a personas que realicen investigaciones experimentales en estas disciplinas y que complementen sus trabajos de investigación con simulaciones numéricas o tengan la intención de hacerlo).

El encuentro consistirá de 3 mesas redondas, una por disciplina. Cada mesa comenzará con una charla de apertura, continuará con la puesta en común y discusión de experiencias -buenas o malas- en el uso de simulaciones numéricas, computación de alto desempeño y la interdisciplina que esto requiere y, finalmente, se realizará un cierre con opiniones e inquietudes de los participantes.

El Workshop tendrá lugar el día 9 de marzo y los horarios de las mesas serán los siguientes:
* Biología a las 10 hs
* Física 14 hs
* Química 16hs.

Para participar sólo hay que inscribirse en este link

Organización: Diego Masone (IHEM, CONICET-UNCUYO) , Marcelo Puiatti (CCAD, UNC), Juan Perotti (CCAD, UNC) y Nicolás Wolovick (CCAD, UNC).

Donación de Mercado Libre oficina Córdoba

La oficina Córdoba de Mercado Libre se comunicó con el Prosecretario de Informática de la UNC para contarle que tenían hardware ocioso. El CCAD tomó este ofrecimiento y se hizo de servers, firewalls y un NAS.

Tres servers Dell R720, dos firewalls Palo Alto PA-3020 y un NAS NetApp DS4246 fue el resultado de una donación de Mercado Libre al CCAD. Los aparatos tienen aproximadamente 10 años de antigüedad y funcionan correctamente. Serán utilizado para provisioning de los 4 clusters actualmente en producción.​

Agradecemos las gestiones a Jazmín Quevedo, Florencia Carcar, Ángeles Castagnino, Mauro Miskovic, Franco Oviedo y Daniel Gándara de Mercado Libre.