Serafín al servicio de Y-TEC.

La empresa de investigación y desarrollo para la industria energética contrató los servicios del Centro de Computación de Alto Desempeño (CCAD) de la Universidad Nacional de Córdoba.

Speedup de la solución

El CCAD comenzó a brindar servicios de alto desempeño a Y-TEC, la empresa de tecnología de YPF y el CONICET. Esta compañía es la principal empresa de investigación y desarrollo para la industria energética de Argentina y contrató los servicios del CCAD con el fin de desplegar en Serafin su plataforma de modelado y simulación de estimulación hidráulica y mecánica de rocas, Y-FRAC®, y aplicarla al estudio de los reservorios de interés. Esta plataforma está especialmente diseñada para correr en paralelo en clusters de alto desempeño.
El servicio brindado desde el CCAD a Y-TEC implica un doble desafío, en términos de infraestructura y también de know how. Por un lado, esta simulación involucró hasta ahora un máximo de 32 de los 60 nodos que componen a Serafín, siendo la simulación más grande que corrió dicha supercomputadora, con un total de 2048 cores. Además, a lo largo del trabajo de adaptación se consiguió que el escalado en términos de cores, se viera reflejado también en un aumento proporcional de la velocidad de cálculo (ver Gráfico). Esto demuestra que, efectivamente, Serafín funciona como un todo, no como una colección de computadoras desconectadas, y esto es gracias a su red de interconexión de alta velocidad y baja latencia.
Por otro lado, la complejidad de los procesos que se llevaron a cabo requirió la instalación de diversas bibliotecas como PETSc, y la solución de bugs. En esta etapa de depuración, el CPA-CONICET Carlos Bederián colaboró estrechamente con el equipo de desarrollo de Y-TEC para que su plataforma de simulación alcanzara un funcionamiento óptimo.

 


La implementación del stack MPI realizada por el Open MPI Project incluye la posibilidad de utilizar el estandar Open UCX para comunicaciones de alta velocidad y baja latencia. En esta plataforma, que hace uso de todas las capacidades del hardware subyacente, algunas cosas cambian. En este caso había un problema en el código de Y-FRAC que impedía el buen funcionamiento bajo esta combinación OpenMPI+UCX. El campo tag utilizado en las comunicaciones está limitado a 24 de los 32 bits que tiene en la definición del estándar. El CPA-CONICET Carlos Bederián, ató cabos y pudo asesorar al personal de Y-TEC para subsanar este inconveniente. El software estaba usando tags por fuera del rango de 24 bits lo cual producía resultados incorrectos.


Esta satisfactoria experiencia abre una etapa de fructífera cooperación entre una empresa nacional de base científica y un centro de cómputos de una Universidad Nacional, pública, ubicada en la provincia de Córdoba. Pero, además, muestra que el CCAD es un centro con una altísima capacidad no sólo de cómputo, sino también de adaptabilidad a diversas demandas, tanto del sector científico como empresarial e industrial.

Serafín se amplía y vuelve a romper récords.

El CCAD recibirá el mayor monto otorgado por el SNCAD en esta convocatoria para ampliar el cluster Serafín que sigue rompiendo marcas en horas core entregadas

El Sistema Nacional de Computación de Alto Desempeño (SNCAD) otorgó al Centro de Cómputación de Alto Desempeño (CCAD, UNC) un subsidio por U$S 50.000 para la ampliación del Cluster Serafín, siendo el mayor monto otorgado a proyectos en esta convocatoria. Junto a una contrapartida de U$S 10.000 que aportará la Secretaría de Ciencia y Técnica de la Universidad de Córdoba (SeCyT-UNC) para Sistemas Nacionales, el dinero asignado se utilizará para la adquisición de 2 nuevos chasis con 8 nodos. Estos se añadirán a los 60 nodos que posee Serafín en la actualidad.


Dicha ampliación implicará un incremento de 14% de poder de cómputo. “Esperamos poder ejecutar rápidamente y pedir 8 nodos más para llenar las bocas del switch infiniband. Con esto ya terminaríamos de armar Serafín que sigue batiendo records”, comenta Nicolas Wolovick, director del CCAD. Durante mayo, con 2.282.244 horas core, se sobrepasó la marca que se había alcanzado en abril en cantidad de horas core entregadas.
Finalmente, Wolovick señala que “AMD LatAm sigue apostando a Serafín como computadora insignia de su línea EPYC y por lo tanto realizará el mismo descuento sobre los procesadores. Este descuento redunda en un 50% más de desempeño por el mismo monto.”

Resolución del Financiamiento de SNCAD

Proyectos aprobados

 

Rompiendo marcas

En el mes de abril Serafín produjo una cantidad récord de horas/core en el CCAD y, además, alcanzó su máximo porcentaje de uso.

Nombres por arquitectura del procesador. rome: Serafín, knl: Eulogia, bdw Mulatona, ivb: Mendieta Fase 2. Gráfico realizado en Julia por Juan Perotti.

El pasado mes de abril, Serafín obtuvo dos nuevas marcas. Por un lado, produjo 2.224.896 horas/core de cómputo, marcando un record absoluto de producción de un cluster en el Centro de Computación de Alto Desempeño de la Universidad Nacional de Córdoba. A manera de referencia en relación a la importancia de esta producción, sirve la comparación con la Iniciativa de Proyectos Acelerados de Cálculo (IPAC), lanzada cada año por el Ministerio de Ciencia, Tecnología e Innovación de la Nación.
En esta iniciativa, se otorgan a la comunidad científica y tecnológica, recursos computacionales de los centros integrales adheridos al Sistema Nacional de Computación de Alto Desempeño, a través de dos tipos de proyectos. En la última convocatoria se brindaron 3 Proyectos de avances decisivos con supercómputo (PADS), de 1.000.000 de horas de CPU cada uno y 6 Proyectos de cálculo (PDC), de entre 300.000 y 500.000 horas de CPU, por año, cada uno.
Es decir que Serafín, con este ritmo de trabajo, sería capaz de dar respuesta a 2 de los 3 PADS y, de yapa, a un PDC en un mes. “Esto demuestra la tremenda capacidad del nuevo cluster de la UNC, que está disponible para todo el sistema de ciencia y técnica del país. Pero también pone en evidencia la rapidez con la que avanza la supercomputación y el poder de cómputo de los nuevos clusters, que siguen al pie de la letra la ley de Moore; por lo que siempre debemos trabajar para seguir creciendo en este sentido”, señala Nicolás Wolovick, director del CCAD.
También abril marcó un récord en cuanto a su uso ya que se ocupó el 90% de su capacidad. El 10% restante no pudo ser aprovechado por no coincidir las necesidades y con la pequeña capacidad restante. Por su parte, Eulogia mantiene un 75% y Mulatona un 62% de ocupación promedio. “Hay que remarcar que Serafín entrega el doble de horas/core que Eulogia, pero en la práctica es mucho más, ya que los 64 núcleos de la arquitectura Knights Landing (knl) de Eulogia, rinden mucho menos que la arquitectura Zen2 (rome) de Serafín. Estimamos que es aproximadamente el doble, debido a un reloj mucho más elevado y a un ancho de banda a memoria mucho mayor”, explica Wolovick.

 

Las leyendas indican la arquitectura del procesador de los clusters y es lo que las indentifica: rome-Serafín, knl-Eulogia, bdw-Mulatona y ivb-Mendieta Fase 2.

Charla abierta «Accediendo al CCAD»

Este miércoles 20 de Abril, de 15:30 a 18:30 Marcos Mazzini del CCAD dará una charla inicial e introductoria para quienes nunca han utilizado un cluster de cómputo o sistemas LINUX, en el marco de las «Friends of Friends Hybrid Meeting 2022» organizado por el Observatorio Astronómico de Córdoba (OAC, UNC). La participación es abierta y será presencial o remota.
Temas:
Fundamentos básicos de Linux
Iniciación en el uso de la consola, conexión a un sistema remoto y uso del sistema de colas
Shell, comandos, filesystem, procesos, conexion SSH, sistema de colas SLURM.
Requisitos: No es necesario experiencia previa con sistemas Linux
Inscripciones en la página N° 7 del formulario

El CCAD recibió la visita de la Universidad Nacional de Hurlingham

Fue en el marco de un proyecto de vinculación entre el Instituto de Tecnología e Ingeniería de la UNAHUR y el Centro de Cómputos de Alto Desempeño de la UNC


El pasado jueves 31 de marzo, un equipo del Instituto de Tecnología e Ingeniería de la Universidad Nacional de Hurlingham visitó Córdoba para conocer en profundidad los Data Centers del CCAD de la Universidad Nacional de Córdoba y de la Empresa Provincial de Energía de Córdoba (EPEC). Visitar dichos centros, modernos y de alta capacidad, les permitió interiorizarse sobre algunos aspectos de la instalación de Cómputo de Alto Desempeño, como parte de un proyecto de vinculación tecnológica.

Participaron del encuentro Carlos Bederián del CCAD-UNC; Mathias Molina de la UNC; Gustavo Medrano, Director del Instituto de Tecnología e Ingeniería y Fernando Puricelli, Director de Tecnicatura Universitaria y Licenciatura en Informática, ambos de la UNAHUR; Adolfo Ivan Lelli y Sonia Dona de EPEC; Javier Proyector, ex-alumno FaMAF-UNC, Presidente de TA Telecomunicaciones y Gerardo Piermattei, Ignacio Arrieta y Gabriel Balegno, de TA Telecomunicaciones.

Reunión Virtual Abierta de Usuarios CCAD

El próximo lunes 4 de abril, a las 10 hs, se llevará a cabo la Reunión Virtual Abierta de Usuarios CCAD, destinada a usuarios/as actuales y potenciales. Para participar, deben inscribirse previamente en el siguiente formulario: Reunión virtual abierta de usuarias/os CCAD 2022 (google.com)

Actualización

Se inscribieron 162 personas y se conectaron alrededor de 100 personas a la charla inicial y luego hubo en las 4 salas en paralelo alrededor de 25 personas en cada una. Se obtuvo muy buen feedback de las y los usuarios que nos servirá para implementar mejoras.

Materiales

Serafín: supercomputación y conexiones neuronales

Científicos pertenecientes a un instituto mendocino, describen el funcionamiento de una proteína clave para la sinapsis neuronal, utilizando simulaciones numéricas realizadas en el CCAD.

Di Bartolo y Masone. Foto: Gentileza UNCuyo

Existen redes federales, que esquivan los centros y posibilitan poderosas conexiones. En este caso, Serafín del Centro de Computación de Alto Desempeño de la Universidad Nacional de Córdoba (CCAD – UNC), estuvo al servicio del grupo mendocino liderado por Diego Masone, perteneciente al Instituto de Histología y Embriología de Mendoza “Dr. Mario H. Burgos” (IHEM, CONICET-UNCUYO). Esta vez, la analogía que explica el funcionamiento del cerebro comparándolo con el de una computadora, alcanzó otro nivel y la metáfora se convirtió en herramienta: nuestra supercomputadora permitió describir uno de los mecanismos moleculares de una proteína clave para la sinapsis neuronal.
Es que el CCAD, como sabemos, tiene una enorme potencia para apuntalar y maximizar las capacidades de los grupos de investigación de las diversas áreas y disciplinas científicas, poniendo a disposición tecnología de alto nivel a un costo realista en relación a los recursos disponibles. En ese sentido, el propio Masone asegura que «las simulaciones numéricas asociadas a este trabajo fueron sumamente costosas en términos de tiempo de cálculo. Sólo fueron posibles con el tiempo de supercomputación que teníamos en Serafín, de otra manera ni siquiera nos hubiésemos planteado abordar un problema de esta envergadura«.
Es por esto que, a pesar de sus limitaciones, Serafín constituye una herramienta indispensable para el desarrollo de una ciencia argentina federal. De ahí la importancia de que el CCAD siga creciendo, en equipamiento y recursos.

La investigación
El pasado 23 de febrero el trabajo de Lautaro Di Bartolo -becario del CONICET- y Diego Masone -investigador del CONICET-, del IHEM (CONICET-UNCUYO), salió publicado en la prestigiosa revista internacional Chemical Science. Ahí, los científicos describieron uno de los mecanismos mediante los cuales una proteína llamada Sinaptotagmina 1 regula la sinapsis, es decir, el proceso mediante el que las neuronas se comunican entre sí.
Tal como aseguran en una nota desde el CONICET, “este estudio representa un avance para entender el funcionamiento de esta familia de proteínas, con aplicaciones directas en medicina. Una mejor descripción de estos mecanismos permitirá pensar en soluciones para el tratamiento de neuropatologías degenerativas como el Alzheimer. ‘Si uno tiene un problema muy complicado que resolver no hay manera de dar con una solución factible si primero no se entiende el mecanismo del problema. Cuando entendamos con claridad, y a nivel molecular, cómo es el proceso completo de la sinapsis neuronal, sólo entonces podremos pensar en tratarla con objetivos médicos’, concluye Masone”.

Di Bartolo y Masone. Foto: Gentileza UNCuyo

El software
Para realizar las simulaciones numéricas, no sólo se utilizó Software Libre Científico, si no que además se creó un plugin específico para las necesidades de esta investigación. Lautaro Di Bartolo, bajo la supervisión de Masone, usó PLUMED, un módulo que permite insertar código que implementa variables complejas dentro de la simulación realizada en el motor de dinámica molecular GROMACS, a fin de poder estudiar mejor los mecanismos involucrados. El plugin MEMFUSION que diseñaron, programaron y optimizaron fue aceptado dentro de PLUMED, por lo que ahora se encuentra libremente disponible para que pueda utilizarse en otros trabajos científicos.

Para conocer más sobre la investigación:
https://www.conicet.gov.ar/describen-el-funcionamiento-de-una-proteina-clave-para-la-sinapsis-neuronal/

https://www.unidiversidad.com.ar/como-una-supercomputadora-ayudo-a-cientificos-de-la-uncuyo-a-conocer-un-mecanismo-del-cerebro

https://soundcloud.com/fundacionmedife/dr-diego-masone-instituto-de (A partir del minuto 4:22)

https://www.uncuyo.edu.ar/prensa/ciencia-argentina-describen-como-funciona-una-proteina-clave-para-la-sinapsis-neuronal23

Actualización

El 29 de abril agregaron dos nuevos CVs a PLUMMED relacionados a Membrane Fusion.