Usuario de CCAD corriendo en Stampede2

Paolo Sebastianelli es usuario de Mendieta en el CCAD y nos cuenta su experiencia corriendo su código en la máquina estrella del TACC, Stampede2, la #12 del TOP500.

 

CCAD: Hola Paolo, comentanos cual es tu trabajo de investigación y donde lo estuviste realizando en el último año.
PS: Hola Nicolás.
Mi trabajo de investigación se enmarca dentro de un proyecto más amplio que se desarrolla en el Grupo de Física de la Atmósfera del FaMAF con el cual estoy trabajando desde el 2012. Soy docente de la Universidad Nacional de la Pampa (UNLPAM), donde vivo con mi familia. Por esta razón, mi trabajo de tesis, a partir del 2014, se desarrolla a distancia con todo lo que eso conlleva. Se trata de investigar con Density Functional Theory (DFT) algunos aspectos de los procesos de conversión gas-to-particle que inician la formación de clusters moleculares de pre-nucleación de nuevas partículas atmosféricas.

CCAD: ¿Desde cuando sos usuario de HPC y desde cuando usás el Cluster Mendieta?
PS: Soy usuario HPC desde el 2015, cuando, justamente, empecé a utilizar Mendieta. Las dimensiones de los sistemas moleculares que estudio y los métodos que he elegido para la caracterización de los mismos requieren una potencia computacional que no puede ser alcanzada por computadoras comunes ni por workstations individuales.

CCAD: ¿Qué código corrés? ¿Qué características numéricas tiene?
PS: En la medida de lo posible elijo códigos abiertos. Actualmente he optado por utilizar GAMESS del Gordon Research Group, Iowa State University.
Los cálculos que realizo están basados en la teoría DFT. Con las simulaciones obtengo optimizaciones de geometrías moleculares y hago estimación de frecuencias vibracionales, con el objetivo de estudiar la termoquímica de sistemas moleculares presentes en la atmósfera. La implementación del código en la mayoría de las simulaciones no requiere mucha memoria, habitualmente no se llega a 1 GiB de RAM. Las corridas que potencialmente utilizan más memoria son los cálculos de frecuencia con métodos RHF (Hartree-Fock) o los tipos en MP2 (Møller–Plesset pertubation theory). Particularmente, uso GAMESS como código numéricamente más que memoria intensivo.

CCAD: ¿Cómo surgió la posibilidad de correr en Stampede2, la #12 del mundo?
PS: La posibilidad de acceder en Stampede2 fue gracias a Antonio Russo, uno de los técnicos del CCAD, que conociendo algunos aspectos del desarrollo de mi doctorado a distancia me propuso contactar al TACC y reforzar la potencia computacional a mi disposición. Entonces, presenté mi curriculum y mi propuesta de trabajo, pasé la fase de evaluación y acá estamos, aprovechando la oportunidad.

CCAD: Aunque sabemos que hay varios órdenes de magnitud de diferencia, nos gustaría saber cual es la diferencia entre correr en Stampede2 y correr en Mendieta u otro cluster que hayas usado.
PS: El código GAMESS está en constante desarrollo y los diferentes grupos de investigación lo modifican según las necesidades. En los nodos de Stampede2 (Intel Xeon Phi 7250 de arquitectura Knights Landing – KNL) se está estudiando la performance para optimizar las simulaciones. Hasta ahora he podido utilizar el código con las mismas prestaciones que tuve en Mendieta, pero con la mitad de nodos. Una gran diferencia es el tiempo de espera en la cola de cálculos, ¡El tiempo de espera es 0! Usualmente en Mendieta para lanzar mi corrida típica en 80 núcleos o sea 4 nodos, tenía que esperar dos o tres días ya que el cluster tiene utilización plena, en Stampede2, solo encolo el job de 2 nodos y ya.
El próximo paso de mi trabajo de tesis será aumentar todavía más las dimensiones de los sistemas moleculares que estoy estudiando, en ese momento tendré más información para poder comparar. Además Stampede2 será equipado adicionalmente con procesadores Skylake, asi que tendremos más material para poder charlar.
Algo relacionado es que en Mendieta, por los tiempos de cola, resultaba difícil que entren trabajos más grandes, en Stampede2 puedo escalar todo lo que mi investigación necesite.

CCAD: ¿Cómo ves la importancia de adquirir equipamiento de gran porte como el que usaste en el TACC?
PS: No creo decir nada nuevo si afirmo que hoy en día, con los ritmos de trabajo que estamos invitados a mantener, es necesario contar con equipamiento que permita lograr los objetivos en tiempos relativamente cortos. Tiempos de cálculo cortos junto con buena calidad de la producción científica, son los parámetros esenciales en este ámbito. A igual cantidad de trabajo, un equipamiento de gran porte permite las dos cosas: se pueden producir resultados en menor tiempo y además garantizar que esos resultados hayan sido corroborados bajo diferentes métodos de estudio, aumentando el nivel de confiabilidad en los mismos.

CCAD: Si querés agregar algo, bienvenido y desde ya muchas gracias por tu tiempo.
PS: Me gustaría agradecer el equipo que se ocupa del CCAD de la UNC, formado por personas muy amables como Nicolás Wolovick y Carlos Bederián, y también aquellas personas que me han iniciado al análisis DFT, en las personas de Ezequiel Leiva, Patricia Paredes, Patricio Velez, Cristián G. Sánchez y todos los otros colegas que trabajan en este contexto. Un agradecimiento particular a todo el Grupo de Física del Atmósfera, a Eldo Ávila y a mi Director de tesis Rodolfo Pereyra.

Cursos HPC en CIMEC: SPH, CUDA, Code-Saturne

Desde el 30 de Octubre al 3 de Noviembre en el predio CONICET "Dr Alberto Cassano" en Santa Fé Capital, se darán 3 cursos de HPC en el marco de RED CYTED 516RT0512 COMPUTACIÓN DE ALTO DESEMPEÑO EN INGENIERÍA.

Los cursos ofrecidos son:

  • SPH por Jaime Klapp (CINVESTAV, Méjico)
  • CUDA por Pablo Ezzatti y Martín Pedemonte (INCO, UdelaR, Uruguay)
  • Code-Saturne por Luciano Garelli y Mario Storti (CIMEC, Argentina)

Para más información dirigirse a la web del evento.

¡Llegaron 10 TFLOPS!

Llegó al CCAD el reemplazo de la Supercomputadora Cristina que ha sido desactivada a mediados de este año. El equipo encierra en un chasis rackeable de 2U, 4 * (Xeon Phi 7210 + 16 GiB MCDRAM + 96 GiB DDR4-2400 RAM) montados sobre placas madre Intel S7200AP, las mismas que se utilizan en Stampede2 del TACC.

El cuadro comparativo del reemplazo muestra los 10 años de avances de la microelecrónica entre 2007 y 2017. Resulta notable que la computadora nueva es 28 veces más eficiente en el uso de la energía.

Computadora RPeak Espacio Consumo
Cristina 5.44 TFLOPS 68U ~20000 W
4 * XeonPhi 7210 10.64 TFLOPS 2U ~1400 W
Mejora ~2x ~34x ~14x

Estos 4 nodos son solo el inicio de una nueva etapa de crecimiento del CCAD. Se espera la llegada de 8 nodos más antes de fin de año para totalizar 31 TFLOPS de potencia de cálculo pico.

Los fondos fueron suministrados por el Rectorado luego que los técnicos del CCAD encabezados por Antonio Russo mostraran a las autoridades que en el término de un año, el equipo se amortizaba solo gracias a la reducción de consumo energético.

Este es un claro ejemplo que en materia de Supercomputación se debe tener un plan sostenido de inversión en equipamiento (como el que propone CFAS) para aprovechar la mayor potencia de cálculo a un menor consumo energético. Se estima que la vida útil de un equipo de supercómputo está entre 5 y 7 años.

Estudiante de Cs. de la Computación a Supercomputing 2017

Supercomputing 2017 (SC17, Denver, EEUU), es la conferencia más importante del mundo en la temática de Computación de Alto Desempeño (HPC).

Esta conferencia implementa el Programa de HPC para Estudiantes, a fin de ayudar a los estudiantes de Ciencias de la Computación con interés en HPC a conocer los más altos esándares mundiales y las posibilidades de trabajo y estudio que tienen, asi como para delinear su área específica de trabajo futuro. Los estudiantes seleccionados reciben una beca completa que incluye transportes, alojamientos y costo de la conferencia.

Mauricio Guignard, estudiante de cuarto año de la Licenciatura en Ciencias de la Computación de FaMAF, ha sido seleccionado para este importante programa donde solo 34 estudiantes del mundo participan este año.
Mauricio se formó en el Grupo de GPGPU Computing de FaMAF y recientemente participó como becario en un proyecto conjunto FaMAF-IBM que ya tiene un trabajo científico aceptado en una conferencia internacional.

Esta experiencia transformadora, generará beneficios en la comunidad Argentina de HPC a mediano y largo plazo.

Técnicos de Cadena 3 visitaron Mendieta

Alejandro Settembrino, Coordinador Técnico de Radiodifusora del Centro S.A. junto al técnico Cristian Maldonado visitaron el datacenter de la UNC donde está situada la supercomputadora Mendieta.

En la visita, el Dr. Fernando Menzaque de la PSI-UNC y el Analista Darío Graña del CCAD-UNC, mostraron a los técnicos de Cadena 3 las instalaciones del centro de datos de nuestra casa de estudios, a fin de intercambiar experiencias respecto a infraestructura edilicia, eléctrica, térmica, de red y racks. Todo esto en vista a la construcción de un nuevo datacenter por parte de la radiodifusora en el edificio de calle Alvear, donde Settembrino y Maldonado  forman parte del equipo que está llevando adelante esta iniciativa.

Charla introductoria de code_aster en UTN-FRC

El día martes 13 de junio en la UTN Facultad Regional Córdoba se dará una charla libre introductoria sobre Code Aster, el software libre de análisis de elementos finitos y simulación numérica en mecánica estructural y multifísica, liberado por EDF en 2001.
La charla será en la Sala Multimedia del Departamento de Ingeniería Mecánica Edificio Maders – Planta Baja – UTN Regional Córdoba a las 18:15hs.

El poster y las filminas con el material introductorio ya están disponibles.

Para mayor información contactarse con scopeingenieria@gmail.com.

Esta charla será el preludio de un curso de 25 horas, que consta de 10 clases de 2,5 horas cada una que se dictarán una vez a la semana a las 19hs en la Universidad Técnica Nacional Facultad Regional Córdoba, y empezara a mediados del mes de Agosto.

 

Segundo hito del CFAS en cooperación internacional, el CSCS de Suiza

El jueves 13 de abril de 2017 se puso en práctica el segundo acuerdo de cooperación internacional suscrito en 2016. Esta vez se trata del Centro Suizo de Calculo Científico (CSCS), el mayor centro de HPC a nivel europeo y uno de los mas importantes a nivel mundial.
Gracias a dicho acuerdo y al financiamiento otorgado por el Ministerio de Modernización de la Nación a través del programa Bec.Ar el ingeniero del CIMEC Juan Pablo Dorsch está realizando una estadía de formación mediante la practica, en la sede principal del Centro ubicada en la ciudad de Lugano, en el sur de Suiza.

La estadía tendrá una duración de 3 meses y Juan Pablo tendrà la posibilidad de participar en el Service Delivery Project, una importante iniciativa que tiene como objetivo principal el desarrollo de una plataforma de servicios integrada en una interfaz única capaz de ofrecer recursos y servicios HPC de manera simple y transparente a los usuarios.

Además, Juan Pablo tendrá la oportunidad de conocer la arquitectura hardware y software de diferentes sistemas clasificados en la lista TOP500.
Esta estadía, es el fruto de gestiones internacionales para coordinar los objetivos y las prioridades de las instituciones que participan, y constituye otro paso importante en la construcción del Centro Federal Argentino de Supercomputo (CFAS) que se viene promoviendo cada vez con mas fuerza desde el interior del país. En la fotografía se lo puede ver a Dorsch junto a Piz Daint, la #8 en el TOP500 con 9.77 PFLOPS usando aceleradoras NVIDIA Tesla P100.

Aprovechamos la ocasión para agradecerle a nuestro colega Antonio Russo por la labor desarrollada, como así también al Director Adjunto del CSCS, Dr. Michele de Lorenzi y la directora de Rechursos Humanos, Lic Stephanie Frequente que posibilitaron este intercambio. Les deseamos también una excelente estadía a Juan Pablo en el cantón del Tesino, quien con su seriedad y profesionalismo representa de manera ejemplar a los miles de profesionales de CONICET que gracias a su labor cotidiana permiten el desarrollo de la ciencia en nuestro país.

Charla invitada en “Friends of Friends” 2017

En el marco del séptimo encuentro Friends of Friends organizado por el Observatorio Astronómico de Córdoba, el Ing. Antonio Russo y el Dr. Nicolás Wolovick disertaron acerca del estado del HPC en Argentina.

En primera instancia el Dr. Wolovick mostró de que manera un programa muy simple que resiste las opciones de optimización tradicionales como -O3, podía ser acelerado de 1.2s a 0.08s, o sea 15 veces, a través del análisis del assembly generado y el conocimiento de la plataforma de ejecución.

#define N (1<<28)
int main(int argc, char **argv)
{
    float sum = 0.0f;
    for (size_t i=0; i<N; ++i) {
        sum += 1.0f/(float)i;
    }
    return (int)sum;
}

Luego el Ing. Russo dibujó la situación del HPC en Argentina mostrando números muy duros que sintetizan el marcado atraso en esta pata fundamental de la Ciencia y la Tecnología actuales.

Miembros del CCAD recibieron Premio a la Transferencia

El Lic. Bederián y el Dr. Wolovick recibieron de manos del Gob. de la Provincia de Córdoba, Dr. Juan Schiaretti, un "Premio Estímulo a las Buenas Prácticas Vinculadas a la Transferencia de Conocimiento Científico-Tecnológico" por el trabajo del Grupo de GPGPU Computing y la empresa INVAP S.E en el año 2015.

En este trabajo realizado por un equipo de 7 personas durante 6 meses, se aceleró el desempeño de una aplicación de detección de objetos en un flujo de imágenes.