Eulogia a pleno

"Calculo que solo en la UNC necesitamos al menos 10 veces la potencia de cálculo que actualmente tenemos." nos dijo hace un par de años el experimentado Antonio Russo.

Una muestra más de esto se produjo ayer, martes 20 de marzo, cuando decidimos abrir Eulogia a todos los usuarios del CCAD. Con sus 12 procesadores XeonPhi 7210 en 3 unidades de 2U, erogando una potencia de cálculo similar a toda Mendieta, Eulogia tardó exactamente un día en llenarse.

En este momento los 44 Xeon 2680{v1,v2} de Mendieta y los 12 XeonPhi 7210 de Eulogia están calculando a pleno.

Desde el CCAD-UNC, seguiremos trabajando para ampliar la capacidad de cálculo disponible para los investigadores y la sociedad.

Artículo publicado Science usando Mendieta

El 16 de marzo se publicó el artículo "Real-time imaging of adatom-promoted graphene growth on nickel", escrito por un equipo integrado por los doctores Marcelo Mariscal y Germán Soldano de la FCQ-UNC. Las particularidades de este artículo son dos. Primero es que fue publicado por Science, una de la mejores revistas científicas del mundo y lo segundo es que el 100% de las simulaciones se corrieron en Mendieta, uno de los clusters del CCAD-UNC.

El software que permitió simular los materiales fue LAMMPS y Quantum ESPRESSO y los investigadores estiman un uso de 38000 horas/core, es decir si tuvieramos una sola máquina de un núcleo se hubieran necesitado más de 4 años de corrida. Gracias a que LAMMPS y Quantum ESPRESSO premiten utilizar 100 o más núcleos de Mendieta (de un total de 424), los tiempos se ven reducidos a menos de un mes.

Felicitamos a Marcelo y Germán, y seguimos adelante ofreciendo más recursos computacionales para hacer ciencia y tecnología de calidad en Argentina.

Más notas: FCQ, La Voz del Interior, UNCiencia, CONICET.

NVIDIA Developer Conference en Córdoba

El 5 y 6 de marzo se realizó en la Facultad de Matemática, Astronomía, Física y Computación de la UNC, y con el apoyo del CCAD, la "NVIDIA Developer Conference".

Ante un auditorio con capacidad para 130 personas totalmente colmado, el primer día se dieron 10 charlas dentro de la temática de GPU Computing, Arquitecturas Masivamente Paralelas, Aprendizaje Automático y Visión por Computadora. Tanto los expositores como el público mezclaban de manera balanceada academia e industria.

El segundo día y también con un Laboratorio de Computadoras con capacidad para 40 personas totalmente colmado, el NVIDIA Fellow Esteban Clua, dictó un curso hands-on de CUDA, utilizando para ello nada menos que una plataforma DGX-1 que posee su Grupo de la Universidad Federal Fluminense.

En paralelo y dentro de la Sala del Consejo Directivo de FaMAF, se realizó un encuentro entre Organismos Gubernamentales, empresarios de la rama TIC y el Representante de Ventas de NVIDIA para América Latina, el Sr. Marcio Aguiar.
Este encuentro contó con la presencia del Ministro de Ciencia y Tecnología de la Provincia de Córdoba, el Dr. Walter Robledo, que se interiorizó sobre el potencial de las plataformas de esta empresa para el desarrollo de aplicaciones de Aprendizaje Automático.

Facundo Ardusso campeón del Super TC2000

Aunque parezca una noticia de otro portal, este es el lugar correcto.

El domingo pasado en el Cabalén, Facundo Ardusso se coronó campeón de la categoría más tecnológica del automovilismo argentino, el Super TC2000.

Facundo corre en un Renault Fluence del Reault Sport Ambrogio Racing. Ellos cuentan con un equipo de HPC para realizar pruebas aerodinámicas que les permiten probar diferentes configuraciones de carrocería a menor costo y en menos tiempo que los ensayos en pista.
La computadora es un 2*E5-2680v4 con 256 GiB de RAM que tiene un potencia pico de cálculo de 0.851 TFLOPS y un ancho de banda a memoria de 153 GiB/s, que fuera instalada este año por el personal del CCAD-UNC en una configuración de software similar a Mendieta.
Para dar una idea del uso de Computational Fluid Dynamics (CFD) en los deportes motor, la F1 limita los equipos de HPC que se pueden usar a 30 TFLOPS de CPU.

Felicitamos a todos los miembros del equipo y esperamos poder seguir brindando servicios y asesoramiento a estas empresas que además de consumir neumáticos, también consumen TFLOPS.

Eulogia en $\beta$

Nos complace en informar la puesta en funcionamiento de Eulogia, el nuevo Cluster del CCAD.

Compuesta de 3 módulos, donde el primero fue adquirido con fondos provenientes del Rectorado para el reemplazo de la Supercomputadora Cristina y los siguientes dos con fondos del MinCyT de la Nación. Cada módulo tiene cuatro unidades KNL Xeon Phi 7210 + 16 GiB MCDRAM+ 96 GiB DDR4-2400 RAM, montados sobre una madre Intel S7200AP.

Cada unidad KNL tiene un potencia pico teórica de 2.66 TFLOPS fp64, por lo que las 12 unidades totalizan 31.92 TFLOPS fp64 pico. Cada Xeon Phi es un procesador "lento" ya que su reloj oscila a 1.2 GHz, pero incorpora 64 núcleos con 4-way SMT (Hyperthreading), unidades de procesamiento vectorial de 512 bits con fused-multiply-add (FMA), y 16 GiB de memoria 3D MCDRAM con 400 GB/s de ancho de banda. El combo tiene un desempeño muy alto y las relaciones GFLOPS/$ y GFLOPS/W son muy buenas.

La instalación del software estuvo a cargo del Lic. Carlos Bederián e involucró un cambio radical, basando todo el proceso de instalación, configuración y aprovisionamiento en Ansible sobre la base de CentOS 7.

Por el momento está instalado en forma parcial -todavía faltan instalar varias bibliotecas y programas, y la conectividad Infiniband. Pero ya se puede comenzar a usar, en particular ya tiene instalado Quantum ESPRESSO 6.2, los compiladores GCC 7.2 e Intel 2018 y la biblioteca OpenMPI 3.

La potencia de cálculo (2.66 TFLOPS) y el ancho de banda que brinda la MCDRAM configurada como caché (400 GB/s) mostraron que Quantum ESPRESSO corre 2 veces más rápido en un módulo de Eulogia que en un módulo biprocesador de Mendieta fase 2. Esperamos mostrar más números en el corto plazo a medida que el resto de las aplicaciones y bibliotecas sean instaladas.

SC17 parte 1 (hardware)

Estuvimos en SC17 (Denver, Colorado, EEUU), junto con una marea humana de apoximadamente 12500 personas relacionadas a la Computación de Alto Desempeño (HPC) donde el 22% éramos de afuera del país anfitrión.

En cada edición de SC17 se anuncia un nuevo TOP500, y aunque los cambios fueron menores, hubo muchas novedades de hardware que en 2018 afectarán el ranking mundial de las supercomputadoras y donde probablemente el país que tiene su mejor máquina en el #5 y que tienen una antiguedad de 5 años, destrone al bravo piloto de la nueva China, la computadora Sunway TaihuLight.

Tal  vez la principal atracción fue ver los nodos que durante 2018 poblarán Summit, la supercomputadora del ORNL que utiliza 2U cada una con 2*POWER9+6*V100 provistas por IBM en colaboración con NVIDIA, que totalizarán más de 180 PFLOPS de potencia de cálculo en LINPACK. ¿Será la nueva #1?

El músculo atrás de Summit es la arquitectura Volta de NVIDIA que literalmente inundaba el piso de exhibiciones de SC17. Jamás vimos tantas placas V100 en stands tan distintos, tanto en versión SMX2 como PCIe 4.0 16x. Resulta curioso que aun no es posible comprarla al por menor.

Otra novedad fue Gyoukou. La computadora japonesa se refrescó con aceleradores PEZY-SC2 y pasó del puesto #61 al #4, justo atrás de la suiza Piz Daint. Goyoukou tiene 19.860.000-way parallelism, o sea es la computadora más paralela del planeta.

Isambard aun no debutó en el TOP500, pero ya generó mucho ruido. Esta computadora basada en el ThunderX2 de Cavium con 32 núcleos a 2.5 GHz que manejan 8 canales de memoria DDR4 a 2667 MHz. Los blades son impresionantes ya que incorporan 8 procesadores y la red de interconexión Aries diseñada por Cray. Aunque no es particularmente capaz en FLOPS, su ancho de banda de memoria lo pone como un serio competidor a los Xeon Gold. Si tenemos en cuenta que Post-K diseñada por Fujitsu pondrá procesadores similares, estamos en presencia de un nuevo jugador dentro del TOP500.

La era post-Moore nos trae una lista Nov2017 con una sola gran novedad y es de software: el 100% de los sistemas corren GNU/Linux. Seguramente el año que viene con ThunderX2, PEZY-SC2, V100, POWER9 y los SX-10+ de NEC las novedades florezcan.
A propósito, KNH se suspendió, Aurora del DOE va a Exascale sin escalas intermedias.

Marcos Mazzini, nuevo CPA en el CCAD

A partir del jueves pasado, el barilochense Marcos Mazzini, se suma al equipo del CCAD.

Marcos pertence a la Carrera de Personal de Apoyo (CPA) de CONICET y hasta que decidieron con su familia mudarse a las sierras cordobesas, Marcos trabajaba en el INIFTA-UNLP y mantenía el cluster de la Unidad de Cálculo en Física y Química Teórica.

Con Marcos, el CCAD vuelve a tener 3 CPA (dos de los cuales son oriundos de Bariloche) para mantener toda la infraestructura, luego de la vuelta de Antonio Russo a Francia en Agosto pasado.

Esperemos colmar las expectativas de trabajo de Marcos y poder ofrecerle posibilidades de crecimiento y capacitación.

Nuevo becario Bec.Ar del CFAS en EDF

Gustavo Krause del IDIT-CONICET en Facultad de Ciencias Exactas, Físicas y Naturales de la UNC ya está en París realizando una beca más del programa Bec.Ar gestionada por el CFAS en la persona de Antonio Russo.

En la estadía consiste en una primera etapa de introducción al Code_Saturne a nivel de usuario y de implementación de utilidades particulares y una segunda etapa a nivel de desarrollador donde se busca implementar y verificar el acoplamiento interno de un campo vectorial con un dominio externo para la simulación de fenómenos de interacción.

La estadía se extiende desde el 16 de octubre hasta el 16 de febrero en la sede de EDF en la Île de Chatou, Francia.

Nodo temático de Machine Learning con GPU

Luego de dos reuniones con diferentes sectores de la academia y de la industria, el CCAD empieza a consolidar la formación de un Nodo Temático en Machine Learning utilizando tecnología GPU.

Este Nodo Temático dentro del CCAD pretende lograr una sinergia entre los sectores académicos y empresarios interesados en la tecnología de Machine Learning (ML) a fin de potenciar el área. Se eligió como plataforma de cómputo a la GPU dada la experiencia del CCAD y la eficiencia que estas tienen ejecutando este tipo de cómputo.

Los objetivos concretos a corto plazo son:

  • Tener una Plataforma de Cómputo para ML a fin de ser usada de manera libre entre los actores de la academia y la industria que quieran formar parte del Nodo Temático.
  • Crear una Diplomatura en ML dentro de FaMAF para ofrecer formación específica y acotada en el tiempo.

La plataforma de cómputo consistirá en la reconversión de 2 nodos de Mendieta Segunda Etapa, los cuales serán mejoradas con la incorporación de 8 tarjetas NVIDIA GeFORCE GTX 1080 Ti y 512 GiB de memoria RAM, a fin de sumar 80 TFLOPS pico en simple precisión, específicos para ML.

El primer paso ya fue dado con la donación al CCAD de una placa GTX 1080 Ti por parte de la empresa cordobesa Bitlogic.io.
Agradecemos el apoyo y la confianza y esperamos poder reunir rápidamente el resto de las GPUs y la memoria RAM.