Entrevista a Diego Masone, usuario IPAC2

En 3 de octubre del año pasado la Iniciativa de Proyectos Acelerados de Cálculo (IPAC) del SNCAD asignó al Dr. Diego Masone (IHEM-CONICET) un PDC para el proyecto "El complejo asimétrico HSPB6/14-3-3: hacia el diseño in silico de drogas". Este PDC fue localizado en el CCAD-UNC dentro del Cluster Mendieta.
Diego ha utilizado un total de 719564 horas/core hasta ahora, que si lo normalizamos con el SMT-4 que utilizan los KNC, tenemos un valor un poco más realista de 179891 horas/core.

CCAD: Hola Diego. Contanos como y con quién te formaste, y en que estás trabajando ahora.

Soy Ingeniero Electrónico de la Universidad Nacional de Mar del Plata, cuando me recibí tuve una beca Erasmus Mundus de la Comunidad Europea por dos años  y estudié Telecomunicaciones en el Politecnico di Torino en Italia y en la Universitat Politecnica de Catalunya en Barcelona. El doctorado lo hice en el Centro Nacional de Supercomputación de Barcelona (BSC) que en ese momento tenía la octava supercomputadora más grande del mundo. Tuve la suerte de trabajar en un lugar de excelencia, en un grupo que dirigía un científico de primera línea, el Dr. Victor Guallar, que fue mi director de tesis.

En 2012 volví a Argentina repatriado con mi esposa y mis hijas catalanas. Ahora trabajo en el IHEM de la UNCuyo, en Mendoza, en un grupo que dirige otro científico excelente, el Dr. Diego Bustos, con quien tenemos muy buenos proyectos que combinan los mundos experimental y computacional en el Laboratorio de Integración de Señales Celulares.

CCAD: ¿Podrás dar una idea general de que estás buscando a con este IPAC-PDC?

 

Estoy estudiando un complejo proteína-proteína muy particular. Se trata de una asociación asimétrica entre dos proteínas (14-3-3σ y HSPB6) que sabemos es responsable de la replicación del ADN y transformación celular maligna. Este complejo de proteínas contiene una región desordenada que no toma una estructura tridimensional determinada y por lo tanto es muy difícil de estudiar por métodos experimentales. Por ello, por medio de simulaciones computacionales buscamos poder entender cómo estas dos proteínas se asocian y de esta forma convertirlas en un nuevo blanco para el diseño de drogas.

CCAD: ¿Qué software usás?
Uso GROMACS que paraleliza muy bien en GPU y corre magníficamente en XeonPhi desde la versión 5.0.7 (octubre 2015). Utilizamos también PLUMED, un plug-in excepcional que se compila sobre GROMACS y que permite implementar funciones más complejas en las simulaciones de dinámica molecular que hacemos.

CCAD: ¿Cómo fue tu experiencia respecto al uso del Cluster Medieta?
¡Excelente! Tuve toda la ayuda que necesité para compilar el código, siempre me respondieron los correos y me indicaron cómo solucionar los problemas iniciales de instalación con las librerías y los módulos. Mayormente utilizo los XeonPhi que corren muy bien y eventualmente alguna GPU. No uso CPU porque el rendimiento en tiempo de simulación por día y por procesador es muy bajo en comparación.

CCAD: Según ví estás corriendo en las XeonPhi KNC (tarjetas aceleradoras) que tienen los nodos de Mendieta. ¿Qué notás de diferencia entre los CPUs comunes y estas many-integrated-core de Intel y las GPUs de NVIDIA?
Las pruebas de rendimiento que hice con un sistema de unos 90.000 átomos me dan 1.44ns/día en 1 GPU, 2.82ns/día en 2 GPU y 1.56ns/día en una XeonPhi. En cambio con 8 cores CPU rinde menos de 0.5ns/día. Por eso uso las tarjetas XeonPhi y las GPU. Pienso que la elección del CCAD de instalar tarjetas XeonPhi y GPUs es muy acertada. Para el caso de GROMACS pienso que es obsoleto correrlo en CPU, sus desarrolladores han invertido muchísimo esfuerzo en optimizarlo para GPU.

CCAD: ¿Probaste en Eulogia y sus KNL?
Sí, por ahora sólo hice pruebas de rendimiento. Pienso que han hecho muy bien en instalar una máquina exclusivamente basada en la arquitectura XeonPhi. Sería magnífico poder escalar en múltiples XeonPhi como en GPU, si la comunicación entre las tarjetas es suficientemente rápida.

CCAD: ¿Ya tenés resultados concretos del uso de las máquinas del CCAD?
Sí, tenemos resultados preliminares que se van a convertir en otro artículo en breve. Nuestro paper más reciente desarrolló la base para el estudio de las interacciones entre proteínas y biomembranas, puede verse en este enlace y lleva en los agradecimientos la mención al CCAD.
Tenemos un colaborador en Moscú que se ocupa de la parte experimental de las proteínas (hace cristalografia de rayos X y SAXS) que nos ha provisto de información todavía en "embargo", es decir, que se ha publicado pero sólo quien la publicó tienen acceso a las estructuras.

CCAD: Pensando un poco en el futuro ¿Qué harías con una máquina más grande, mucho más grande?
Yo opino que la supercomputación va a abarcar cada vez más disciplinas científicas y que con máquinas cada vez más potentes vamos a poder resolver cada vez más problemas. En 2002 se publicó el libro “A New Kind of Science” de Stephen Wolfram (un genio que se Doctoró en Física de Partículas a los 20 años, en CALTECH, con un tribunal de tesis que incluía nada menos que a Richard Feynman). Stephen Wolfram además de ser el creador del software Mathematica, tuvo la capacidad de ver, hace más de 25 años, que los problemas de la física y la biología podían resolverse muy adecuadamente por medios computacionales y que las simulaciones numéricas eventualmente abarcarían muchas áreas del conocimiento. No es casualidad que los países más avanzados tengan también las supercomputadoras más grandes.

CCAD: Si querés agregar algo mas, adelante.
¡Sólo agradecer! Me han tratado muy bien en el CCAD y me han ayudado siempre que me ha hecho falta.

CCAD: Diego, muchas gracias por tu tiempo.
Gracias a ustedes.