Instalamos 18 GPUs en Mendieta Fase 2

MendietaF2, el cluster de GPUs para dinámica molecular y aprendizaje automático fue expandido con 18 GPUs y llegó a la capacidad máxima planificada. Los 22 nodos de Mendieta ya están completamente llenos de NVIDIA A30.

Con fondos del Rectorado de la UNC, empezó un proceso de compra de abril a noviembre donde se invirtieron 57708 USD para la compra de 18 GPUs NVIDIA A30 a la empresa SIASA SA. El proceso fue largo porque implica un concurso de precios, el giro de fondos al exterior, la demora que están teniendo la cadena de producción de las GPUs, y la importación de las mismas utilizando los mecanismos de ROECYT.

Las GPUs llegaron el 29 de noviembre y el día 30 ya estaban instaladas y funcionando 12 de las 18 GPUs. Sólo Carlos, Marcos, Alejandro, Álvaro y Tolca pueden hacer esto.

La preparación fue larga e incluyó la compra de:

  • 18 procesadores Intel Xeon E5-2680v2 y 2 E5-2690v2 para actualizar los E5-2680v1 y asi tener PCIe 3.0 en 8 de los nodos de Mendieta que fueron los primeros comprados por FaMAF en 2012.
  • 24 cables de power PCIe 8 a 6+2 pines.

Todo el equipo trabajó, no solo los técnicos. La compra involucró al equipo contable de la PSI (Laura Grassetti, Gonzalo Jaimez, Ana Laura Calderón) y al equipo de ComEx de la UNC (Marcela Giomi y Mario Farías). Nuestros proveedores fueron pacientes y atentos, entre ellos SIASA (Andrés S. Marcone y Sonia Alonso) y MET Servers (Edwar Gomez). Finalmente nuestro operador de logística FedEx (Adriana LaGattina).

Ya se colocaron 12 de las 18 placas, por lo que MendietaF2 pasó de 24 a 36 placas. Las 8 restantes serán colocadas en 3 nodos más de MendietaF2 que deberán ser recuperados de otras funciones que estaban realizando. Un nodo se agregará antes de que termine el año.

El HPC no es solo software, implica, como en esta larga jornada de trabajo, el desarmar y armar muchas computadoras. Los dedos sucios también son parte de lo que hacemos.

Por Nicolás Wolovick
Director del CCAD-UNC