UNC y UBA intercambian partes para mantener infraestructura de HPC

¿Qué hacer cuando no hay plata para comprar más figuritas y querés completar el álbum? Una estrategia posible es intercambiar con otros, lo que para unos es una «repe» para otros es necesaria y viceversa.

En abril de este año los técnicos que mantienen los clusters del DF@UBA, Roberto Dhios, y los clusters del CCAD-UNC, Carlos Bederián, entran en contacto para intercambiar partes. Por un lado el Departamento de Física de UBA había recibido la donación de servidores y discos y el Centro de Computación de Alto Desempeño tenía también producto de una donación, placas y switches Infiniband. Dirac necesitaba mejorar su red y Mendieta, Mulatona y Eulogia necesitaban ampliar un poco su viejo NAS que data de la época de Cristina.

El viernes 31 de mayo se produjo el intercambio. Martín Santos, encargado del hardware del DF, vino de CABA con su auto y trajo infraestructura de almacenamiento:

llevándose a su regreso infraestructura Infiniband DDR:

  • 1 switch Flextronics FX-430073.
  • 33 adaptadores Mellanox MHGS18-XTC.
  • 33 cables Mellanox MCC4L30-002.

 

El resultado del intercambio será provechoso para ambas partes, aunque los discos sean de 2012 y la red de 2005.
El DF@UBA migrará Dirac de gigabit Ethernet que es rápida, pero de alta latencia, a una red Infiniband, que aunque tiene más de 12 años de antigüedad, su prestaciones para el cálculo distribuido son muy superiores gracias a su baja latencia.
Nosotros, en el CCAD-UNC podremos aumentar la capacidad de almacenamiento de nuestro NAS compuesto de 9 Western Digital WD40EFRX-68WT0N0 de 4 TiB y 6 WD WD10EADS-65M2B0 de 1 TiB, pasando de 42 TiB de almacenamiento crudo a 120 TiB de almacenamiento crudo.

Seguimos buscando formas de mantenernos productivos y no tan desactualizados.
Tal vez este sea un tip más para agregar en el artículo de Nature «Seven ways scientists handle technology challenges in resource-poor settings«. Esperemos que sea el último.

Actualización 30 agosto 2019

Las placas IB DDR ya están instaladas en Dirac@DF.UBA y con buenos resultados: ancho de banda TCP/IP de 1.1 GiB/s, latencia de 16.6 µs y un ancho de banda de BeeGFS efectivo de 844 MiB/s.
Todo esto representa una mejora importante para este cluster hecho prácticamente todo de deshechos.