Llamado uso exclusivo Mendieta: verano 2017

inodoro_und_mendietaSe llama a propuestas para el uso intensivo y exclusivo del cluster "mendieta" en los nodos de la cola "capability" y en las GPU de la cola "capacity" durante el Periodo de Receso de la UNC, del 02/01/2017 al 31/01/2017 inclusive. Este llamado está destinado a aquellos usuarios que desean ejecutar trabajos de simulación numérica que requieran una potencia de cálculo importante durante un tiempo prolongado. El resto de las facilidades podrán ser utilizadas según la alocación efectiva de los recursos, en otros términos, los nodos libres quedan a disposición de los usuarios ocasionales que se conecten al cluster.

280 cores E5-2680v2, 12 aceleradoras NVIDIA Tesla M2090, 8 aceleradoras NVIDIA Tesla K20x y 14 aceleradoras Intel Xeon Phi 31SP1 constituyen los recursos disponibles, totalizando 40.436 TFLOPS de RPeak.

El pedido deberá ser formalizado a través del siguiente formulario.
El mismo estará habilitado hasta las 22h00m del día Martes 13 de Diciembre de 2016.

CCAD en Supercomputing 2016

img_20161115_080056Este año estuvimos en la conferencia más importante de supercomputación (HPC) del planeta. La experiencia fue importante y sobre todo necesaria. No solo vimos lo que hay para este año, sino lo que se planifica a 5 o 10 años. Tocamos KNL, P100, POWER9. Nos cruzamos con Thomas Sterling (Beowulf), Satoshi Matsuoka (Tsubame), Morris Jette (SLURM). Presentamos un trabajo en EduHPC'16 y fue elegido best paper. Asistimos a workshops específicos. Hablamos con muchísima gente de IBM, NVIDIA, Penguin Computing, Mellanox, OpenPOWER.

Aunque estamos a un orden de magnitud por debajo de la computadora más lenta del TOP500, resulta clave para nuestro desarrollo participar en estas conferencias, ya que la única forma de acercarnos es adquirir, de manera sostenida, la tecnología más adecuada en términos de usabilidad y relación costo/beneficio, a fin de maximizar el presupuesto que el sistema científico vuelca en supercomputación.

No podemos estar ausentes como país en 2017, nos comprometemos a sensibilizar las autoridades, en particular para que el próximo año muchos mas colegas puedan participar de esta experiencia.

La conclusión de visitar SC16 fue: tenemos que estar en SC17.

eduhpc16 whatsapp-image-2016-11-15-at-8-21-10-am img_20161113_092756

Análisis del Estado del HPC en Argentina, algunos números

A partir del informe de Antonio Russo "Computación de Alto Desempeño, Estado del arte en Argentina y en los países del G20" donde establece que Argentina es el único país del G20 que nunca entró al TOP500, investigamos cuan lejos estamos del último peldaño del TOP500 en algunos clusters de Argentina.

Año Nombre Modelo Rpeak %Rpeak_min
1962 Clementina Ferranti Mercury 5 KFLOPS
2000 Clementina 2 SGI Origin 2000 (40 cores) 24 GFLOPS 68.1%
2001 Deepblue 2 16×2×PentiumII 25 GFLOPS 40%
2010 Cristina 70×2×Xeon 5420 5600 GFLOPS 24%
2010 ISAAC 144xXeon X3220 5000 GFLOPS 17.8%
2014 Mendieta (fase 2) 14×2×Xeon 2680v2 23624 GFLOPS 17.5%
2015 TUPAC 58×4×Opteron 6276 48000 GFLOPS 26.5%

La última columna refleja que porcentaje es el Rpeak de la máquina (potencia teórica de cálculo) respecto al mínimo Rpeak del ranking TOP500 al momento que la máquina entró en producción.
Estos números reflejan claramente, no solo que estamos fuera del TOP500, sino que además nuestra potencia de cálculo se está deteriorando en términos relativos.

Agradecemos a Gustavo del Dago por los datos sobre Clementina y a Fernando Cucchietti por los datos sobre Clementina 2.

Reunión anual usuarios CCAD

img_20161031_153255El lunes 31 de octubre a las 15:00 tendrá lugar en la Sala del Consejo Directivo de la FAMAF, la Reunión Anual de Usuarias/os de los clusters bajo administración del CCAD.
Esta es una muy buena oportunidad para conocernos, intercambiar información, alertar y posteriormente corregir posibles problemas, planear el futuro, etc. Creemos también en la importancia de aprovechar estos momentos para aunar esfuerzos en pos de hacer del CCAD un Centro de referencia a nivel nacional.

Programa

  • 1500: Que hicimos y que estamos haciendo. (Presentación a cargo del personal del Centro)
  • 1530: La demanda de recursos computacionales y estrategias tendientes a satisfacerla. (Discusión abierta con los usuarios y posibles estrategias para aumentar la potencia de cálculo)
  • 1600: Mejorar la convivencia cuando se llena la plaza. (Consejos para utilizar los recursos de manera eficaz)
  • 1645: Pausa. (y algo para picar)
  • 1700: Todo lo que tenés que saber sobre los coprocesadores Xeon Phi. (Sesión de preguntas y respuestas a cargo de Carlos Bederián)

[Actualización]

La reunión contó con la presencia de casi 40 usuarios del cluster, colmando la capacidad de la Sala del Consejo Directivo de la FaMAF. Durante el transcurso además de tocar todos los temas referentes al HPC, se pudo disfrutar de una variada picada y bebidas carbonatadas.

img_20161031_153322        img_20161031_153659

CCAD en GTC Europe 2016

20160928_123828El Dr. Gustavo Wolfmann, integrante del CCAD-UNC, estuvo en GTC Europe 2016 desarrollado en Amsterdam el 28 y 29 del pasado mes, cuando la conferencia más importante de tecnología de procesadores gráficos pisó suelo Europeo por primera vez.

La visita sirvió para conocer lo último en tecnologías de aceleración para aprendizaje profundo como la DGX-1 (170 TFLOPS, u$s129K) y la nueva generación de procesadores integrados CPU ARM64 más GPU Volta en el SoC "Xavier" destinados al manejo automático de vehículos como el que se encuentra a espaldas de Gustavo.

Charla de Paralelismo en Telecom Personal

 

img-20161020-wa0013El viernes 20 de Octubre de 2016, el miembro del CCAD, Dr. Nicolás Wolovick dió la Techie Point #09 "Usando toda la CPU. Usando toda la GPU".

La charla recorrió todos los paralelismos disponibles tanto en CPUs como en GPUs, desde paralelismo a nivel de instrucciones hasta paralelismo a nivel de núcleos. La sesión fue una demostración hands-on sobre servidores de Alto Desempeño de como un par de programas simples como la suma de un arreglo y el cómputo de una serie, pueden exponer todos los grados de paralelismo con los que cuenta un procesador moderno.

La charla fue dada en las oficinas de Telecom Personal en Córdoba y transmitida en simultáneo a las oficinas de esa empresa en CABA. Asistieron un total de 20 personas.

Agradecemos al Ing. Jorge Mangani de Innovación y Labs por la invitación y la oportunidad de materializar esta vinculación Universidad-Empresa.

[Video]

tp-09img-20161020-wa0005

Mendieta a Pleno

Estimados usuarios,
Nos es grato anunciar que el proyecto de relocalización de parte de los equipos de cálculo y almacenamiento de datos al datacenter de la Prosecretaria Informática ha terminado. Todos los nodos de Mendieta están prendidos y por el momento funcionando de manera estable a carga completa.
20161012_todos_a_full
Dicho proyecto ha implicado el potenciamiento del cluster “mendieta” mediante la instalación de los aceleradores Xeon Phi en la partición “capability”. Los procesadores Xeon Phi ya están siendo utilizados eficientemente por algunos usuarios con muy buenos resultados y con un tiempo de espera sensiblemente menor. Además se han reemplazado los componentes hardware defectuosos del sistema de almacenamiento.
Este proyecto fue pensado en un primer momento para subsanar los problemas de filtración de agua de la antigua sala de cómputos que ocasionaron la rotura de componentes hardware con una frecuencia varias veces superior a la norma. Esta mudanza, se encuadra asimismo en el programa de ampliación de los equipos de cómputo, pues se nos ha asignado un pasillo con capacidad para alojar 16 racks suplementarios.
Dicho programa, prevé la ejecución antes de fin de año de una partida de 700.000 pesos, otorgada por el SNCAD, destinada a la compra de un nuevo sistema de almacenamiento y más nodos de cálculo.
El costo total del proyecto de relocalización ha sido de 416.347,00 pesos de los cuales 197.000,00 pesos corresponden a nuevos equipos de refrigeración y 148.000,00 pesos a la ampliación de la instalación eléctrica. Estos fondos provinieron del Rectorado y de las Facultades y Organismos socios del CCAD.
A mediano plazo probablemente tendremos otra mudanza. Ya podemos anunciar que estaremos incluidos en un nuevo edificio de la UNC con espacio para un data center grande (con capacidad para alojar supercomputadoras de la parte baja del TOP500) y para oficinas.
Quiero agradecer en nombre del Directorio del CCAD a nuestro personal (propio y prestado) que siempre están allí, para lo que sea necesario. Por las tareas más rutinarias y las que no lo son tanto. También, queremos agradecer especialmente al personal de la PSI por la ayuda brindada y por acogernos gentilmente en sus instalaciones. Finalmente, a los usuarios por la paciencia, la comprensión y la fidelidad.

Oscar Reula, Director del CCAD

Llamado a Proyectos Acelerados de Cálculo (SNCAD)

El Sistema Nacional de Supercomputación (SNCAD) anunció la disponibilidad de una gran cantidad de horas/núcleo de computación distribuidos entre sus cluters asociados. Tres (3) proyectos de 1.000.000 horas en TUPAC y seis (6) proyectos entre el resto de los centros asociados por 300.000 a 500.000 horas. ipac_2017

Para dimensionar la envergadura de los proyectos, nuestro Mendieta ha entregado aproximadamente 5.000.000 de horas/núcleo en sus 3 años de vida continua con un nivel de uso por arriba del 80% y una disponibilidad por arriba del 90%.

A los efectos de agilizar las presentaciones, los profesionales del Centro brindarán la asistencia técnica necesaria para completar las solicitudes en tiempo y forma. Por favor dirigirse a soporte@ccad.unc.edu.ar para solicitar los templates (especificar gdoc o LaTex), como así también asistencia para la redacción de las solicitudes.

Entrevista de Continental Córdoba al Dr. Oscar Reula

DSC_3206El sábado 3 de Septiembre en el programa "Ciudad Universitaria" de Continental Córdoba, el periodista Lucas Viano entrevistó al Director del CCAD-UNC por el IBM Faculty Award recibido por el Grupo de GPGPU Computing.

El Dr. Reula destacó la importancia del premio para el Grupo y recapituló la historia del CCAD y sus clusters.

(enlace a la nota original)

Mendieta tiene nueva casa

IMG_20160809_195358El cluster Mendieta ya ha sido relocalizado y puesto en funcionamiento en el Datacenter de la Prosecretaría de Informática (PSI) de la UNC.

También fue mudado el NAS que provee de almacenamiento permantente a Mendieta y a Cristina. La conexión hacia la Sala de Clusters de FCEFyN se realiza por fibra óptica y con un ancho de banda específicamente dedicado a esto.

Se aprovechó la mudanza para reconfigurar y mejorar algunos aspectos del cluster.

  • Se agregaron 14 aceleradoras Intel Xeon Phi 31S1P, de 57 núcleos a 1.1 GHz, unidades vectoriales de 512 bits de ancho y 8 GiB de RAM GDDR5. Esto incorpora 14.044 TFLOPS de potencia de cálculo de doble precisión. Las 14 placas están una en cada nodo de la ampliación de Mendieta y se configuraron en modo nativo.
  • Se movieron las 12 Tesla M2090 y las 8 Tesla K20c a los 8 nodos originales de Mendieta. Se agruparon 4 nodos con 2 K20c cada uno y 4 nodos con 3 Tesla M2090 cada uno.
  • Se actualizó la placa madre del NAS con un dual Xeon E5-2620v3 y 64 GiB de RAM. Esto le dará mayor ancho de banda y prestaciones paralelas al NAS que fuera adquirido en 2010 para el cluster Cristina.

Todo el proceso fue llevado adelante por personal del CCAD-UNC con colaboración del personal del IFEG-CONICET y del IATE-CONICET.

La nueva sala devengará en mayor estabilidad eléctrica y térmica de los equipos, mejorando aun más la disponibildad de ellos para cálculo de alto desempeño.