Maestría en Estadística Aplicada y el CCAD organizan el Curso de Posgrado «R en el CCAD«.
Disertantes:
Lic. Juan Cruz Rodriguez. CIDIE-CONICET, FaMAF-UNC
Lic. Marcos Mazzini. CCAD, CONICET, IFEG, FaMAF
Fecha y horario de dictado: 20 y 21 de marzo y 24 y 25 de abril de 2019. 17.00 a 19.00 horas.
Lugar: auditorio 1 Escuela de Graduados de la Facultad de Ciencias Económicas. Bv. De la Reforma esquina Av. Los Nogales. Ciudad Universitaria.
Aranceles: arancel General: $ 500. Alumnos, ex-alumnos y docentes de la Maestría en Estadística Aplicada: sin cargo.
Temas: uso no interactivo de R. Conexión remota al cluster de cómputo del CCAD. Cómo lanzar simulaciones en el cluster: sistema de colas SLURM. Paralelizar código R – mcapply/parLapply (windows).
Inscripciones: dirigirse a maestria.estadistica.unc@gmail.com
Programa
Clase 1: miércoles 20 de marzo de 2019
Limitaciones de una computadora de escritorio.
Uso interactivo de R vs uso no interactivo.
Rscript: como invocarlo y pasar parámetros a un script.
Conexión remota al cluster, diferenciar cabecera y nodos de cómputo.
Sistema de Colas, ejemplo de submit básico y comandos útiles: sinfo, squeue.
Clase 2: jueves 21 de marzo
¿Qué paralelizar? Cómo elegir el bloque de código a paralelizar.
Utilizar parámetros de línea de comando dentro de mi script R.
For a apply: Cómo traducir un ciclo “for” a uno de la familia “apply”. guarda, return, scope.
mclapply: Paralelizando.
parLapply: Paralelizando en Windows.
Clase 3: miércoles 24 de abril
Hands-on: Acceso remoto al cluster del CCAD Paralelización: conceptos de memoria compartida y memoria distribuida.
Ley de Amdahl: parte paralela y secuencial de un código.
Características de los nodos del CCAD: arquitectura, cantidad de cores, RAM, conectividad, almacenamiento.
SLURM: script de submit para varios cores.
SLURM: script de submit para fat node (mas RAM).
SLURM: enviar varias copias de la misma tarea con distinto input.
Clase 4: jueves 25 de abril
Secuencial a CCAD: Taller colaborativo, llevando mi script a correr en paralelo en el CCAD.
Clusters y R: ¿Cómo utilizar múltiples nodos? Intro a Rmpi.
Matrices masivas y R: ¿Cómo manejar matrices masivas con poca RAM? Intro a bigmemory.
Coordinador Académico: Dr. Nicolás Wolovick. Prof. Asociado FaMAF-UNC. Miembro del CCAD-UNC.
Actualización