Desentrañar el ADN de las poblaciones argentinas: el CCAD participa de PoblAr

El Centro de Computación de Alto Desempeño de la UNC colabora en el procesamiento de datos genómicos recolectados en diversos puntos del territorio argentino, con el fin de constituir el primer biobanco del país.

Desde la conquista de América y el establecimiento de colonias en el continente, se inició un proceso de mestizaje entre las poblaciones indígenas, los conquistadores europeos (principalmente españoles en el caso de Argentina) y las poblaciones africanas capturadas y traídas a la región como esclavos. Posteriormente, los movimientos migratorios masivos contribuyeron a modificar la diversidad cultural, fenotípica y genética latinoamericana1

Como consecuencia de esta historia tumultuosa, Argentina es hoy un territorio compuesto por personas que descendemos de diferentes grupos étnicos y de los múltiples cruces que surgieron entre ellos. Se presupone, entonces, que nuestra composición genética es sumamente compleja y diversa. Sin embargo, conocemos muy poco al respecto porque, hasta hace no mucho tiempo, los biobancos que cuentan con datos genéticos que existían procedían en su gran mayoría de los países centrales con un claro sesgo hacía la ancestría genética europea. PoblAr llegó para revertir esta situación en nuestro país. 

“El Programa de referencia y biobanco genómico de la población argentina (PoblAr), que depende de la Secretaría de Planeamiento y Políticas en Ciencia, Tecnología e Innovación del MINCyT, tiene por objetivo fortalecer los lazos entre miembros de la comunidad científica y especialistas de la salud de todo el país para conformar un biobanco de referencia genómica y de metadatos asociados de la población argentina con el fin de fomentar la investigación científica con potencial beneficio para la población local”, según señalan en su página web.

PoblAr “busca constituirse como el primer repositorio de datos genéticos, hábitos alimentarios y de estilo de vida, y características fenotípicas y sociales de interés biomédico específicos y característicos de las poblaciones de Argentina”.

El programa se estructura en distintos nodos donde se recolectan muestras de personas donantes, distribuidos en distintas regiones del país. Posteriormente, el Nodo Digital se encarga del procesamiento de los datos generados. Justamente, en este último participa el Centro de Computación de Alto Desempeño (CCAD, UNC). “El CCAD es un recurso primordial para las actividades del Nodo Digital, y su política de libre acceso para cualquier integrante del sistema científico nacional se alinea con el espíritu federalista que anima PoblAr”, asegura Pierre Luisi, responsable del Nodo Digital del PoblAr y referente en bioinformática.

“El principal desafío computacional que enfrentamos en el Nodo Digital es acerca del procesamiento de los datos genómicos. En una primera fase, se están generando con secuenciación de alto rendimiento genomas completos a alta y baja cobertura. La cobertura de profundidad de un genoma se refiere al número de veces que se lee cada nucleótido (de los 3000 millones que componen el genoma humano) durante la secuenciación. Una mayor profundidad de cobertura aumenta la confianza en los resultados finales ya que la profundidad de cobertura ayuda a diferenciar las variantes genéticas reales de los errores de secuenciación. En la primera fase, vamos a generar genomas con profundidad de cobertura promedio de 30 (es decir en la jerga de la genómica, genomas a 30X)”, explica el científico, matemático de formación, doctor en biomedicina y especialista en el análisis de datos genómicos de las poblaciones humanas.

Además, agrega que “generar genomas a tan alta profundidad es muy costoso, y se está comprobando la viabilidad para nuestras poblaciones de una alternativa mucho menos costosa que consiste en generar genomas a muy baja cobertura (a 1X) que no permite leer directamente los genomas de los individuos pero sí proceder a una estimación de los mismos mediante un algoritmo de inteligencia artificial entrenado con miles de genomas de referencia. Tanto el procesamiento de genomas a alta profundidad como la aplicación del algoritmo para genomas de baja profundidad requieren grandes capacidades computacionales, que serán aportadas desde el CCAD. Por esta razón, el Centro de Computación de Alto Desempeño es un recurso primordial para las actividades del Nodo Digital, y su política de libre acceso para cualquier integrante del sistema científico nacional, se alinea con el espíritu federal que anima PoblAr”.

Por su parte, Nicolás Wolovick expresa que “PoblAr es un proyecto de alto impacto, así que lo apoyamos en todo lo que se pueda. Queremos que donde haya una necesidad de cómputo, ésta se satisfaga y claramente PoblAr la tiene. Estamos muy contentos de poder ser el músculo computacional del Programa y que este proyecto haga uso intensivo de recursos de computación de alto desempeño. Esta colaboración está siendo virtuosa, vamos a seguir apostando por este tipo de proyectos que de maneras muy directas mejoran la calidad de vida de los y las habitantes de Argentina”.

“El convenio entre PoblAr y el CCAD abre entonces la oportunidad de implementar localmente las técnicas de secuenciación, genotipificación masiva y análisis bioinformáticos, y así reducir el sesgo histórico en la implementación de estas herramientas a nivel nacional”, concluye Luisi.

  1. Una gran parte de los inmigrantes en Argentina procedía de países europeos como Italia, España, Alemania, Gran Bretaña, Rusia, Polonia, Francia y Eslovenia, entre otros, pero también de países del Levante (principalmente Líbano y Siria), el Cáucaso (Armenia), Asia y el norte de África (Egipto y Marruecos). En cuanto a los orígenes genéticos africanos en nuestro país, los registros históricos sobre la llegada de esclavos africanos al Río de la Plata muestran que Luanda, en el actual territorio de Angola, en la región centro-occidental de África, fue el principal puerto de salida, seguido de puertos situados en el Golfo de Guinea y en la costa de los actuales territorios de Senegal, Gambia y Sierra Leona. Las costas del océano Índico, en el actual territorio de Mozambique, también eran un importante lugar de salida. Sin embargo, el puerto de salida es un mal indicador para deducir el origen real de los esclavos. En cuanto al componente indígena, es difícil estudiar su origen centrándose en las comunidades actuales, ya que su organización ha cambiado drásticamente tras la llegada de los primeros conquistadores en el siglo XVI. Durante el periodo de conquista y colonización, las guerras, las enfermedades y los trabajos forzados diezmaron las poblaciones nativas. El sistema de explotación colonial también supuso a menudo la reubicación de individuos, familias y comunidades. Después, la expansión del Estado-nación a finales del siglo XIX puede describirse como un proceso de anexión territorial y subyugación de los pueblos indígenas perpetrado por las fuerzas armadas nacionales argentinas entre 1876 y 1917. ↩︎