El genoma humano es un gran rompecabezas de palabras. La mayoría, aparentemente poco relevantes. Pero muchas de ellas son indispensables para fabricar un ser humano. Por definición, sería como nuestro gran libro de instrucciones escrito en el lenguaje del ADN, con palabras como genes y letras que encajan entre sí como en un rompecabezas.
Ahora imaginemos un puzle de la ciudad de Santiago de Compostela. En la caja, aparece la foto del reto que debemos completar uniendo las piezas. Pero con un roto en la fotografía que coincide justamente con las calles cercanas a la Catedral. Son pocas las piecitas que intervienen ahí, pero carecemos justamente de la referencia para una parte icónica del puzle. ¿Qué gracia tendría completar el rompecabezas sin el Obradoiro?
Eso es lo que ocurría hasta ahora con el mapa del genoma humano. Teníamos una versión de referencia bastante buena. Pero un 8% de las piezas se nos quedaban sin poder encajar. En mayo de 2021, un equipo internacional publicó una nueva versión de nuestro mapa de instrucciones genéticas en un borrador o ‘preprint’.
Ahora, después de meses de revisión, ha quedado publicado y ‘validado’ ese genoma del cromosoma X en la revista Science. Y esto es relevante para saber dos cosas: ¿Quienes somos? ¿Cómo (no) funcionamos? Identidad y enfermedad.
“Estas partes del genoma humano que no hemos podido estudiar durante más de 20 años son importantes para nuestra comprensión de cómo funciona, las enfermedades genéticas, la diversidad y evolución humana”, explica desde Santa Cruz, en California, la biotecnóloga Karen Miga (UC-SC), coautora de este trabajo. Muchas de las regiones recientemente reveladas tienen funciones importantes en el genoma, incluso si no incluyen genes activos.
Genoma humano: 400 millones de letras nuevas en el libro de la vida
El nuevo genoma de referencia, llamado T2T-CHM13, agrega casi 200 millones de pares de bases. Es decir, 200 millones de parejas de letras que se unen para formar ‘palabras’ en forma de 99 genes que no éramos capaces de secuenciar. Esas palabras dan instrucciones para fabricar proteínas. Y estsa, estructuras de nuestro organismo, desde unos ojos al pelo. El color de ambos –por ejemplo– vendrá determinado por un 0,01% de genoma que varia de una persona a otra.
El biotecnólogo e investigador de enfermedades raras de base genética Lluís Montoliu valora este avance, que ha puesto de relieve el éxito de la técnica empleada para llegar a esas regiones ignotas. “El genoma de referencia es esencial para cualquier análisis genético que queramos hacer. Nosotros podemos secuenciar el genoma de muchas personas pero si queremos saber la causa de una enfermedad de base genética lo que queremos saber es el cambio, esa letra distinta que tiene esa persona respecto a un genoma de referencia”.
Genes hasta ahora ignorados parecen tener funciones importantes.
Genes hasta ahora ignorados seguramente sirvan para producir proteínas, aún no estamos seguros. La nueva versión del genoma humano también corrige miles de errores estructurales en la secuencia de referencia actual. Los vacíos que ahora llena la nueva referencia incluyen los brazos cortos completos de cinco cromosomas (paquetes de ADN). También cubren algunas de las regiones más complejas del genoma.
Entre las partes interesantes que faltaban están secuencias de ADN altamente repetitivas. Esto es, zonas donde, al rastrear qué hay, se observan cadenas de letras (bases) del estilo ‘ATATATATAT…’. Esto supone un problema, que el bioingeniero e informático Adam Phillippy compara con las piezas de un puzle que se corresponden con un cielo. Todas son azules, ¿dónde encajan exactamente? ¿Cómo las dintinguimos?
Este tipo de huecos y falta de información era una de las debilidades con que nació el primer molde del genoma humano, allá por 2000. Pero la doctora Miga precisa que, incluso en las versiones mejoradas, aún era muy difícil secuenciar partes concretas, apretadas en el centro de los cromosomas o en los extremos de sus brazos, los telómeros. Regiones nada baladíes para comprender el desarrollo de ciertas enfermedades o el proceso del envejecimiento.
“Nos estamos dando cuenta de que hay mucha variación humana”, añade la genetista Rachel O’Neill, directora del Instituto de Genómica de Sistemas de la Universidad de Connecticut. Contra lo intuitivo, “la variación proviene en gran parte de las repeticiones”. Y es que, aunque tengamos un molde de referencia que compartimos el 99,9% todos los humanos, en los detalles está el diablo de las enfermedades y los rasgos particulares de cada cual.
No hay un genoma humano, hay muchos humanos distintos con su genoma
El nuevo genoma de referencia T2T complementará el genoma de referencia humano estándar, (Genome Reference Consortium build 38), que tuvo su origen en el Proyecto Genoma Humano financiado con fondos públicos y se ha actualizado continuamente desde el primer borrador en 2000. Por ahora, los biotecnólogos como Montoliu, seguirán empleando por ahora la versión de 2013. Si el Consorcio finalmente, a nivel internacional, lo considera el ‘nuevo estándar’, se generalizará su uso.
“Estamos agregando un segundo genoma completo y luego habrá más”, añade David Haussler desde la UC-SC. “La siguiente fase es pensar en la referencia del genoma de la humanidad como si no fuera una sola secuencia del genoma. Esta es una transición profunda, el presagio de una nueva era en la que finalmente captaremos la diversidad humana de manera imparcial”.
En este sentido, Montoliu recalca que ”no hay un genoma humano, sino múltiples genomas humanos”. Aunque compartamos el 99,9% del genoma entre humanos, en ese 0,1% puede haber variaciones interesantes, que no tienen por qué considerarse anomalías.
Ejemplifica el biotecnólogo que “lo que quizá en un grupo de población sería considerado una mutación, en otro puede ser una variación poblacional y no va a tener ese significado patológico”. Por eso es importante que “si vamos a diagnosticar una enfermedad rara, si trabajamos con pacientes con familias españolas, es importante que tengamos un genoma de referencia que recoja la variabilidad intrínseca que hay en la población española”.
Montoliu, que celebra el avance (aunque “no es nuevo”), recuerda los retos pendientes: la nueva técnica empleada es muy rápida pero puede dejar escapar más errores; hay siempre un margen para pensar que una mutación concreta se considere una anomalía si nuestro patrón de referencia está alejado de nuestro grupo de población; y sólo se ha secuenciado el genoma del cromosoma X, el femenino.