La Universitat y el CSIC analizan una nueva técnica de secuenciación génica que ayuda a descifrar enfermedades como el cáncer

Un <i>flowcell</i> o cámara de flujo, elemento de secuenciación transcriptómica de lecturas largas mediante Nanoporos, evaluado por el equipo del I2SysBio (CSIC – Universitat de València). Créditos: Pablo Atienza.»></p>
<div class=Un flowcell o cámara de flujo, elemento de secuenciación transcriptómica de lecturas largas mediante Nanoporos, evaluado por el equipo del I2SysBio (CSIC – Universitat de València). Créditos: Pablo Atienza.

Científicas del Instituto de Biología Integrativa de Sistemas (I2SysBio), centro mixto del Consejo Superior de Investigaciones Científicas (CSIC) y la Universitat de València (UV), han publicado una revisión de la tecnología de secuenciación transcriptómica de lectura larga, la cual permite analizar con más precisión que los métodos tradicionales las moléculas de ARN presentes en todas las células y que contienen información genética esencial para la vida. Esta técnica resulta fundamental para comprender mejor el envejecimiento, las enfermedades neurodegenerativas o el cáncer. El artículo ha sido publicado en la revista “Nature Reviews Genetics”.

La transcriptómica engloba el estudio de todas las moléculas de ARN (ácido ribonucleico) presentes en una célula o tejido. Estas son moléculas intermedias entre el ADN y las proteínas. Si bien el ADN contiene la información genética, el ARN es el que permite la síntesis de proteínas y que la información sea comprendida por las células. Permite entender qué genes están activos en un momento concreto y cuál es su grado de activación en los diferentes organismos, lo que es clave para comprender el origen y desarrollo de muchas enfermedades humanas. También se puede utilizar para estudiar las plantas resistentes a la sequía o al calor, para examinar organismos menos estudiados como los virus y bacterias, e incluso fue utilizada por el personal científico del CSIC que visitó recientemente la Antártida parar estudiar la gripe aviar.

Según explica Ana Conesa, profesora de investigación del CSIC en el I2SysBio, “con esta investigación hemos provisto a la comunidad científica de una guía esencial para comprender la tecnología de secuenciación transcriptómica de lectura larga, tanto los flujos de trabajo experimentales como los análisis computacionales. Presentamos una visión integral de las técnicas de secuenciación de ARN de lectura larga y abarcamos desde el diseño experimental hasta el procesamiento de datos, la identificación de las diferentes moléculas de ARN y los análisis posteriores”.

Hasta hace pocos años, la transcriptómica se estudiaba utilizando la secuenciación con lecturas cortas, lo cual implicaba romper las moléculas de ARN en fragmentos pequeños de entre 50 y 300 nucleótidos, unidades básicas de los ácidos nucleicos ADN y ARN (las famosas letras ATCG). Esto implicaba que para averiguar cuál era la molécula original de ARN, se tenía que reconstruir el puzle de fragmentos de ARN, lo que ocasionaba gran cantidad de errores, al haber secuencias muy similares entre ARNs.

Como explica la también investigadora del CSIC en el I2SysBio Carolina Monzó, “la secuenciación con lecturas largas lee fragmentos de miles de nucleótidos, lo que permite secuenciar moléculas completas y estudiar el ARN sin necesidad de hacer puzles. Además, al secuenciar moléculas de ARN una a una, las lecturas largas posibilitan identificar sus pequeñas modificaciones, lo que se denomina epitranscriptómica, que son fundamentales para su función. Esto no era posible con las tecnologías anteriores”.

 

Aplicaciones científicas

Al obtener secuencias de moléculas completas de ARN, esta tecnología facilita todo tipo de aplicaciones y estudios en los que es importante conocer de manera precisa la composición y estructura del ARN. Por ejemplo: la expresión de isoformas (diferentes formas de ARN proveniente del mismo gen), el descubrimiento de nuevas formas de ARN, la anotación de genes en genomas de especies poco estudiadas o el estudio de la expresión diferencial de ARN entre el producido por el cromosoma heredado del padre y el cromosoma heredado de la madre, entre otros.

Según detalla Monzó, “estos estudios tienen interés porque podrían contribuir al avance en la comprensión de enfermedades neuropsiquiátricas y neurodegenerativas. En estos momentos, se sabe que existen diferencias en la isoforma expresada en diversas regiones del cerebro y que están asociadas con múltiples complicaciones neuronales”.

En el artículo, también ha participado Tianyuan Liu, estudiante predoctoral del Grupo de Genómica de la Expresión Génica en el I2SysBio (CSIC – Universitat de València). Actualmente, cuenta con un contrato predoctoral, en el marco de la beca Marie Skłodowska-Curie Actions Doctoral Network LongTREC de la Unión Europea.

 

Referencia: Monzó, C., Liu, T. & Conesa, A.  Transcriptomics in the era of long-read sequencing. Nat Rev Genet (2025). DOI: https://doi.org/10.1038/s41576-025-00828-z