El conocimiento científico crece gracias a la labor de miles de personas que se esfuerzan, hasta el agotamiento, por encontrar respuestas a los enigmas que plantea la Naturaleza. En cada programa un científico conversa con Ángel Rodríguez Lozano y abre para nosotros las puertas de un campo del conocimiento.
Imagina que cada célula de tu cuerpo es una fábrica en miniatura, constantemente trabajando para mantenerte vivo y en funcionamiento. Dentro de esta fábrica, hay un conjunto completo de instrucciones, el ADN, que contiene los planos necesarios para construir y operar la célula. Para que las instrucciones almacenadas en el ADN sean útiles, es necesario que puedan ser leídas y ejecutadas sin alterar la información original. Eso se consigue con el ARN. Cuando la célula quiere poner en marcha la fabricación de una proteína, facilita que la información contenida en un gen sea copiada en ARN. Esa copia se mueve por la célula como un mensajero que lleva la información hasta las partes donde se fabrica la proteína.
Ese mecanismo se repite cada vez que un gen entra en funcionamiento y provoca la existencia de un gran número de ARN que deambulan por la célula al mismo tiempo, formando un conjunto que se conoce como transcriptoma, una palabra compuesta por ‘transcripto’, que significa ‘copiar’, y el sufijo ‘-oma’, utilizado en biología para denotar una colección completa de algo en un organismo.
Al igual que el ADN, cada ARN está codificado con cuatro letras químicas (aunque una de las letras es distinta a las del ADN). Estas cuatro moléculas están colocadas secuencialmente como las letras de un alfabeto forman palabras, unas palabras genéticas que contienen, por ejemplo, la fórmula de una proteína. Cada ARN está formado por una cadena que puede tener centenares o miles de letras ordenadas, un orden que los científicos se esfuerzan por leer. Sin embargo, lograr esa lectura es una empresa difícil, como comenta nuestra invitada en Hablando con Científicos, Ana Conesa, investigadora del CSIC en el Instituto de Biología Integrativa de Sistemas (CSIC-UV).
Para lograr la lectura del transcriptoma de una célula, a lo largo de los últimos años se han ido desarrollando distintas técnicas que compiten entre sí por obtener los mejores resultados. Unos métodos se basan en la lectura de secuencias cortas de letras, lo que obliga a “trocear” el ARN en pedazos pequeños, leer esos trozos y, posteriormente, utilizar métodos informáticos sofisticados para unirlos de nuevo y recuperar la información. Estos métodos de lectura corta plantean problemas cuando existen secuencias de letras repetidas que posteriormente son difíciles de enlazar en su posición correcta durante la reconstrucción. Frente a estos métodos, se han desarrollado otros basados en la secuenciación de ARN de cadenas largas que permiten una captura y lectura de mayor tamaño.
Para evaluar la eficacia de los enfoques de lectura larga en el análisis del transcriptoma, se creó el Consorcio para la Evaluación del Proyecto de Anotación Genómica de ARN-Seq de Lectura Larga, al que pertenece Ana Conesa. Utilizando diferentes protocolos y plataformas de secuenciación, el consorcio generó más de 427 millones de secuencias de lectura larga a partir de conjuntos de datos de ADN complementario y ARN directo, que abarcan especies humanas, de ratones y de manatíes. Tanto del humano como del ratón existen bibliotecas de secuencias realizadas que sirven de referencia para cotejar los resultados obtenidos por los distintos métodos. Sobre el manatí, en cambio, no existen tales bibliotecas y por lo tanto sus datos permitían detectar secuencias nuevas. Esos datos fueron puestos a disposición de los científicos para que realizaran la lectura utilizando los distintos métodos que disponían en sus laboratorios.
Los resultados del estudio han sido publicados en Nature Methods en un artículo titulado “Systematic assessment of long-read RNA-seq methods for transcript identification and quantification”. El estudio reveló que las bibliotecas con secuencias más largas y precisas producen transcripciones más exactas que aquellas con mayor profundidad de lectura, mientras que una mayor profundidad de lectura mejoró la precisión de la cuantificación.
La discusión del artículo resalta que la cantidad de lecturas no siempre lleva a transcritos más precisos, subrayando la importancia de la calidad y longitud de las lecturas. La elección de la herramienta de análisis influye notablemente en los resultados, con algunas que favorecen transcritos conocidos y otras que son más sensibles a nuevos transcritos. Se reconoce que la anotación de transcritos nuevos sigue siendo un desafío, con resultados inconsistentes que indican la necesidad de un mayor desarrollo de herramientas.
La validación experimental demostró la efectividad de los métodos de lectura larga para descubrir la complejidad del transcriptoma en organismos no modelos. El estudio concluye que es crucial seguir evaluando y desarrollando herramientas de secuenciación de ARN de larga lectura para mejorar la precisión y la eficacia en la identificación y cuantificación de transcritos.
Referencia:
Pardo-Palacios, FJ, Wang, D., Reese, F. et al. Evaluación sistemática de métodos de secuenciación de ARN de lectura larga para la identificación y cuantificación de transcripciones. Nat Methods (2024). https://doi.org/10.1038/s41592-024-02298-3
Apoya a CienciaEs haciéndote MECENAS con una donación periódica o puntual.
40,8 millones de audios servidos desde 2009
Agradecemos la donación de:
Angel Quelle Russo
“Vuestra labor de divulgación de la ciencia y en particular del apoyo a los científicos españoles me parece muy necesario e importante. Enhorabuena.”
Angel Rodríguez Díaz
“Seguid así”
Anónimo
Mauro Mas Pujo
Maria Tuixen Benet
“Nos encanta Hablando con Científicos y el Zoo de Fósiles. Gracias.”
Daniel Dominguez Morales
“Muchas gracias por su dedicación.”
Anónimo
Jorge Andres-Martin
Daniel Cesar Roman
“Mecenas”
José Manuel Illescas Villa
“Gracias por vuestra gran labor”
Ulrich Menzefrike
“Donación porque me gustan sus podcasts”
Francisco Ramos
Emilio Rubio Rigo
Vicente Manuel CerezaClemente
“Linfocito Tcd8”
Enrique González González
“Gracias por vuestro trabajo.”
Andreu Salva Pages
Emilio Pérez Mayuet
“Muchas gracias por vuestro trabajo”
Daniel Navarro Pons
“Por estos programas tan intersantes”
Luis Sánchez Marín
Jesús Royo Arpón
“Soy de letras, sigo reciclándome”