¿qué es el cis en biologia?
Transcripción
Los elementos cis-reguladores (CREs) o módulos cis-reguladores (CRMs) son regiones de ADN no codificante que regulan la transcripción de genes vecinos. Los CRE son componentes vitales de las redes de regulación genética, que a su vez controlan la morfogénesis, el desarrollo de la anatomía y otros aspectos del desarrollo embrionario, estudiados en la biología evolutiva del desarrollo.
Los CRE se encuentran en las proximidades de los genes que regulan. Los CRE suelen regular la transcripción de los genes uniéndose a factores de transcripción. Un solo factor de transcripción puede unirse a muchos CRE y, por tanto, controlar la expresión de muchos genes (pleiotropía). El prefijo latino cis significa «en este lado», es decir, en la misma molécula de ADN que el gen o los genes que se van a transcribir.
Los CRM son tramos de ADN, normalmente de 100 a 1000 pares de bases de ADN,[1] en los que varios factores de transcripción pueden unirse y regular la expresión de genes cercanos y regular sus tasas de transcripción. Se denominan cis porque suelen estar situados en la misma cadena de ADN que los genes que controlan, en contraposición a los trans, que se refieren a los efectos sobre los genes no situados en la misma cadena o más alejados, como los factores de transcripción. [1] Un elemento regulador cis puede regular varios genes,[2] y a la inversa, un gen puede tener varios módulos reguladores cis[3] Los módulos reguladores cis llevan a cabo su función integrando los factores de transcripción activos y los cofactores asociados en un momento y lugar específicos de la célula donde se lee esta información y se da una salida[4].
Factores de acción cis
ResumenLa expresión génica rige el destino de las células y se regula mediante una compleja interacción de factores de transcripción y moléculas que modifican la estructura de la cromatina. Los avances en los ensayos basados en la secuenciación han permitido investigar estos procesos en todo el genoma, dando lugar a grandes conjuntos de datos que combinan información sobre la dinámica de la expresión génica, la unión de factores de transcripción y la estructura de la cromatina a medida que las células se diferencian. Mientras que numerosos estudios se centran en los efectos de estas características en la regulación génica más amplia, se ha trabajado menos en los mecanismos de control transcripcional específicos de los genes. En este estudio, nos hemos centrado en esto último integrando datos de expresión génica para la diferenciación in vitro de células ES murinas a macrófagos y cardiomiocitos, con datos dinámicos sobre la estructura de la cromatina, la epigenética y la unión de factores de transcripción. Combinando una estrategia novedosa para identificar comunidades de elementos de control relacionados con un enfoque de regresión penalizada, desarrollamos modelos individuales para identificar los elementos de control potenciales que predicen la expresión de cada gen. Nuestros modelos se compararon con un método existente y se evaluaron utilizando la literatura existente y nuevos datos experimentales de ensayos de diferenciación de células madre embrionarias. Nuestro método es capaz de identificar elementos de control transcripcional de forma específica para cada gen que reflejan relaciones reguladoras conocidas y de generar hipótesis útiles para su comprobación posterior.
Factor de transcripción
La evolución de las secuencias cis-reguladoras depende de cómo afectan a la expresión de los genes y motiva tanto la identificación como la predicción de las variantes cis-reguladoras responsables de las diferencias de expresión dentro de las especies y entre ellas. Aunque se ha avanzado mucho en la relación de las variantes cis-reguladoras con los niveles de expresión, el momento de la activación y represión de los genes también puede ser importante para la evolución de las secuencias cis-reguladoras. Hemos investigado la dinámica de la expresión alelo-específica (ASE) dentro y entre las especies de Saccharomyces durante el cambio diauxico y hemos encontrado una variación apreciable en la dinámica de la expresión génica. La ASE dentro de las especies está asociada a las variantes intergénicas, y la dinámica de la ASE está más fuertemente asociada a las inserciones y deleciones que a los niveles de ASE. Para perfeccionar estas asociaciones, utilizamos un ensayo reportero de alto rendimiento para analizar regiones promotoras y variantes individuales. Dentro del subconjunto de regiones que recapitulaban la expresión endógena, identificamos y caracterizamos las variantes cis-reguladoras que afectan a la dinámica de expresión. Entre las especies, las regiones promotoras quiméricas generan patrones novedosos e indican restricciones en la evolución de la dinámica de la expresión génica. Concluimos que los cambios en las secuencias cis-reguladoras pueden afinar la dinámica de la expresión génica y que la interacción entre la dinámica de la expresión y otros aspectos de la misma es relevante para la evolución de las secuencias cis-reguladoras.
Promotor
y se determinó si el indicador binario de presencia de motivos explicaba significativamente más la varianza que un modelo reducido sin el indicador mediante una prueba de razón de verosimilitud (archivo adicional 3: tabla S5). Utilizamos el paquete Python statsmodels [49] para ejecutar todos los modelos lineales. Se pueden encontrar más detalles en el Archivo Adicional 1: Métodos Suplementarios (sección Finding motifs predictive of MPRA activity).Finding motifs associated with cis and trans effectsPara cada motivo, ajustamos un modelo lineal a los tamaños absolutos del efecto cis a través de todos los pares de secuencias como sigue:
Para cada motivo, ajustamos un modelo lineal a los tamaños de los efectos trans en todas las secuencias de la siguiente manera:
Los datos de secuenciación MPRA y los datos genómicos de ARN-seq de este estudio se han presentado al NCBI Gene Expression Omnibus (GEO; http://www.ncbi.nlm.nih.gov/geo/) con el número de acceso GSE140574 [58]. Todos los scripts necesarios para reproducir este trabajo están disponibles en GitHub en https://github.com/kmattioli/2019__cis_trans_MPRA y están archivados en Zenodo en https://doi.org/10.5281/zenodo.3862824 [59]. El código es de código abierto y está publicado bajo la licencia MIT.