ADN no codificante

Las secuencias de ADN no codificante son componentes del ácido desoxirribonucleico de un organismo que no codifican secuencias de proteínas. Parte del ADN no codificante se transcribe en moléculas de ARN no codificantes funcionales (por ejemplo, ARN de transferencia, ARN ribosómico y ARN regulador). Otras funciones del ADN no codificante incluyen: la regulación transcripcional y traduccional de secuencias codificantes de proteínas, las regiones de unión de andamios, los orígenes de replicación de ADN, los centrómeros y los  telómeros.[1][2]

La cantidad de ADN no codificante varía mucho entre especies. A menudo, solo un pequeño porcentaje del genoma es responsable de codificar las proteínas, pero se muestra que un porcentaje creciente de ese ADN tiene funciones reguladoras. Cuando hay mucho ADN no codificante, una gran proporción de él parecería no tener función biológica, como se postuló en la década de 1960. Desde entonces, esta porción no funcional ha sido controvertidamente llamada "ADN basura".[3]

El proyecto internacional Encyclopedia of DNA Elements (ENCODE) descubrió, mediante enfoques bioquímicos directos, que al menos el 80% del ADN del genoma humano tiene actividad bioquímica.[4]​ Aunque esto no fue inesperado debido a décadas anteriores de investigación que descubrieron muchas regiones no codificantes funcionales,[5]​ algunos científicos criticaron la conclusión por combinar la actividad bioquímica con la función biológica.[6][7][8][9][10]​ Las estimaciones para la fracción biológicamente funcional del genoma humano basadas en genómica comparativa oscilan entre 8 y 15%.[11][12][13]​ Sin embargo, otros han argumentado en contra de confiar únicamente en estimaciones de genómica comparativa debido a su alcance limitado. Se ha descubierto que el ADN no codificante, está involucrado en la actividad epigenética y en redes complejas de interacciones genéticas y se está explorando en la biología evolutiva del desarrollo.[14][15][16]

Fracción de ADN genómico no codificante

Utricularia gibba tiene solo un 3% de ADN no codificante.[17]

La cantidad de ADN genómico total varía ampliamente entre los organismos, y la proporción de ADN codificante y no codificante dentro de estos genomas también varía enormemente. Por ejemplo, originalmente se sugirió que más del 98% del genoma humano no codifica secuencias de proteínas, incluidas la mayoría de las secuencias dentro de los intrones y la mayoría del ADN intergénico,[18]​ mientras que el 20% de un genoma procariota típico no se codifica.[5]

En las eucariotas, el tamaño del genoma, y por extensión la cantidad de ADN no codificante, no está correlacionado con la complejidad del organismo, una observación conocida como el enigma de valor C.[19]​ Por ejemplo, se ha informado que el genoma del Polychaos dubium unicelular (anteriormente conocido como Amoeba dubia) contiene más de 200 veces la cantidad de ADN en humanos.[20]​ El genoma del pez globo Takifugu rubripes tiene solo un octavo del tamaño del genoma humano, pero parece tener un número comparable de genes; aproximadamente el 90% del genoma de Takifugu es ADN no codificante.[18]​ Por lo tanto, la mayor parte de la diferencia en el tamaño del genoma no se debe a la variación en la cantidad de ADN codificante, sino a una diferencia en la cantidad de ADN no codificante.

En 2013, se descubrió un nuevo "registro" para el genoma eucariota más eficiente con Utricularia gibba, que tiene solo un 3% de ADN no codificante y un 97% de ADN codificante. La planta estaba eliminando partes del ADN no codificante y esto sugirió que el ADN no codificador puede no ser tan crítico para las plantas, aunque el ADN no codificante sea útil para los humanos.[17]​ Otros estudios en plantas han descubierto funciones cruciales en porciones de ADN no codificante que anteriormente se consideraba insignificante y han agregado una nueva capa a la comprensión de la regulación génica.[21]

Tipos de secuencias de ADN no codificantes

Elementos cis y transregulatorios

Los elementos reguladores de cis son secuencias que controlan la transcripción de un gen cercano. Muchos de estos elementos están involucrados en la evolución y el control del desarrollo.[22]​ Los elementos cis pueden estar ubicados en regiones no traducidas 5' o 3' o dentro de intrones. Los elementos transreguladores controlan la transcripción de un gen distante.

Los promotores facilitan la transcripción de un gen particular y están típicamente aguas arriba de la región de codificación. Las secuencias potenciadoras también pueden ejercer efectos muy distantes sobre los niveles de transcripción de genes.[23]

Intrones

Los intrones son secciones no codificantes de un gen, transcritas en la secuencia precursora de ARNm, pero finalmente eliminadas por empalme de ARN durante el procesamiento para madurar ARN mensajero. Muchos intrones parecen ser elementos genéticos móviles.[24]

Los estudios de intrones del grupo I de los protozoos de Tetrahymena indican que algunos intrones parecen ser elementos genéticos egoístas, neutrales para el huésped porque se eliminan de los exones flanqueantes durante el procesamiento del ARN y no producen un sesgo de expresión entre alelos con y sin el intrón.[24]​ Algunos intrones parecen tener una función biológica significativa, posiblemente a través de la funcionalidad de la ribozima que puede regular la actividad de ARNt y ARNr, así como la expresión de genes que codifican proteínas, evidente en los huéspedes que se han vuelto dependientes de tales intrones durante largos períodos de tiempo; por ejemplo, el intrón trnL se encuentra en todas las plantas verdes y parece haber sido heredado verticalmente durante varios miles de millones de años, incluidos más de mil millones de años dentro de los cloroplastos y otros 2-3 billones de años antes en los ancestros cianobacterianos de los cloroplastos.

Ilustración simple de un precursor de ARNm no empalmado, con dos intrones y tres exones (arriba). Después de que los intrones se hayan eliminado mediante empalme, la secuencia de ARNm maduro está lista para la traducción (abajo).

Pseudogenes

Los pseudogenes son secuencias de ADN, relacionadas con Genes conocidos, que han perdido su capacidad de codificación de proteínas o ya no se expresan en la célula. Los pseudogenes surgen de la retrotransposición o la duplicación genómica de genes funcionales, y se convierten en "fósiles genómicos" que no funcionan debido a mutaciones que impiden la transcripción del gen, como dentro de la región promotora del gen, o alteran fatalmente la traducción del gen, como codones de parada prematura o cambios de marco.[25]​ Los pseudogenes resultantes de la retrotransposición de un ARN intermedio se conocen como pseudogenes procesados; los pseudogenes que surgen de los restos genómicos de genes duplicados o residuos de genes inactivados son pseudogenes no procesados. transposiciones de genes mitocondriales que alguna vez fueron funcionales desde el citoplasma al núcleo, también conocidos como NUMT, también califican como un tipo de pseudogén común.[26]​ Números ocurren en muchos taxones eucariotas.

Si bien la Ley de Dollo sugiere que la pérdida de función en los pseudogenes es probablemente permanente, los genes silenciados pueden retener la función durante varios millones de años y pueden "reactivarse" en secuencias codificantes de proteínas[27]​ y se transcribe activamente un número sustancial de pseudogenes.[25][28]​ Debido a que se presume que los pseudogenes cambian sin restricción evolutiva, pueden servir como un modelo útil del tipo y las frecuencias de diversas mutaciones genéticas espontáneas.[29]

Secuencias repetidas, transposones y elementos virales

Elementos genéticos móviles en la célula (izquierda) y cómo se pueden adquirir (derecha)

Los transposones y retrotransposones son elementos genéticos móviles. Las secuencias repetidas de retrotransposón, que incluyen elementos nucleares intercalados largos (LINE) y elementos nucleares intercalados cortos (SINE), representan una gran proporción de las secuencias genómicas en muchas especies. Las secuencias Alu, clasificadas como un elemento nuclear corto intercalado, son los elementos móviles más abundantes en el genoma humano. Se han encontrado algunos ejemplos de SINE que ejercen control transcripcional de algunos genes que codifican proteínas.[30][31][32]

Las secuencias endógenas de retrovirus son el producto de la transcripción inversa de genomas de retrovirus en genomas de células germinales. La mutación dentro de estas secuencias retro-transcritas puede inactivar el genoma viral.[33]

Más del 8% del genoma humano está formado por secuencias de retrovirus endógenas (en su mayoría descompuestas), como parte de la fracción de más del 42% que se deriva de los retrotransposones, mientras que otro 3% puede identificarse como restos de transposones de ADN. Se espera que gran parte de la mitad restante del genoma que actualmente no tiene un origen explicado haya encontrado su origen en elementos transponibles que estuvieron activos hace tanto tiempo (> 200 millones de años) que las mutaciones aleatorias los han vuelto irreconocibles.[34]​ La variación del tamaño del genoma en al menos dos tipos de plantas es principalmente el resultado de secuencias de retrotransposones.[35][36]

Telómeros

Los telómeros son regiones de ADN repetitivo al final de un cromosoma, que proporcionan protección contra el deterioro cromosómico durante la replicación del ADN. Estudios recientes han demostrado que los telómeros funcionan para ayudar en su propia estabilidad. El ARN que contiene repetición telomérica (TERRA) son transcripciones derivadas de los telómeros. Se ha demostrado que TERRA mantiene la actividad de la telomerasa y alarga los extremos de los cromosomas.[37]

ADN basura

El término "ADN basura" se hizo popular en la década de 1960.[38][39]​ Según T. Ryan Gregory, la naturaleza del ADN basura se discutió por primera vez explícitamente en 1972 por un biólogo genómico, David Comings, quien aplicó el término a todo el ADN no codificante.[40]​ El término fue formalizado ese mismo año por Susumu Ohno,[41]​ quien señaló que la carga mutacional de mutaciones perjudiciales colocaba un límite superior en el número de loci funcionales que podría esperarse dada una tasa de mutación típica. Ohno planteó la hipótesis de que los genomas de mamíferos no podían tener más de 30,000 loci bajo selección antes de que el "costo" de la carga mutacional causara una disminución inevitable en la aptitud física y, finalmente, la extinción. Esta predicción sigue siendo sólida, con el genoma humano que contiene aproximadamente 20,000 genes. Otra fuente de la teoría de Ohno fue la observación de que incluso las especies estrechamente relacionadas pueden tener tamaños genómicos muy diferentes (órdenes de magnitud), lo que se denominó la paradoja del valor C en 1971.[42]​ Aunque la utilidad del término "ADN basura" se ha cuestionado "porque provoca una fuerte suposición a priori de la no funcionalidad total y, aunque algunos han recomendado utilizar una terminología más neutral como ADN no codificante"; a pesar de ello la denominación "ADN basura" sigue siendo una etiqueta para las porciones de una secuencia del genoma para las cuales no se ha identificado ninguna función discernible y que a través del análisis genómico comparativo no aparecen bajo ninguna restricción funcional, lo que sugiere que la secuencia en sí no ha proporcionado ninguna ventaja adaptativa. Desde finales de los años 70, se ha hecho evidente que la mayoría del ADN no codificante en genomas grandes tiene su origen en la amplificación egoísta de elementos transponibles, de los cuales W. Ford Doolittle y Carmen Sapienza en 1980 escribieron en la revista Nature:

"Cuando se puede demostrar que un ADN dado, o clase de ADN, de función fenotípica no probada ha desarrollado una estrategia (como la transposición) que asegura su supervivencia genómica, entonces no es necesaria otra explicación para su existencia."[43]

Se puede esperar que la cantidad de ADN basura dependa de la velocidad de amplificación de estos elementos y la velocidad a la que se pierde el ADN no funcional.[44]​ En el mismo número de Nature, Leslie Orgel y Francis Crick escribieron que el ADN basura tiene "poca especificidad y transmite poca o ninguna ventaja selectiva al organismo".[45]​ El término aparece principalmente en la ciencia popular y de manera coloquial en publicaciones científicas, y se ha sugerido que sus connotaciones pueden haber retrasado el interés en las funciones biológicas del ADN no codificante.[46][nota 1]​ Varias líneas de evidencia indican que algunas secuencias de "ADN basura" es probable que tengan actividad funcional no identificada y que el proceso de exaptación de fragmentos de ADN originalmente egoísta o no funcional ha sido común a lo largo de la evolución.[47]

Proyecto ENCODE

En 2012, el proyecto ENCODE, un programa de investigación apoyado por el Instituto Nacional de Investigación del Genoma Humano, informó que el 76% de las secuencias de ADN no codificantes del genoma humano fueron transcritas y que casi la mitad del genoma era de alguna manera accesible a proteínas reguladoras genéticas como factores de transcripción.[3]​ Sin embargo, la sugerencia de ENCODE de que más del 80% del genoma humano es bioquímicamente funcional ha sido criticada por otros científicos,[6]​ quienes sostienen que ni la accesibilidad de los segmentos del genoma a los factores de transcripción ni su transcripción garantiza que esos segmentos tienen una función bioquímica y su transcripción es selectivamente ventajosa. Además, las estimaciones mucho más bajas de la funcionalidad antes de ENCODE se basaron en estimaciones de conservación genómica en linajes de mamíferos.[7][8][9][10]​ En respuesta, otros científicos argumentan que la transcripción generalizada y el empalme que se observa directamente en el genoma humano mediante pruebas bioquímicas es un indicador más preciso de la función genética que la conservación genómica. Debido a que las estimaciones de conservación son relativas debido a variaciones increíbles en los tamaños del genoma de especies incluso estrechamente relacionadas, es parcialmente tautológico, y estas estimaciones no se basan en pruebas directas de funcionalidad en el genoma.[12][15]​ Las estimaciones de conservación pueden usarse para proporcionar pistas para identificar posibles elementos funcionales en el genoma, pero no limita ni limita la cantidad total de elementos funcionales que podrían existir en el genoma ya que los elementos que hacen cosas en el nivel molecular puede perderse por la genómica comparativa. Además, gran parte del ADN basura aparente está involucrado en la regulación epigenética y parece ser necesario para el desarrollo de organismos complejos.[14][16]

En un artículo de 2014, los investigadores de ENCODE intentaron abordar "la cuestión de si las regiones no conservadas pero bioquímicamente activas son realmente funcionales". Señalaron que en la literatura, las partes funcionales del genoma se han identificado de manera diferente en estudios anteriores, dependiendo de los enfoques utilizados. Se han utilizado tres enfoques generales para identificar partes funcionales del genoma humano: enfoques genéticos (que se basan en cambios en el fenotipo), enfoques evolutivos (que se basan en la conservación) y enfoques bioquímicos (que se basan en pruebas bioquímicas y fueron utilizados por ENCODE). Los tres tienen limitaciones:

  • Los enfoques genéticos pueden pasar por alto elementos funcionales que no se manifiestan físicamente en el organismo.
  • Los enfoques evolutivos tienen dificultades para utilizar alineamientos precisos de secuencias de múltiples especies, ya que los genomas de especies incluso estrechamente relacionadas varían considerablemente, y con enfoques bioquímicos, aunque tienen una alta reproducibilidad.

Las firmas bioquímicas no siempre significan automáticamente una función. Señalaron que el 70% de la cobertura de transcripción era inferior a 1 transcripción por celda. Señalaron que esta "mayor proporción de genoma con potencia de señal bioquímica reproducible pero baja y menor conservación evolutiva es difícil de analizar entre funciones específicas y ruido biológico". Además, la resolución del ensayo a menudo es mucho más amplia que los sitios funcionales subyacentes, por lo que es improbable que algunas de las secuencias reproduciblemente “bioquímicamente activas pero selectivamente neutrales” cumplan funciones críticas, especialmente aquellas con señal bioquímica de nivel inferior. A esto añadieron:

"Sin embargo, también reconocemos limitaciones sustanciales en nuestra detección actual de restricciones, dado que algunas funciones específicas de humanos son esenciales pero no conservadas y que las regiones relevantes para la enfermedad no necesitan ser selectivamente restringidas para ser funcionales".

Por otro lado, argumentaron que la fracción de 12-15% de ADN humano bajo restricción funcional, según lo estimado por una variedad de métodos evolutivos extrapolativos, aún puede ser una subestimación. Llegaron a la conclusión de que, en contraste con la evidencia evolutiva y genética, los datos bioquímicos ofrecen pistas sobre la función molecular que cumplen los elementos de ADN subyacentes y los tipos de células en los que actúan. En última instancia, los enfoques genéticos, evolutivos y bioquímicos se pueden utilizar de forma complementaria para identificar regiones que pueden ser funcionales en la biología y la enfermedad humanas. Algunos críticos han argumentado que la funcionalidad solo puede evaluarse en referencia a una hipótesis nula apropiada. En este caso, la hipótesis nula sería que estas partes del genoma no son funcionales y tienen propiedades, ya sea sobre la base de la actividad bioquímica o de conservación, que cabría esperar de dichas regiones en función de nuestra comprensión general de la evolución molecular y bioquímica Según estos críticos, hasta que se haya demostrado que una región en cuestión tiene características adicionales, más allá de lo que se espera de la hipótesis nula, debe etiquetarse provisionalmente como no funcional.[48]

Evidencia de funcionalidad

Muchas secuencias de ADN no codificantes deben tener alguna función biológica importante. Esto está indicado por estudios comparativos de genómica que informan regiones altamente conservadas de ADN no codificante, a veces en escalas de tiempo de cientos de millones de años. Esto implica que estas regiones no codificadas están bajo una fuerte presión evolutiva y una selección positiva.[49]​ Por ejemplo, en los genomas de humanos y ratones, que divergieron de un ancestro común hace 65-75 millones de años, las secuencias de ADN que codifican proteínas representan solo alrededor del 20% del ADN conservado, con el 80% restante de ADN conservado representado en regiones no codificantes. El mapeo de enlaces a menudo identifica regiones cromosómicas asociadas con una enfermedad sin evidencia de variantes de codificación funcional de genes dentro de la región, lo que sugiere que las variantes genéticas causantes de enfermedad se encuentran en el ADN no codificante.[50]​ La importancia de las mutaciones de ADN no codificantes en el cáncer se exploró en abril de 2013.[51]

Los polimorfismos genéticos no codificantes desempeñan un papel en la susceptibilidad a enfermedades infecciosas, como la hepatitis C.[52]​ Además, los polimorfismos genéticos no codificantes contribuyen a la susceptibilidad al sarcoma de Ewing, un cáncer óseo pediátrico agresivo.[53]

Algunas secuencias específicas de ADN no codificante pueden ser características esenciales para la estructura cromosómica, la función del centrómero y el reconocimiento de cromosomas homólogos durante la meiosis.[54]

Según un estudio comparativo de más de 300 genomas procariotas y más de 30 eucariotas,[55]​ eucariotas parecen requerir una cantidad mínima de ADN no codificante. La cantidad puede predecirse utilizando un modelo de crecimiento para redes genéticas reguladoras, lo que implica que se requiere para fines regulatorios. En humanos, el mínimo previsto es aproximadamente el 5% del genoma total.

Más del 10% de los 32 genomas de mamíferos pueden funcionar mediante la formación de estructuras secundarias específicas del ARN.[56]​ El estudio utilizó genómica comparativa para identificar mutaciones compensatorias de ADN que mantienen pares de bases de ARN, una característica distintiva de las moléculas de ARN. Más del 80% de las regiones genómicas que presentan evidencia evolutiva de la conservación de la estructura del ARN no presentan una fuerte conservación de la secuencia de ADN.

El ADN no codificante separa los genes entre sí con espacios largos, por lo que la mutación en un gen o parte de un cromosoma, por ejemplo, la eliminación o inserción, no tiene un efecto de cambio de marco en todo el cromosoma. Cuando la complejidad del genoma es relativamente alta, como en el caso del genoma humano, no solo entre diferentes genes, sino también dentro de muchos genes, hay lagunas de intrones para proteger todo el segmento de codificación y minimizar los cambios causados por la mutación. El ADN no codificante quizás sirva para disminuir la probabilidad de disrupción génica durante el cruce cromosómico.[57]

Regulación de la expresión génica

Algunas secuencias de ADN no codificantes determinan los niveles de expresión de varios genes, tanto los que se transcriben a proteínas como los que están involucrados en la regulación génica.[58][59][60]

Factores de transcripción

Algunas secuencias de ADN no codificantes determinan dónde se unen los factores de transcripción.[58]​ Un factor de transcripción es una proteína que se une a secuencias específicas de ADN no codificantes, controlando así el flujo (o transcripción) de información genética del ADN al ARNm.[61][62]

Operadores

Un operador es un segmento de ADN al que se une un represor. Un represor es una proteína de unión al ADN que regula la expresión de uno o más genes uniéndose al operador y bloqueando la unión de la ARN polimerasa al promotor, evitando así la transcripción de los genes. Este bloqueo de la expresión se llama represión.[63]

Potenciadores

Un potenciador es una región corta de ADN que se puede unir a proteínas (factores de acción trans), al igual que un conjunto de factores de transcripción, para mejorar los niveles de transcripción de genes en un grupo de genes.[64]

Silenciadores

Un silenciador es una región de ADN que inactiva la expresión génica cuando se une a una proteína reguladora. Funciona de manera muy similar a los potenciadores, solo difiere en la inactivación de genes.[65]

Promotores

Un promotor es una región de ADN que facilita la transcripción de un gen particular cuando un factor de transcripción se une a él. Los promotores generalmente se ubican cerca de los genes que regulan y corriente arriba de ellos.[66]

Aisladores

Un aislante genético es un elemento límite que juega dos papeles distintos en la expresión génica, ya sea como un código de bloqueo del potenciador, o raramente como una barrera contra la cromatina condensada. Un aislante en una secuencia de ADN es comparable a un divisor de palabras lingüísticas, como una coma en una oración, porque el aislante indica dónde termina una secuencia potenciada o reprimida.[67]

Usos

Evolución

Las secuencias compartidas de ADN aparentemente no funcional son una importante línea de evidencia de descendencia común.[68]

Las secuencias de pseudogén parecen acumular mutaciones más rápidamente que las secuencias de codificación debido a una pérdida de presión selectiva.[29]​ Esto permite la creación de alelos mutantes que incorporan nuevas funciones que pueden ser favorecidas por la selección natural; así, los pseudogenes pueden servir como materia prima para la evolución y pueden considerarse "protogenes".[69]

Correlaciones de largo alcance

Se ha encontrado una distinción estadística entre secuencias de ADN codificantes y no codificantes. Se ha observado que los nucleótidos en secuencias de ADN no codificantes muestran correlaciones de la ley de potencia de largo alcance mientras que las secuencias codificantes no lo hacen.[70][71][72]

Antropología Forense

La policía a veces recolecta ADN como evidencia para propósitos de identificación forense. Como se describe en Maryland v. King,[73]​ una decisión de la Corte Suprema de EE. UU. de 2013:  

El estándar actual para las pruebas forenses de ADN se basa en un análisis de los cromosomas ubicados dentro del núcleo de todas las células humanas. El material de ADN en los cromosomas se compone de regiones "codificantes" y "no codificantes". Las regiones de codificación se conocen como genes y contienen la información necesaria para que una célula produzca proteínas... las regiones no codificantes de proteínas... no están directamente relacionados con la producción de proteínas, [y] se han denominado ADN "basura". El adjetivo "basura" puede inducir a error al laico, ya que de hecho esta es la región del ADN que se usa con casi certeza para identificar a una persona.[73]​  

Véase también

Notas

  1. El término "ADN basura" fue rechazado por los principales investigadores de estudiar material genético no codificante durante muchos años. http://dx.doi.org/10.1038%2Fscientificamerican0307-104

Referencias

  1. «El ADN basura protege». Investigación y ciencia. 2011. Consultado el 27 de octubre de 2019. 
  2. «Identifican las secuencias de ADN no codificante más antiguas que se conocen». SINC (CSIC). 2011. Consultado el 27 de octubre de 2019. 
  3. a b Pennisi, Elizabeth (7 de septiembre de 2012). «ENCODE Project Writes Eulogy for Junk DNA». Science (en inglés) 337 (6099): 1159-1161. ISSN 0036-8075. PMID 22955811. doi:10.1126/science.337.6099.1159. 
  4. Dunham, Ian; Kundaje, Anshul; Aldred, Shelley F.; Collins, Patrick J.; Davis, Carrie A.; Doyle, Francis; Epstein, Charles B.; Frietze, Seth et al. (2012-09). «An integrated encyclopedia of DNA elements in the human genome». Nature (en inglés) 489 (7414): 57-74. ISSN 1476-4687. PMC 3439153. PMID 22955616. doi:10.1038/nature11247. 
  5. a b Morris, Kevin V. (2012). «cap7:Non-coding RNAs. Epigenomics, and Complexity in Human Cells». Non-coding RNAs and epigenetic regulation of gene expression : drivers of natural selection (en inglés). Caister Academic Press. ISBN 978-1-904455-94-3. OCLC 727704222. 
  6. a b Robin McKie (24 de febrero de 2013). «Scientists attacked over claim that 'junk DNA' is vital to life». 
  7. a b Eddy, Sean R. (6 de noviembre de 2012). «The C-value paradox, junk DNA and ENCODE». Current Biology (en inglés) 22 (21): R898-R899. ISSN 0960-9822. PMID 23137679. doi:10.1016/j.cub.2012.10.002. 
  8. a b Doolittle, W. Ford (2 de abril de 2013). «Is junk DNA bunk? A critique of ENCODE». Proceedings of the National Academy of Sciences (en inglés) 110 (14): 5294-5300. ISSN 0027-8424. PMC 3619371. PMID 23479647. doi:10.1073/pnas.1221376110. 
  9. a b Palazzo, Alexander F.; Gregory, T. Ryan (8 de mayo de 2014). «The Case for Junk DNA». PLOS Genetics (en inglés) 10 (5): e1004351. ISSN 1553-7404. PMC 4014423. PMID 24809441. doi:10.1371/journal.pgen.1004351. 
  10. a b Graur, Dan; Zheng, Yichen; Price, Nicholas; Azevedo, Ricardo B. R.; Zufall, Rebecca A.; Elhaik, Eran (1 de marzo de 2013). «On the Immortality of Television Sets: “Function” in the Human Genome According to the Evolution-Free Gospel of ENCODE». Genome Biology and Evolution (en inglés) 5 (3): 578-590. PMC 3622293. PMID 23431001. doi:10.1093/gbe/evt028. 
  11. Ponting, Chris P.; Hardison, Ross C. (1 de noviembre de 2011). «What fraction of the human genome is functional?». Genome Research (en inglés) 21 (11): 1769-1776. ISSN 1088-9051. PMC 3205562. PMID 21875934. doi:10.1101/gr.116814.110. 
  12. a b Kellis, M.; Wold, B.; Snyder, M. P.; Bernstein, B. E.; Kundaje, A.; Marinov, G. K.; Ward, L. D.; Birney, E. et al. (21 de abril de 2014). «Defining functional DNA elements in the human genome». Proceedings of the National Academy of Sciences (en inglés) 111 (17): 6131-6138. ISSN 0027-8424. PMC 4035993. PMID 24753594. doi:10.1073/pnas.1318948111. 
  13. Rands, Chris M.; Meader, Stephen; Ponting, Chris P.; Lunter, Gerton (24 de julio de 2014). «8.2% of the Human Genome Is Constrained: Variation in Rates of Turnover across Functional Element Classes in the Human Lineage». PLOS Genetics (en inglés) 10 (7): e1004525. ISSN 1553-7404. PMC 4109858. PMID 25057982. doi:10.1371/journal.pgen.1004525. 
  14. a b Carey, Nessa, (2015). Junk DNA : a journey through the dark matter of the genome. Columbia University Press. ISBN 978-0-231-53941-8. OCLC 904407047. 
  15. a b Mattick, John S.; Dinger, Marcel E. (15 de julio de 2013). «The extent of functionality in the human genome». The HUGO Journal 7 (1): 2. ISSN 1877-6566. PMC 4685169. doi:10.1186/1877-6566-7-2. 
  16. a b Morris, Kevin V. (2012). Non-coding RNAs and epigenetic regulation of gene expression : drivers of natural selection. Caister Academic Press. ISBN 978-1-904455-94-3. OCLC 727704222. 
  17. a b «Worlds Record Breaking Plant: Deletes its Noncoding "Junk" DNA». 12 de mayo de 2013. Consultado el 4 de junio de 2013. 
  18. a b Elgar G.; Vavouri T. (July 2008). «Tuning in to the signals: noncoding sequence conservation in vertebrate genomes». Trends in Genetics 24 (7): 344-352. PMID 18514361. doi:10.1016/j.tig.2008.04.005. 
  19. Thomas, C.A. (1971). «The genetic organization of chromosomes». Annu. Rev. Genet. 5: 237-256. PMID 16097657. doi:10.1146/annurev.ge.05.120171.001321. 
  20. «The modulation of DNA content: proximate causes and ultimate consequences». Genome Research 9 (4): 317-24. April 1999. PMID 10207154. doi:10.1101/gr.9.4.317. 
  21. «Plant biology: Coding in non-coding RNAs». Nature 520 (7545): 41-2. April 2015. Bibcode:2015Natur.520...41W. PMID 25807488. doi:10.1038/nature14378. 
  22. «Evo-devo and an expanding evolutionary synthesis: a genetic theory of morphological evolution». Cell 134 (1): 25-36. July 2008. PMID 18614008. doi:10.1016/j.cell.2008.06.030. 
  23. «Genomic views of distant-acting enhancers». Nature 461 (7261): 199-205. September 2009. Bibcode:2009Natur.461..199V. PMC 2923221. PMID 19741700. doi:10.1038/nature08451. 
  24. a b «Group I introns: Moving in new directions». RNA Biology 6 (4): 375-83. 2009. PMID 19667762. doi:10.4161/rna.6.4.9334. 
  25. a b «Pseudogenes in the ENCODE regions: consensus annotation, analysis of transcription, and evolution». Genome Research 17 (6): 839-51. June 2007. PMC 1891343. PMID 17568002. doi:10.1101/gr.5586307. 
  26. Lopez, J. V., Yuhki, N., Masuda, R., Modi, W., & O'Brien, S. J. (1994). Numt, a recent transfer and tandem amplification of mitochondrial DNA to the nuclear genome of the domestic cat. Journal of Molecular Evolution, 39(2), 174-190.
  27. «Dollo's law and the death and resurrection of genes». Proceedings of the National Academy of Sciences of the United States of America 91 (25): 12283-7. December 1994. Bibcode:1994PNAS...9112283M. PMC 45421. PMID 7991619. doi:10.1073/pnas.91.25.12283. 
  28. «Pseudogenes». Comparative and Functional Genomics 2012: 1-4. 2012. PMC 3352212. PMID 22611337. doi:10.1155/2012/424526. 
  29. a b «Pseudogene evolution and natural selection for a compact genome». The Journal of Heredity 91 (3): 221-7. 2000. PMID 10833048. doi:10.1093/jhered/91.3.221. 
  30. Ponicsan, Steven L; Kugel, Jennifer F; Goodrich, James A (1 de abril de 2010). «Genomic gems: SINE RNAs regulate mRNA production». Current Opinion in Genetics & Development. Chromosomes and expression mechanisms (en inglés) 20 (2): 149-155. ISSN 0959-437X. PMC 2859989. PMID 20176473. doi:10.1016/j.gde.2010.01.004. 
  31. Häsler, J.; Samuelsson, T.; Strub, K. (1 de julio de 2007). «Useful ‘junk’: Alu RNAs in the human transcriptome». Cellular and Molecular Life Sciences (en inglés) 64 (14): 1793-1800. ISSN 1420-9071. doi:10.1007/s00018-007-7084-0. 
  32. Walters, Ryan D.; Kugel, Jennifer F.; Goodrich, James A. (2009). «InvAluable junk: The cellular impact and function of Alu and B2 RNAs». IUBMB Life (en inglés) 61 (8): 831-837. ISSN 1521-6551. PMC 4049031. PMID 19621349. doi:10.1002/iub.227. 
  33. Nelson, P. N.; Hooley, P.; Roden, D.; Ejtehadi, H. Davari; Rylance, P.; Warren, P.; Martin, J.; Murray, P. G. (2004). «Human endogenous retroviruses: transposable elements with potential?». Clinical & Experimental Immunology (en inglés) 138 (1): 1-9. ISSN 1365-2249. PMC 1809191. PMID 15373898. doi:10.1111/j.1365-2249.2004.02592.x. 
  34. «Initial sequencing and analysis of the human genome». Nature 409 (6822): 860-921. February 2001. Bibcode:2001Natur.409..860L. PMID 11237011. doi:10.1038/35057062. 
  35. Piegu, Benoit; Guyot, Romain; Picault, Nathalie; Roulin, Anne; Sanyal, Abhijit; Saniyal, Abhijit; Kim, Hyeran; Collura, Kristi et al. (2006-10). «Doubling genome size without polyploidization: dynamics of retrotransposition-driven genomic expansions in Oryza australiensis, a wild relative of rice». Genome Research 16 (10): 1262-1269. ISSN 1088-9051. PMC 1581435. PMID 16963705. doi:10.1101/gr.5290206. 
  36. Hawkins, Jennifer S.; Kim, HyeRan; Nason, John D.; Wing, Rod A.; Wendel, Jonathan F. (1 de octubre de 2006). «Differential lineage-specific amplification of transposable elements is responsible for genome size variation in Gossypium». Genome Research (en inglés) 16 (10): 1252-1261. ISSN 1088-9051. PMC 1581434. PMID 16954538. doi:10.1101/gr.5282906. 
  37. Cusanelli, Emilio; Chartrand, Pascal (2014). «Telomeric noncoding RNA: telomeric repeat-containing RNA in telomere biology». WIREs RNA (en inglés) 5 (3): 407-419. ISSN 1757-7012. doi:10.1002/wrna.1220. 
  38. Ehret, Charles F.; De Haller, Gérard (1 de octubre de 1963). «Origin, development, and maturation of organelles and organelle systems of the cell surface in Paramecium». Journal of Ultrastructure Research (en inglés) 9: 1-42. ISSN 0022-5320. doi:10.1016/S0022-5320(63)80088-X. 
  39. Dan Graur, The Origin of Junk DNA: A Historical Whodunnit
  40. Gregory, T. Ryan, ed. (2005). The Evolution of the Genome. Elsevier. pp. 29–31. ISBN 978-0123014634. «Comings (1972), on the other hand, gave what must be considered the first explicit discussion of the nature of "junk DNA," and was the first to apply the term to all noncoding DNA."; "For this reason, it is unlikely that any one function for noncoding DNA can account for either its sheer mass or its unequal distribution among taxa. However, dismissing it as no more than "junk" in the pejorative sense of "useless" or "wasteful" does little to advance the understanding of genome evolution. For this reason, the far less loaded term "noncoding DNA" is used throughout this chapter and is recommended in preference to "junk DNA" for future treatments of the subject."». 
  41. So Much "junk" DNA in Our Genome. Gordon and Breach, New York. 1972. pp. 366-370. Archivado desde el original el 27 de mayo de 2019. Consultado el 15 de mayo de 2013. 
  42. «The C-value paradox, junk DNA and ENCODE». Current Biology 22 (21): R898-9. November 2012. PMID 23137679. doi:10.1016/j.cub.2012.10.002. 
  43. Doolittle, W. Ford; Sapienza, Carmen (1980-04). «Selfish genes, the phenotype paradigm and genome evolution». Nature (en inglés) 284 (5757): 601-603. ISSN 1476-4687. doi:10.1038/284601a0. 
  44. Another source is genome duplication followed by a loss of function due to redundancy.
  45. «Selfish DNA: the ultimate parasite». Nature 284 (5757): 604-7. April 1980. Bibcode:1980Natur.284..604O. PMID 7366731. doi:10.1038/284604a0. 
  46. Khajavinia, A.; Makalowski, Wojciech (2007-05). «What is "junk" DNA, and what is it worth?». Scientific American 296 (5): 104. ISSN 0036-8733. PMID 17503549. 
  47. «Genetics: junk DNA as an evolutionary force». Nature 443 (7111): 521-4. October 2006. Bibcode:2006Natur.443..521B. PMID 17024082. doi:10.1038/443521a. 
  48. Palazzo, Alexander F.; Lee, Eliza S. (2015). «Non-coding RNA: what is functional and what is junk?». Frontiers in Genetics (en inglés) 6. ISSN 1664-8021. PMC 4306305. PMID 25674102. doi:10.3389/fgene.2015.00002. 
  49. Ludwig, Michael Z. (1 de diciembre de 2002). «Functional evolution of noncoding DNA». Current Opinion in Genetics & Development (en inglés) 12 (6): 634-639. ISSN 0959-437X. doi:10.1016/S0959-437X(02)00355-6. 
  50. Cobb, Joanna; Büsst, Cara; Petrou, Steven; Harrap, Stephen; Ellis, Justine (2008). «Searching for Functional Genetic Variants in Non-Coding Dna». Clinical and Experimental Pharmacology and Physiology (en inglés) 35 (4): 372-375. ISSN 1440-1681. doi:10.1111/j.1440-1681.2008.04880.x. 
  51. Khurana, Ekta; Fu, Yao; Colonna, Vincenza; Mu, Xinmeng Jasmine; Kang, Hyun Min; Lappalainen, Tuuli; Sboner, Andrea; Lochovsky, Lucas et al. (4 de octubre de 2013). «Integrative Annotation of Variants from 1092 Humans: Application to Cancer Genomics». Science (New York, N.Y.) 342 (6154): 1235587. ISSN 0036-8075. PMC 3947637. PMID 24092746. doi:10.1126/science.1235587. 
  52. «IFNL3 mRNA structure is remodeled by a functional non-coding polymorphism associated with hepatitis C virus clearance». Scientific Reports 5: 16037. November 2015. Bibcode:2015NatSR...516037L. PMC 4631997. PMID 26531896. doi:10.1038/srep16037. 
  53. Grünewald, Thomas G. P.; Bernard, Virginie; Gilardi-Hebenstreit, Pascale; Raynal, Virginie; Surdez, Didier; Aynaud, Marie-Ming; Mirabeau, Olivier; Cidre-Aranaz, Florencia et al. (2015-09). «Chimeric EWSR1-FLI1 regulates the Ewing sarcoma susceptibility gene EGR2 via a GGAA microsatellite». Nature Genetics (en inglés) 47 (9): 1073-1078. ISSN 1546-1718. PMC 4591073. PMID 26214589. doi:10.1038/ng.3363. 
  54. Subirana, Juan A.; Messeguer, Xavier (1 de marzo de 2010). «The most frequent short sequences in non-coding DNA». Nucleic Acids Research (en inglés) 38 (4): 1172-1181. ISSN 0305-1048. PMC 2831315. PMID 19966278. doi:10.1093/nar/gkp1094. Consultado el 10 de septiembre de 2020. 
  55. Ahnert, Sebastian E.; Fink, Thomas M. A.; Zinovyev, Andrei (21 de junio de 2008). «How much non-coding DNA do eukaryotes require?». Journal of Theoretical Biology (en inglés) 252 (4): 587-592. ISSN 0022-5193. doi:10.1016/j.jtbi.2008.02.005. 
  56. Smith, Martin A.; Gesell, Tanja; Stadler, Peter F.; Mattick, John S. (1 de septiembre de 2013). «Widespread purifying selection on RNA structure in mammals». Nucleic Acids Research (en inglés) 41 (17): 8220-8236. ISSN 0305-1048. PMC 3783177. PMID 23847102. doi:10.1093/nar/gkt596. 
  57. Dileep, V. (2009). «The place and function of non-coding DNA in the evolution of variability». Hypothesis 7 (1): e7. doi:10.5779/hypothesis.v7i1.146. Archivado desde el original el 10 de agosto de 2017. Consultado el 8 de septiembre de 2019. 
  58. a b «Junk DNA gets credit for making us who we are». New Scientist. March 2010. 
  59. Carroll, Sean B.; Prud'homme, Benjamin; Gompel, Nicolas (2008-05). «Regulating Evolution». Scientific American 298 (5): 60-67. ISSN 0036-8733. doi:10.1038/scientificamerican0508-60. 
  60. Stojic, Lovorka; Niemczyk, Malwina; Orjalo, Arturo; Ito, Yoko; Ruijter, Anna Elisabeth Maria; Uribe-Lewis, Santiago; Joseph, Nimesh; Weston, Stephen et al. (2 de febrero de 2016). «Transcriptional silencing of long noncoding RNA GNG12-AS1 uncouples its transcriptional and product-related functions». Nature Communications (en inglés) 7 (1): 10406. ISSN 2041-1723. PMC 4740813. PMID 26832224. doi:10.1038/ncomms10406. 
  61. Latchman, David S. (1 de diciembre de 1997). «Transcription factors: An overview». The International Journal of Biochemistry & Cell Biology (en inglés) 29 (12): 1305-1312. ISSN 1357-2725. doi:10.1016/S1357-2725(97)00085-X. 
  62. Karin, M. (1990-02). «Too many transcription factors: positive and negative interactions». The New Biologist 2 (2): 126-131. ISSN 1043-4674. PMID 2128034. 
  63. Lewin, Benjamin (1990). Genes IV (4th edición). Oxford: Oxford University Press. pp. 243-58. ISBN 978-0-19-854267-4. 
  64. Blackwood, Elizabeth M.; Kadonaga, James T. (3 de julio de 1998). «Going the Distance: A Current View of Enhancer Action». Science (en inglés) 281 (5373): 60-63. ISSN 0036-8075. PMID 9679020. doi:10.1126/science.281.5373.60. 
  65. Maston, Glenn A.; Evans, Sara K.; Green, Michael R. (1 de septiembre de 2006). «Transcriptional Regulatory Elements in the Human Genome». Annual Review of Genomics and Human Genetics 7 (1): 29-59. ISSN 1527-8204. doi:10.1146/annurev.genom.7.080505.115623. 
  66. «Analysis of Biological Networks: Transcriptional Networks – Promoter Sequence Analysis». Tel Aviv University. Consultado el 30 de diciembre de 2012. 
  67. Burgess-Beusse, Bonnie; Farrell, Catherine; Gaszner, Miklos; Litt, Michael; Mutskov, Vesco; Recillas-Targa, Felix; Simpson, Melanie; West, Adam et al. (10 de diciembre de 2002). «The insulation of genes from external enhancers and silencing chromatin». Proceedings of the National Academy of Sciences (en inglés) 99 (suppl 4): 16433-16437. ISSN 0027-8424. PMC 139905. PMID 12154228. doi:10.1073/pnas.162342499. 
  68. "Plagiarized Errors and Molecular Genetics", talkorigins, by Edward E. Max, M.D., Ph.D.
  69. Balakirev, Evgeniy S.; Ayala, Francisco J. (28 de noviembre de 2003). «Pseudogenes: Are They “Junk” or Functional DNA?». Annual Review of Genetics 37 (1): 123-151. ISSN 0066-4197. doi:10.1146/annurev.genet.37.040103.103949. 
  70. Peng, C.-K.; Buldyrev, S. V.; Goldberger, A. L.; Havlin, S.; Sciortino, F.; Simons, M.; Stanley, H. E. (1992-03). «Long-range correlations in nucleotide sequences». Nature (en inglés) 356 (6365): 168-170. ISSN 1476-4687. doi:10.1038/356168a0. 
  71. Buldyrev, S. V.; Goldberger, A. L.; Havlin, S.; Mantegna, R. N.; Matsa, M. E.; Peng, C.-K.; Simons, M.; Stanley, H. E. (1 de mayo de 1995). «Long-range correlation properties of coding and noncoding DNA sequences: GenBank analysis». Physical Review E 51 (5): 5084-5091. doi:10.1103/PhysRevE.51.5084. 
  72. Li, W; Kaneko, K (7 de febrero de 1992). «Long-Range Correlation and Partial 1/ f α Spectrum in a Noncoding DNA Sequence». Europhysics Letters (EPL) 17 (7): 655-660. ISSN 0295-5075. doi:10.1209/0295-5075/17/7/014. 
  73. a b Opinión de la Suprema Corte

Otras lecturas

Enlaces externos