Molecular diversity and evolution of ty3/gypsy and retroviridae ltr retroelements and their evolutionary relationships with aspartic peptidases of clan aa

  1. LLORENS CANDELA, CARLOS
Dirigida por:
  1. Andrés Moya Simarro Director

Universidad de defensa: Universitat de València

Fecha de defensa: 02 de junio de 2008

Tribunal:
  1. Juli Peretó Presidente
  2. Francisco J. Silva Secretario
  3. Horacio Naveira Vocal
  4. Antonio Marín Rodríguez Vocal
  5. Antonio Barbadilla Prados Vocal
Departamento:
  1. GENÈTICA

Tipo: Tesis

Teseo: 262908 DIALNET

Resumen

Motivación. Esta tesis pretende implementar y clasificar la diversidad de los elementos genéticos móviles, evaluando su impacto e historia evolutiva a partir del árbol de la vida. Contexto: Esta tesis se considera la semilla de un proyecto en continuo progreso en pro de clasificar la diversidad de los elementos genéticos móviles, evaluando su impacto e historia evolutiva a partir del árbol de la vida. El proyecto es abordable por versiones, a través de una base de datos denominada "The Gypsy Database (GyDB) of Mobile Genetic Elements" La base de datos es accesible en esta URL http.//gydb.uv.es. La primera versión contempla la historia evolutiva y taxonomía de los retroelementos con L TRs de tipo Ty3/Gypsy y Retroviridae. También, se consideran varias familias génicas no virales surgidas en la evolución como novedades evolutivas vinculadas a estos elementos móviles. Por su variabilidad, se profundiza en el clan AA de las peptidasas aspárticas. Este supergrupo de enzimas relaciona la diversidad en general de dimeros proteasa, expresados por los retroelementos con L TRs con pepsinas eucariotas y varios grupos de peptidasas homodominio de carácter no viral, descritas en procariotas y eucariotas. Métodos: Esta tesis se fundamenta en 120 genomas completos de retroelementos con L TRs de tipo Ty3/Gypsy and Retroviridae, así como en 323 peptidasas del clan AA; 111 cromodominios eucariotas y 6 integrasas de tipo GIN-1. Las secuencias fueron obtenidas a partir de distintas búsquedas realizadas en el National Center of Biotechnology Information (NCBI, http.//www.ncbi.nlm.nih.gov/). La búsqueda se acompañó de una investigación documental sobre las dos familias de elementos móviles y familias no virales relacionadas Todo el material fue organizado en un compendio de web sites centralizados en una sola herramienta MySQL programada en PHP. La información biológica se procesó en pro de desarrollar una colección no redundante de alineamientos múltiples de proteínas y secuencias consenso. La metodología fue derivativa de estrategias de alineamiento y refinado manual de secuencias no redundantes, perfiles ocultos de markov, teoría de la información y reconstrucción de estados ancestrales por máxima verosimilitud. Los alineamientos fueron procesados a través de distintos análisis de reconstrucción filogenética para organizar la base de datos con criterio evolutivo. Resultados: La base de datos Gypsy se implementa por un compendio de discusiones y citaciones que facilitan una mejor visión taxonómica de la diversidad e historia evolutiva de retroelementos con L TRs de tipo Ty3/Gypsy y Retroviridae y clan AA. Esto se fundamenta en la clasificación de las distintas especies moleculares pertenecientes a dichas familias en grupos monofiléticos reportados a partir de una única filogenia gag-pro-pol. Esta distinción nos ha permitido generar una colección secuencias y perfiles de markov ocultos, accesibles a través de servidores BLAST y HMMER que facilitan, la identificación taxonómica de cualquier especie molecular de tipo Ty3/Gypsy y Retroviridae. Hemos recreado también un escenario de ancestralidad basado en múltiples ancestros por cuanto a la historia evolutiva del clan AA. Este escenario se centra en la reconstrucción ancestral de 34 clusters arquitecturales y una cohorte adicional de secuencias ancestrales, intermediaria entre las peptidasas de procariotas y eucariotas. La arquitectura de dominio proteico de esta cohorte representa el consenso más verosímil describiendo la secuencia maestra predominante entre la verdadera cohorte de ancestros del clan AA durante la transición de procariotas a eucariotas. En base a esta arquitectura proteica, anclada en 6 motivos amino acidícos denominado "DTG/ILG témplate" (en argot anglosajón), se descifra la variabilidad del motivo 3 de esta arquitectura como indicador evolutivo de un cierto número de polimorfismos conformacionales de alas (flaps) evolutivamente preseNados dependiendo del linaje. Conclusiones: Todos los dominios proteicos codificados por la región interna gag-pro-pol común a los retroelementos Ty3/Gypsy y Retroviridae concurren en una única historia evolutiva, consistente con los análisis filogenéticos previamente reportados en base ala transcriptasa reversa. Esta historia evolutiva no termina de explicar ciertas perspectivas basadas en la topología de ramas internas, que se presumen podrían quedar sesgadas en algunos casos por el efecto combinado de evolución vertical y horizontal. El desacuerdo reside en la discrepancia entre el agolpamiento de grupos monofiléticos y la distribución biológica de la diversidad conocida de estas dos familias. Esta diversidad junto a la descrita en base a otros linajes de retroelementos con L TRs parece tener un punto de emergencia común anterior ala secesión evolutiva entre los viridiplantae y los ophistokont. Esto es consistente con el big bang de diversidad biológica previamente propuesto por otro autor. El modelo de Big Bang contempla una primera fase de ensamblaje de elementos genéticos sencillos en combinaciones más complejas. En la segunda fase, se consideran la emergencia de los patrones filogenéticos conocidos en base a las distintas formas de especiación biológica. A través de este modelo nosotros relacionamos la captura del dominio proteasa por los retrotransposones tempranos desde una cohorte de alelos peptidasa desde peptidasas procariotas y eucariotas. En esta tesis hemos abstraído el fenotipo molecular común a toda esta cohorte de alelos peptidasa, a partir de la abstracción de una arquitectura proteica, consenso que hemos denominado "DTG/ILG template". Este arquitectura esta contextualmente preservada por cuanto a las propiedades fisicoquímicas, que hemos divido en seis motivos amino acídicos probablemente esenciales en la preservación de la estructura supersecundaria de Andreeva, común con obvias diferencias conformacionales, a todas las peptidasas del clan AA. A partir de la variabilidad en alelos reportada por el motivo 3 del DTG/ILG témplate se han investigado los orígenes Ty3/Gypsy de los retrovirus de vertebrados. Hemos contrastando los polimorfismos de flaps reportados por el motivo 3 con otros dos indicadores evolutivos; presencia/ausencia y número en series de dedos de zinc (CCHC arrays) por nucleocápsida, y polimorfismos en motivos GPY/F y modulo en el extremo C-terminal de la integrasa. También se ha realizado análisis comparativos entre poliproteínas gag. Nuestros análisis apoyan los siete grupos monofiléticos Retroviridae consistentes con la nomenclatura de géneros propuesta por el Comité Internacional de Taxonomía de Virus. No obstante, estudios más recientes asocian los retrovirus endógenos y exógenos por medio de las tres clases retrovirales I, II y III. Estas tres clases quedan relacionadas en nuestras investigaciones con varios linajes Ty3/Gypsy de plantas, hongos y animales, desde donde sugerimos que el origen de la diversidad actual en retrovirus de vertebrados podría ser anterior a la secesión evolutiva entre organismos protóstomos y deuteróstomos. Tal diversidad se presume por consiguiente, polifilética y mucho más antigua de lo previamente supuesto. Proponemos con ello que la interpretación más simple de nuestros resultados es que las clases retrovirales I, II y III constituyen el trazo evolutivo de al menos tres linajes de pro-retrovirus emergidos desde la diversidad Ty3/Gypsy en distintos tiempos evolutivos. A esto lo denominamos la hipótesis de los tres reyes. De hecho la distribución de retroelementos con L TRs de eucariotas al completo delinea el contexto de una radiación ancestral de elementos genéticos móviles cuyo origen más probable data en algún momento de la evolución durante la transición de procariotas a eucariotas por reclutamiento y recombinación de elementos genéticos menores como las peptidasas del clan AA. La diversidad en patrones filogenéticas de dicha radiación se encuentra todavía en expansión y alterna episodios de evolución gradual con incrementos de variabilidad por recombinación, reclutamiento génico y reordenamiento genómico de los retroelementos. Todo esto parece ser coincidente con las grandes transiciones biológicas y cambios en la complejidad celular y molecular de organismos eucariotas. Con ello la hipótesis de los tres reyes asume que la diversidad ancestral en linajes Ty3/Gypsy y Retroviridae fue probablemente substrato de variabilidad intrínseca, modelada por los constreñimientos extrínsecos impuestos por los cambios en complejidad celular y molecular de los hospedadores animales; la propia competición natural e interacciones de los retroelementos; y las distorsiones en los patrones reproductivos de las poblaciones hospedadoras provocadas por las actividades de los elementos transponibles.