Structural and functional characterization of IMPACT proteins: a novel nuclease family

Zamora Caballero, Sara

Structural and functional characterization of IMPACT proteinsa novel nuclease family

Zamora Caballero, Sara

Dirigida por:

Jerónimo Bravo Sicilia Director/a

Universidad de defensa: Universitat de València

Fecha de defensa: 14 de marzo de 2016

Tribunal:

Ismael Mingarro Muñoz Presidente
Maria Solà Vilarrubias Secretario/a
Miguel Ortiz Lombardía Vocal

Tipo: Tesis

Teseo: 407204 DIALNET RODERIC editor

Resumen

Las proteínas IMPACT, objeto de estudio en este trabajo, se encuentran en la mayoría de tejidos y tipos celulares, pero los niveles de expresión más elevados se encuentran en células del sistema nervioso central. El término IMPACT viene de la combinación de los términos en inglés “imprinted” y “ancient”. Por un lado, hoy en día el gen Impact es el único gen conocido en el cromosoma 18 que presenta impronta genética en roedores. La impronta genética es un mecanismo de herencia no mendeliano único en mamíferos. En el caso del gen Impact, esta impronta exhibe un patrón específico de especie ya que está presente en roedores pero no en el resto de mamíferos. La impronta en roedores se ha relacionado con la ausencia de islas CpG intrónicas en el promotor del gen, ya que el promotor humano constituye una isla CpG que convencionalmente no está metilada. Dado que el gen murino que ha sufrido impronta presenta una mayor expresión en comparación con el gen humano, se ha propuesto un modelo donde la impronta ha evolucionado como una adaptación al aumento de dosis génica en roedores. Por otro lado, las proteínas IMPACT se encuentran organizadas en dos dominios: un dominio amino terminal conocido como RWD y un dominio carboxilo terminal al que se le ha denominado como dominio ancestral debido a que presenta un elevado grado de conservación secuencial entre todos sus homólogos. Sin embargo, actualmente se desconoce si este dominio desempeña alguna función por si mismo. El área que conecta ambos dominios se prevé que no posea estructura secundaria. Actualmente hay poca bibliografía relacionada con las proteínas IMPACT, dado que el papel de dichas proteínas dentro de la célula es poco conocido. Hasta la fecha, la única función conocida de las proteínas IMPACT es su rol en el control de la traducción bajo condiciones de estrés, particularmente en ayuno. La traducción es un proceso crucial para la vida. De hecho, la adaptación a diferentes tipos de estrés que puedan comprometerla marca la diferencia entre la vida y la muerte. En eucariotas el elevado número de factores que intervienen en este proceso permiten que se regule la traducción en base a señales extracelulares. El inicio de la misma es el principal punto de regulación del proceso. La traducción comienza con el reclutamiento de un ARN de transferencia iniciador (tRNAMet), capaz de interaccionar con el codón de inicio del ARN mensajero (mRNA). Para poder llegar a ese punto, en primer lugar el complejo terciario (TC), que está formado por las tres subunidades del factor de iniciación de la traducción 2 (eIF2) en eucariotas ?, ? y ? unido a GTP y al tRNAMet, se une a la subunidad 40S del ribosoma formando el complejo pre-iniciador 43S. Los factores de traducción 3 y 4 son necesarios para que el complejo 43S pueda unirse al mRNA, ya que reclutan a la cadena de mensajero y relajan la estructura secundaria cerca del extremo 5’. Una vez unido, el complejo 43S rastrea el mensajero en busca del codón de inicio. Cuando el complejo 43S reconoce el codón iniciador, el GTP del TC se hidroliza y se libera eIF2-GDP. Es entonces cuando la subunidad 60S del ribosoma se une dando lugar al complejo iniciador 80S (pág. 39). El reciclaje de eIF2-GDP a eIF2-GTP es un punto crucial si se quiere asegurar unos ratios de inicio de la traducción elevados. Es por ello que existe un factor intercambiador de GDP, conocido como eIF2B, que ayuda a dicho reciclaje. La fosforilación del factor de iniciación de la traducción 2 (eIF2) en el residuo serina 51 de su subunidad alfa es una de las vías más utilizadas para reprimir la traducción, ya que el factor encargado del reciclaje de eIF2-GDP a eIF2-GTP se une con mayor afinidad a la forma fosforilada de la proteína. De este modo, eIF2B quedaría secuestrado por eIF2 fosforilado y el reciclaje a eIF2-GTP se vería disminuido. En mamíferos se han descrito 4 quinasas capaces de llevar a cabo dicha fosforilación y cada una de esas quinasas se ve activada ante diferentes situaciones de estrés como infecciones víricas, estrés oxidativo, choque térmico, estrés en el retículo endoplásmico o limitación de nutrientes (pág. 41). La quinasa GCN2 interviene en la regulación en condiciones de ayuno y la respuesta que desencadena se conoce como ruta general de control de aminoácidos. La ruta general de control de aminoácidos se activa cuando un ARN de transferencia vacío llega al sitio P del ribosoma y es transferido desde el ribosoma hasta el dominio hisRS de GCN2. Este movimiento está mediado por una proteína conocida como GCN1. La unión de GCN2 al ARN de transferencia vacío hace que se produzca un cambio conformacional que desemboca en la activación del dominio quinasa de GCN2, encargado de la fosforilación del eIF2 (pág. 43). Esta fosforilación desencadena la activación de rutas biosintéticas de aminoácidos y en el caso de mamíferos también promueve la expresión de transportadores de aminoácidos que aumentarán el flujo de captación de estos desde el exterior. Las proteínas IMPACT compiten con GCN2 por la unión a GCN1, ya que tanto IMPACT como GCN2 poseen un dominio RWD que es capaz de interaccionar con GCN1 en la misma zona. Al evitar la fosforilación de eIF2, IMPACT estaría manteniendo unos niveles continuos de traducción. Dado sus elevados niveles de expresión en el sistema nervioso central, IMPACT podría intervenir en la regulación de la traducción de algunas neuronas específicas que se encuentren en condiciones de escasez de aminoácidos. Por otro lado, se ha descrito muy recientemente que existe cierta relación entre el ciclo celular y las proteínas IMPACT. Estudios en levadura revelan que, cuando se elimina el homólogo de IMPACT (Yih1), las células tienden a acumularse en las fases G2/M del ciclo celular. Se vio que la ciclina dependiente de quinasas 28 (Cdc28) precipitaba conjuntamente con Yih1 de igual manera que lo hacían sus homólogos en humano IMPACT y CDK1 respectivamente, apuntando a que la interacción se ha conservado durante la evolución. Sin embargo, el rol preciso desempeñado por IMPACT en el ciclo celular se desconoce. Por último, se ha descrito la relación entre la inducción del enzima indoleamina 2 3-dioxygenasa (IDO) y la sobre expresión de IMPACT debido a la reducción de triptófano que conlleva la actividad de IDO. Dicha enzima se activa tras la exposición de las células a interferón gamma y participa en el catabolismo del triptófano para producir unos compuestos tóxicos conocidos como kineurinas. Teniendo en cuenta el papel de IMPACT en la traducción, podría ayudar a las células a superar dicha situación de escasez de triptófano. Objetivos Con estas premisas, se establecieron una serie de objetivos a culminar durante el desarrollo de la tesis: 1. Determinar la estructura tridimensional de la proteína IMPACT. 2. Identificación de nuevas funciones de IMPACT. 3. Integración de las nuevas capacidades de IMPACT en la célula. Resultados Caracterización estructural del dominio ancestral Dada la experiencia y trayectoria del grupo donde se ha realizado el trabajo, la técnica escogida para la determinación de la estructura tridimensional de la proteína IMPACT fue la cristalografía de proteínas y difracción por rayos X. En primer lugar, se puso a punto la sobreexpresión y purificación de Yih1 (homólogo de IMPACT en S.cerevisiae) e IMPACT (H.sapiens) en un sistema de expresión heterólogo como es Escherichia coli. A continuación, se procedió a realizar los ensayos de cristalización. Aunque dichos ensayos fueron infructuosos en el caso de la proteína humana, en el caso de Yih1 si se obtuvieron cristales. Dichos cristales, pertenecientes al grupo espacial I222, mostraban una difracción de escasa resolución y baja calidad. Para mejorar la calidad de los cristales obtenidos se utilizaron diversas aproximaciones y aunque se consiguió una mejora en tamaño y apariencia, la calidad y resolución de la difracción no fueron suficientes para poder resolver la estructura. Dada la reciente tendencia de utilizar organismos termófilos para obtener las estructuras de ciertas proteínas o complejos proteicos de difícil cristalización, se procedió al clonaje, expresión y purificación del homólogo de IMPACT en Chaetomium thermophilum, al que se decidió llamarle CIH (del inglés Chaetomium IMPACT homolog). Tras analizar que efectivamente tenía una mayor temperatura de desnaturalización en comparación con los homólogos de levadura y humano (pág. 102) y por tanto mayor estabilidad, se procedió con los ensayos de cristalización. Dichos ensayos, se efectuaron utilizando la técnica de difusión de vapor en placas de gota sentada. Se obtuvieron cristales que difractaban a 2.2Å de resolución pero cuyas dimensiones no eran suficientes para albergar una molécula completa de proteína en la unidad asimétrica. Tras resolver el problema de las fases por reemplazo molecular usando el modelo 2cve disponible en el PDB (del inglés Protein Data Bank), se pudo observar que la proteína había sufrido un proceso de proteólisis dentro de la gota de cristalización y que el dominio cristalizado era el conocido como dominio ancestral. Dicho dominio presentaba la topología predicha, ?????? (pág. 107). Tras el análisis estructural del mismo se observó, no sin asombro, cierto grado de homología estructural con el dominio RNasa PH (pág.112). Este dominio se encuentra presente en algunas proteínas con capacidad ribonucleolítica, como lo son las proteínas que componen el exosoma bacteriano o en el enzima polinucleotidil fosforilasa. Las proteínas IMPACT son enzimas El hecho de que el dominio ancestral presentase cierta homología estructural con el dominio RNasa PH nos condujo a investigar si CIH tenía la capacidad de unir ADN. Para ello se realizó un retardo en gel de agarosa y se observó que efectivamente, CIH era capaz de unir ADN de doble cadena y que el dominio ancestral por si solo era capaz de unir dicho ácido nucleico. Tras esta comprobación, se prosiguió realizando una pequeña prueba en la que comprobamos que las preparaciones de IMPACT, Yih1 y CIH degradaban ADN lineal de doble cadena (pág. 115). Esta actividad no había sido descrita con anterioridad y de confirmarse asignaría a las proteínas IMPACT la categoría de enzimas. Para comprobar que la actividad DNasa provenía efectivamente de las proteínas IMPACT, se diseñaron toda una serie de mutantes sobre residuos localizados en zonas potenciales de unión al ADN o de actividad catalítica. Tras la obtención de diferentes mutantes que mostraban nula o reducida actividad DNasa (pág. 118), se procedió a la caracterización de dicha actividad. Durante los ensayos de caracterización, se ha utilizado siempre por cuestiones de mayor estabilidad y solubilidad el homólogo de C.termophilum. Los experimentos realizados nos permitieron concluir que nos encontrábamos ante un enzima con capacidad endolítica (pág. 137), que producía los cortes en las dos cadenas de ADN de manera secuencial (pág. 138) y cuya actividad se veía inhibida en presencia de concentraciones de cloruro sódico igual o superiores a 0,6 M (pág. 136). Además, tras un análisis de hipercromicidad con diferentes concentraciones de ADN, pudimos observar que el enzima presentaba un comportamiento de inhibición por sustrato (pág. 140). Asimismo, una caracterización más exhaustiva de la capacidad de unión de CIH a ácidos nucleicos reveló que la proteína unía con afinidad muy similar ADN de cadena doble, ADN de cadena simple y ARN de cadena simple, sin mostrar especificidad alguna de secuencia. De este modo, se definió a CIH como una proteína con capacidad de unir ácidos nucleicos de manera universal (pág. 122). Por otro lado, un ensayo enzimático utilizando los diferentes dominios de CIH reveló que el dominio RWD no es necesario para llevar a cabo la actividad nucleasa (pág. 141). Paralelamente, se procedió a intentar cristalizar la proteína en presencia de ADN, utilizando tanto la proteína completa como el dominio ancestral. En este último caso se obtuvieron cristales que difractaron a una resolución de 1.5Å y aunque la estructura cristalizada no se encontraba unida a ADN, si se encontró un fosfato unido en una zona equivalente a la que se observa el fosfato unido en el enzima polinucleótido fosforilasa (PNPasa) y que ha sido descrito como su centro activo. Las proteínas IMPACT se comportan como sensores citosólicos de ácidos nucleicos Los resultados comentados anteriormente junto con la relación descrita en la bibliografía existente entre IMPACT e IDO, llevaron a plantear la posibilidad de que existiera algún tipo de relación entre IMPACT y el sistema inmune más allá de lo actualmente descrito. Para ello se realizaron ensayos ex vivo con fibroblastos de ratón (línea celular 3T3). En dichos ensayos se transfectaba ARN de interferencia específico para IMPACT o sin diana concreta para las células control, junto con un ADN de doble cadena de 45 pares de bases con una secuencia perteneciente al genoma de Listeria monocytogenes (ISD), que estimula la producción de interferón o un análogo de ARN de doble cadena (poli I:C). En estos ensayos se observó que los niveles de interferón ? producidos por dichos fibroblastos tras la transfección de ISD o poli I:C se veían alterados en células donde se había silenciado la expresión de IMPACT con respecto a las células control. Además, se observó una respuesta opuesta dependiendo de si se transfectaba ADN de doble cadena (ISD) o ARN de doble cadena (poli I:C). En concreto, tras la transfección con ISD, las células donde se había silenciado la expresión de IMPACT mostraban que la cantidad de ARN mensajero de interferón ? caía a unos niveles inferiores a la mitad de los observados en las células control (pág. 132). Para el caso del poli I:C se observó una respuesta totalmente opuesta. En las células donde se había silenciado IMPACT, la transfección con poli I:C produjo un aumento en la cantidad de ARN mensajero de interferón ? por encima de tres veces el valor observado en las células control. Caracterización estructural del dominio RWD Por otro lado, teniendo en cuenta que la resolución estructural de la proteína completa fue infructuosa se diseñó una construcción que abarca el dominio RWD de CIH para su caracterización estructural. Los cristales obtenidos difractaron a una resolución de 1.4Å y debido a que el problema de las fases no pudo ser resuelto mediante reemplazo molecular usando un modelo del dominio RWD de GCN2 murino (1ukx) obtenido por resonancia magnética nuclear y disponible en el PDB, se procedió a la obtención de las fases ab initio mediante el uso del programa informático Arcimboldo y con la colaboración de la Dra. Isabel Usón. La estructura del dominio RWD de CIH (pág. 144) presenta una elevadísima similitud estructural con el modelo disponible del dominio RWD murino aunque la secuencia no se encuentre conservada. La combinación de los datos ya publicados sobre la caracterización de la interacción entre GCN1 y Yih1 junto con el análisis del potencial electrostático en superficie de la estructura de CIH, apuntan a que la interacción entre GCN1 e IMPACT o cualquiera de sus homólogos tiene un gran componente electrostático. Conclusiones En base al trabajo realizado en esta tesis y a los resultados obtenidos, hemos extraído las siguientes conclusiones: 1. CIH es una proteína con capacidad universal de unir ácidos nucleicos. Además une ADN y ARN con afinidades muy similares y sin aparente especificidad de secuencia. 2. El dominio ancestral de CIH presenta cierto grado de homología estructural con el dominio RNasa PH. 3. El dominio ancestral de CIH une un ion fosfato en la zona equivalente a la que se encuentra el ion unido en el dominio RNasa PH y que ha sido descrito como su centro activo. 4. Las proteínas IMPACT son enzimas. En concreto, son DNasas con actividad endolítica con un mecanismo enzimático asistido por un nucleófilo donde los iones magnesio o manganeso son esenciales. 5. El corte que produce CIH sobre ADN de doble cadena es secuencial. 6. CIH muestra un valor Kunitz muy bajo que viene dado por las condiciones del ensayo. 7. La actividad DNasa de CIH muestra un patrón de inhibición por sustrato. Entre las concentraciones probadas el óptimo se encontró en 100µg/mL. Por otro lado, la actividad DNasa se ve inhibida en presencia de concentraciones de sal por encima de 600mM. 8. Diferentes mutantes de CIH como H203A, R232A, Y253A, C221A, R262G, R271A, D223A/D224A o D223A/E226A muestran actividad nucleasa no detectable frente a ADN. 9. Las proteínas IMPACT se comportan como sensores citosólicos de ácidos nucleicos en fibroblastos, influenciando los niveles de mRNA para INF-? en respuesta a la presencia de ADN de doble cadena o de un análogo de ARN de doble cadena. 10. El dominio RWD no es necesario para la actividad DNasa de CIH. 11. El dominio RWD mantiene una estructura tridimensional muy conservada a pesar de la baja homología de secuencia. 12. Dada la fuerte carga negativa presente en la zona del dominio RWD descrita como necesaria para la interacción con GCN1, la naturaleza de dicha interacción debe ser de carácter electrostático.