Metagenomics of the Human Gut Microbiome Directed by the Flow Cytometry
- Giuseppe D'Auria Director/a
- Andrés Moya Simarro Director
Universidad de defensa: Universitat de València
Fecha de defensa: 01 de abril de 2016
- Václav Pačes Presidente/a
- Rosario Gil García Secretaria
- Manuel Ferrer Martínez Vocal
Tipo: Tesis
Resumen
INTRODUCCIÓN El tracto intestinal humano está poblado por 10^13 - 10^14 bacterias que en conjunto contienen 1,000 veces más genes que el genoma humano. Varios estudios han confirmado que las bacterias del intestino influyen en la salud del cuerpo humano. Además de las bacterias, el intestino humano contiene millones de partículas virales, en su mayoría bacteriófagos. Indirectamente, por lo tanto también influyen en la salud humana. La composición microbiana varia con el individuo. Las especies más numerosas podrían definir tres grupos de individuos: según predominen Bacteroides, Prevotella o Ruminococcus. No obstatne, las funciones más importantes pueden ser realizadas por especies minoritarias. Durante el dasarrollo, la composición bacteriana en el intestino cambia por efecto de la dieta y el estilo de vida. Los antibióticos provocan fuertes cambios también. Es enorme la candidad de información que se ha descubierto en los últimos años sobre las bacterias intestinales, aunque aún quedan muchas cuestiones abiertas. La secuenciación de ADN ha permitido conocer el potencial genético de todas las bacterias en el cuerpo humano sin necesidad de cultivarlas. Se estima que la mitad de las bacterias intestinales no se puede cultivar, pero se puede averiguar su función y aproximar su taxonomía. Hay varios métodos para descifrar el potencial genético de las bacterias: - Genómica bacteriana: se extrae ADN de las cepas aisladas y se fragmenta con enzimas de restricción o mecánicamente con ultrasonido o ultra presión, ya que los secuenciadores de ADN (Illumina MiSeq o 454 FLX+) no pueden leer la molécula de ADN entera. Las secuencias obtenidas se ensamblan para reconstruir el genoma en su totalidad. El genoma bacteriano se cubre con secuencias solapantes para obtener un ensamblaje correcto. - Metagenómica: se extrae ADN de todo el conjunto de las bacterias obtenidas directamente de un ambiente. El objetivo es descifrar las secuencias para ver cuáles son las principales rutas metabólicas de ese ambiente e intentar determinar las principales familias bacterianas que son productoras de estos metabolitos. Otra rama de la metagenómica es la transcriptómica, en la que se estudian solo los genes expresados en el momento de recoger las muestras. - Clasificación taxonómica - La secuenciación del gen 16S rRNA sirve para la identificación de especies bacterianas. El gen se amplifica en la reacción PCR. El producto de la amplificación debe tener el tamaño adecuado para su secuenciación. Estos métodos de secuenciación de ADN se suelen aplicar a toda la comunidad bacteriana, pero existen métodos de preselección de células bacterianas, como es el caso de la citometría de flujo. La citometría de flujo es una metodología que permite separar fracciones de comunidades microbianas basándose en características tales como el contenido celular de DNA, proteínas en la superficie celular o la taxonomía microbiana. El citómetro de flujo detecta la fluorescencia emitida por las células marcadas con fluoróforos que indican las características celulares de interés. Las células pueden ser marcadas directamente con un compuesto químico fluorescente o indirectamente con los fluoróforos conjugados con macromoléculas, anticuerpos o sondas (oligonucleótidos). Las células entran al citómetro de flujo en suspensión, se alinean y pasan una detrás de otra a través de uno o varios láseres. Cada partícula desvía la luz en forma diferente y al absorber la energía de láser, emite diferentes longitudes de onda que se filtran por un sistema de espejos. Las ondas son recogidas por sensores que envían la información de intensidad a un ordenador. Dependiendo del citómetro y de la muestra, el citómetro de flujo puede procesar datos de cientos de miles de células en unos minutos. OBJETIVOS El ADN de las células con características seleccionadas separadas por la citometría de flujo se pueden secuenciar. Con este método obtendríamos más información que secuenciando la comunidad bacteriana no fraccionada. Esta tesis está enfocada a la metagenómica del intestino humano dirigida por la citometría de flujo. Los objetivos principales de esta tesis son los siguientes: Objetivo 1: Secuenciación de las bacterias activas y cubiertas con inmunoglobulina A secretora en las muestras fecales de pacientes con infección por Clostridium difficile El objetivo es explorar la diversidad taxonómica de las bacterias activas y opsonizadas por inmunoglobulina A secretora que se separarán por la citometría de flujo. La infección por C. difficile está relacionada con el uso de antibióticos de gran espectro. Con el método aplicado en esta tesis se podrá detectar quál especies se resisten al tratamiento antibiótico, ya que los resultados de los estudios de microbiota total también incluyen las bacterias muertas. La perturbación microbiana puede estar relacionada con cambios en los mecanismos de reconocimiento de bacterias por el sistema inmune, que pueden influir el progreso de la infección. El objetivo 1 de esta tesis es explicar la disbiosis bacteriana que está ocurriendo en el intestino de los pacientes infectados por C. difficile. Objetivo 2: Inhibición de C. difficile por 8-hidroxiquinoleína La hibridación de células con sondas fluorescentes específicas ayuda a distinguir especies de bacterias distintas en muestras ambientales o en un co-cultivo. El objetivo 2 de esta tesis es estudiar el efecto de 8-hidroxiquinoleína, que es un compuesto antibacteriano con efecto inhibidor selectivo contra C. difficile. Se investigará por la citometría de flujo el crecimiento de C. difficile y Bifidobacterium longum cultivados cuntamente en un medio conteniendo el 8-hidroxiquinoleína. Objetivo 3: Diversidad genética de C. difficile separado por citometría de flujo Las células de C. difficile marcadas con sondas específicas serán separadas del resto de la comunidad bacteriana intestinal por citometría de flujo. Se secuenciará ADN de todo el conjunto de cepas presentes en heces de un paciente infectado. El objetivo 3 de esta tesis es detectar la infección por múltiples cepas de C. difficile en un paciente evitando utilizar los métodos de cultivo tradicionales. Objetivo 4: Adaptación de protocolos de secuenciación masiva a las muestras procedentes de citometría de flujo Las muestras procedentes de citometría de flujo contienen normalmente una cantidad de ADN tan baja que no cumplen con los requisitos de los protocolos de secuenciación masiva. Por eso todo el contenido genético se suele enriquecer con la polimerasa ?. Sin embargo, esa amplificación es la causa de secuencias quiméricas o falta de regiones enteras. El objetivo 4 de esta tesis es optimizar los protocolos de preparación de las librerías de secuenciación para poder secuenciar muestras procedentes de la citometría de flujo. Los resultados se compararán con los resultados del ADN enriquecido con la polimerasa ?. Objetivo 5: Virómica del intestino humano dirigida por la citometría de flujo El objetivo 5 de esta tesis es estudiar por citometría de flujo las partículas virales presentes en un filtrado de muestras fecales. Se separará una fracción de partículas con el mismo tamaño y fluorescencia de ADN y se secuenciarán usando el protocolo optimizado en el objetivo 4. Los genes se anotarán y se determinará su origen. MÉTODOS Las células bacterianas procedentes de heces se fijaban con formaldehido y se marcaban con SYTO®62 para distinguir las células de otras partículas de tamaño similar que podían permanecer en las heces después de la purificación bacteriana. Los virus, en el proyecto de secuenciación de viroma, se marcaban con SYBR Green I. En los otros proyectos, las bacterias activas se marcaban con pironina Y que es específico para ARN; las células opsonizadas con inmunoglobulina A secretora se marcaban con anticuerpos conjugados con FITC y las células de C. difficile y B. longum se marcaban con sondas conjugadas con fluorofóros de longitudes de emisión diferentes (FITC y Cy5). Para la separación de células bacterianas o partículas virales se utilizaron los citómetros MoFlo XDP Cell sorter de Beckman Coulter y S3 Cell Sorter de Bio-Rad. En el proyecto de secuenciación de fracciones de bacterias activas y opsonizadas por inmunoglobulinas, se separaron 540,000 células de cada fracción de heces en 12 pacientes infectados por C. difficile y 12 pacientes no infectados hospitalizados. En el estudio genómico de C. difficile se separaron tan solo 10,000 células de heces de un paciente infectado y en el estudio de viroma se separaron tan solo 314 partículas virales filtradas por poros de tamaño 0.2 ?m de heces en un voluntario sano. En los experimentos donde la separación física no era necesaria, se utilizó el citómetro Cytomics FC 500 de Beckman Coulter para contar las células y para visualizar su fluorescencia. El ADN se extraía con el método de fenol-cloroformo donde se empleaba bromuro de hexadeciltrimetilamonio, lisozima y proteinasa K. Para estudiar el gen 16S rRNA se amplificaban los regiones V3 y V4 y los amplicones se trataban según las instrucciones de secuenciación por Illumina. En los estudios genómicos, el ADN se fragmentaba por sonicación o usando el kit Nextera empleando la tagmentación. La secuenciación masiva se llevó a cabo en las plataformas Illumina y 454 FLX+. En general, las secuencias obtenidas se procesaban con el programa PRINSEQ, que cortaba las secuencias según su calidad y eliminaba secuencias cortas o con baja entropia. En los estudios taxonómicos, los amplicones de 16S rDNA se compararon con la base de datos "Ribosomal database project". En los estudios genómicos, las secuencias se compararon con las bases de datos de NCBI usando algoritmos de "blastn" o "blastx" y en el caso de virómica con las bases de datos ACLAME y phiSITE. Las secuencias genómicas se ensamblaron con el programa MIRA4 y los "marcos abierto de lectura" se anotaron en la base de datos InterPro. El mapeo de las secuencias genómicas de un genoma en concreto se realizó con los programas SSAHA 2.5.4 o Bowtie 2. Los resultados se analizaron con los paquetes de programación en R, como por ejemplo "vegan" para determinar las abundancias bacterianas, "Rsamtools" para visualizar la cobertura de genoma determinado con las secuencias obtenidas y "FlowViz" para manejar los datos de citometrá de flujo. RESULTADOS Y CONCLUSIONES La comparación de distribuciones taxonómicas de las dos parejas de fracciones (opsonizadas vs. no opsonizadas y activas vs. inactivas) ha ayudado a determinar las características de disbiosis en pacientes infectados por C. difficile. El grupo taxonómico de C. difficile estaba preferentemente opsonizado por inmunoglobulina A secretora. En los pacientes no infectados, otras bacterias potencialmente patogénicas también eran opsonizadas por inmunoglobulina A secretora. Los grupos de bacterias beneficiosas, como Lactobacillales and Clostridium grupo IV eran inactivas en los pacientes infectados. Por las condiciones medioambientales (como tratamiento antibiótico) estas bacterias bajan su actividad lo que promueve la producción de toxinas por C. difficile aunque su proporción en el intestino sea muy baja (puede ser tan solo 0.0001 %) y aunque sea reconocido por el sistema inmune. No hubiese sido posible encontrar estos indicadores de disbiosis aplicando los métodos de metagenómica rutinaria en la que se analiza la comunidad bacteriana no fraccionada. La citometría de flujo es un método para contar las células hibridadas con sondas fluorescentes específicas de especies de interés. Cuando C. difficile se ha cultivado en conjunto con B. longum en medio sin bacteriocinas, la proporción de las dos especies era similar, oscilaba entre 22.7 y 77.9 % durante toda la curva de crecimiento de 12 horas. En el cultivo con el 8-hidroxiquinoleína el contenido de C. difficile bajó después de 4 horas (8.8-17.5 %). El crecimiento de B. longum no se vió afectado por 8-hidroxiquinoleína. Este estudio demuestra que el efecto de 8-hidroxiquinoleína es selectivo contra C. difficile y no afecta a las bifidobacterias. Por eso podria servir como tratamiento contra la infección por C. difficile. Las secuencias genómicas de las 10,000 células de C. difficile separadas de heces de un paciente infectado se han mapeado al genoma de referencia de la cepa 630. Sin embargo varias regiones específicas para esta cepa faltaban por lo que se puede concluir que el paciente era infectado por otra(s) cepa(s). El estudio del polimorfismo de un solo nucleótido ha detectado dos variantes del mismo nucleótido en varias ocasiones. Los polimorfismos detectados en los genes de toxina A y B se han confirmado por secuenciación de los amplicones de estas regiones. Aunque la cobertura del genoma de referencia no era suficiente para completar el ensamblaje, este método puede servir para detectar las infecciones por cepas múltiples y así reducir los gastos que surgieran si se secuencian las cepas aisladas por el cultivo microbiológico. Además, la separación de células de C. difficile por la citometría de flujo no está sesgada por la diferente formas de crecimiento de las cepas. En los proyectos genómicos de esta tesis queríamos evitar el uso de enriquecimiento con la polimerasa ?, ya que esta forma secuencias corruptas. Se ha construido una librería de secuenciación que contenía el mínimo número de fragmentos de ADN que se deben cargar en una placa de secuenciación de la plataforma 454 a partir de tan solo 10,000 células de E. coli contadas por el citómetro. El optimizado protocolo de la preparación de las librerías de secuenciación empleaba sonicación en lugar de la nebulización y las librerías se cuantificaban por la PCR cuantitativa. El protocolo optimizado daba una cobertura uniforme del genoma de E. coli. Los resultados se compararon con la muestra enriquecida con la polimerasa ? que generó secuencias corruptas (97.8 % se las secuencias) y tan solo 2.45 % del genoma de E. coli estuvo cubierto. En el siguiente proyecto se ha utilizado el protocolo anterior para secuenciar tan solo 314 partículas virales de heces de un voluntario sano. Se han seleccionado las partículas virales con el mismo contenido de ADN y el mismo tamaño. El ensamblaje de las secuencias metagenómicas resultó en 34 contigs con longitud mayor de 1,000 pares de bases. Esto representa un incremento del número de contigs largos por número de lecturas obtenidas. Siete de estos contigs contenían marcos de lecturas abiertas identificados como partes de proteínas de bacteriófagos. Otros contigs largos también tenían cierta similitud con secuencias de los bacteriófagos. Ninguno de los contigs largos contenía genes bacterianos. No se detectó contaminación por mitocondrias humanas. La citometría de flujo aplicada para fraccionar las partículas virales supone muchas ventajas en la investigación del viroma humano. No solo mejora el ensamblaje sino que también reduce la contaminación por células no virales. En conclusión, esta tesis presenta varios casos en los que la citometría de flujo complementa y aumenta la información biológica que ofrece la metagenómica clásica. Sirve para explicar disbiosis bacteriana en infecciones, para describir las curvas crecimiento de especies mezclados en un cultivo, para detectar la infección por cepas múltiples en un paciente y también sirve para mejorar varios aspectos de los estudios de viroma humano, si se aplican protocolos optimizados de preparación de librerías de secuenciación.