Diseño, desarrollo e implementación de una plataforma bioinformática orientada al análisis y gestión de infomación en epidemiología molecular
- Amadoz Navarro, Alicia
- Fernando González Candelas Director
Universidad de defensa: Universitat de València
Fecha de defensa: 21 de octubre de 2011
- Julio A. Rozas Liras Presidente/a
- Esther de Ves Cuenca Secretaria
- Juan José Abellán Andrés Vocal
- Francisco Xavier López Labrador Vocal
- Elisa Martró Català Vocal
Tipo: Tesis
Resumen
La investigación genética y epidemiológica de las enfermedades infecciosas requiere actualmente grandes cantidades de datos. En un laboratorio de tamaño medio, la información necesaria para realizar estudios de investigación suele almacenarse de forma independiente en diferentes formatos y lugares, lo que dificulta su gestión y análisis. Esta organización de la información conlleva que el trabajo habitual en un laboratorio se realice de forma lenta y desordenada. En esta situación, la integración de la información es de vital importancia para poder llevar a cabo estos trabajos de forma eficiente, sistematizada y común a todos los investigadores del laboratorio. La principal motivación de esta tesis fue cubrir la necesidad de un sistema de gestión y análisis de datos de forma sencilla, flexible y fiable. El objetivo principal de esta tesis consistió en el desarrollo de un sistema de información orientado al área de epidemiología molecular de patógenos infecciosos, que permitiese almacenar y analizar de forma centralizada la información clínica de pacientes junto con la información molecular de los patógenos de interés. En los últimos años, la bioinformática se ha convertido en una parte esencial de las soluciones eficientes de integración, transformación y creación de nueva información. epiPATH, la plataforma bioinformática que presentamos en esta tesis, consta de dos grupos de herramientas diferenciadas pero, a su vez, diseñadas para interactuar entre sí facilitando el manejo y análisis de grandes cantidades de datos. Por un lado, diseñamos y desarrollamos una base de datos junto con varias aplicaciones que facilitan su gestión y, por otro lado, integramos y desarrollamos diferentes aplicaciones de análisis que permitiesen realizar estudios epidemiológicos, evolutivos y poblacionales de las secuencias moleculares de los patógenos. El almacenamiento conjunto de datos clínicos de pacientes y de datos moleculares de patógenos en una base de datos centraliza la búsqueda y la gestión de información, facilitando comparaciones entre ellos y estudios sobre infecciones múltiples. Además, permite el estudio de la variación que existe dentro de los distintos patógenos y los cambios que registran a lo largo de su evolución, hasta su distribución en distintos pacientes con diferentes afecciones y cuadros clínicos. En este sentido, epiPATH también facilita la vigilancia epidemiológica basada en señales específicas de la enfermedad, mediante la identificación de regiones patógenas a través de la comparación de secuencias cuyos pacientes tengan un perfil clínico determinado. epiPATH incluye información desde el momento en que un paciente acude a un centro de salud hasta el análisis molecular del patógeno en el laboratorio. La información que recoge esta base de datos comienza en los lugares donde se puede encontrar un patógeno. Después, se puede recoger información clínica del paciente cuando acude al médico, se le realizan pruebas clínicas y se puede obtener información sobre el tipo de transmisión. Posteriormente, se aplica un tratamiento y se recogen muestras del patógeno que siguen un procesado de laboratorio. En el laboratorio, se obtienen secuencias que corresponden a un patógeno determinado asociado, en algunos casos, a un brote epidemiológico. Por otro lado, las secuencias pueden analizarse con métodos filogenéticos y publicarse en distintos trabajos generando una bibliografía. La integración de herramientas de análisis junto con la información almacenada en la base de datos facilita las tareas del flujo de trabajo habitual en un laboratorio y en colaboraciones con otras instituciones, preservando la información del acceso público. Además, los programas de análisis de genética poblacional y evolutiva desarrollados en esta tesis (epiPATH-tools) son de gran utilidad y permiten el análisis masivo de datos. Las epiPATH-tools incluyen el cálculo de parámetros relevantes en el estudio de la divergencia, posiciones sinónimas y no-sinónimas, pruebas de neutralidad y estudio de polimorfismos.