Métodos de aprendizaje máquina aplicados a la predicción del consumo eléctrico de edificios.
- Vergara Pla, Gonzalo
- Emilio Soria Olivas Director
- José Antonio Gámez Martín Director/a
Universidad de defensa: Universidad de Castilla-La Mancha
Fecha de defensa: 23 de julio de 2015
- Marcelino Martínez Sober Presidente
- José Miguel Puerta Callejón Secretario/a
- Manuel Domínguez González Vocal
Tipo: Tesis
Resumen
1. Introducción: Actualmente el número de datos disponibles en el ámbito científico, industrial, académico o de las administraciones crece de constantemente. En concreto podemos encontrar un gran número de series temporales con datos de tipo ambiental, temporal o eléctrico en el ámbito de los edificios. Durante los últimos 20 años se han planteado métodos, que podríamos llamar clásicos, para la predicción y modelización de estas series temporales existiendo un gran cuerpo de conocimiento. Sin embargo muchos de estos modelos presentan limitaciones cuando la serie temporal presenta una alta no linealidad, es no estacionaria, presenta datos atípicos o se tiene una fuerte presencia de ruido, como ocurre en la mayoría de series que encontramos en edificios. Actualmente las técnicas de aprendizaje máquina (soft-computing, redes neuronales artificiales, redes bayesianas, máquinas de vectores soporte, árboles de regresión, etc.) se están aplicando en un gran número de campos del conocimiento siendo en el campo de los edificios donde menos se utilizan. Este tipo de métodos es más robusto que otros métodos frente a los problemas anteriormente comentados lo que los hace especialmente interesantes en estas aplicaciones. En esta tesis se plantea analizar la aplicación de estos métodos en una serie de problemas energéticos relacionados con la predicción y modelización de series temporales eléctricas. En todos los problemas tratados ocurre que la variable a predecir es determinante para el ahorro en términos energéticos económicos con el consiguiente beneficio medioambiental. 2. Contenido de la investigación: La investigación realizada en este tesis cubre un capítulo de la descripción de los 30 edificios disponibles pertenecientes al campus de la Universidad de León. En segundo lugar describimos el preprocesado realizado tanto a nivel de los datos como con los edificios. En la parte metodológica se detallan los métodos clásicos de series temporales desde una perspectiva univariante. Los métodos multivariantes lineales utilizados son regresión lineal clásica y robusta. Los métodos no lineales aplicados de modo global han sido: perceptrón multicapa, máquinas de vectores soporte, árboles de regresión y árboles de modelos y máquinas de aprendizaje extremo (ELM). Dentro de los métodos locales se han utilizado técnicas de clustering junto con regresión lineal, máquinas de vectores soporte y máquinas de aprendizaje extremo. Dentro de los métodos de agregación se han probado los métodos random forests y bagging y estos han servido de base para la introducción de una técnica novedosa llamada random extreme learning machines. Este método es un bagging modificado que utiliza como modelos base los ELM. En la parte de resultados se describen los experimentos y resultados obtenidos en todos los modelos contruidos. En los modelos autorregresivos destacan los buenos resultados obtenidos al utilizar series diarias y no horarias como se hizo en un principio. En la parte no lineal destacan las altas prestaciones del perceptrón multicapa así como de las máquinas de vectores soporte y de los árboles de modelos. Dentro de los modelos locales no hemos obtenido resultados del nivel de los anteriores métodos no lineales globales. Sin embargo es en los modelos de agregación donde hemos conseguido mejorar las predicciones en días laborables respecto al resto de modelos superando incluso al mejor de los métodos que es el perceptrón multicapa con dos capas ocultas. 3. Conclusión: Existe una gran variedad de métodos utilizados para predecir el consumo eléctrico de edificios. Los métodos clásicos presentan limitaciones y por ello se han comparado con métodos más modernos de tipo no lineal en similares condiciones durante el proceso de aprendizaje. A nivel global los mejores resultados corresponden al perceptrón con dos capas ocultas y una capa oculta seguido por las máquinas de vectores soporte. Sin embargo cuando nos centramos en días de mayor consumo como son días laborables la nueva técnica propuesta RELM mejora a todos los modelos construidos y además es más rápida de aprender que el perceptrón multicapa. La nueva metodología abierta tras esta tesis permite mantener diferentes líneas de investigación abiertas como son: diferentes técnicas de agregación con ELM, métodos de agregación con otros modelos, utilización de RELM con conjuntos de datos de distinta naturaleza.