Algoritmos de agrupamiento basados en densidad y validación de clusters

  1. Pascual González, Damaris
Supervised by:
  1. J. S. Sanchez Director
  2. Filiberto Pla Bañón Director

Defence university: Universitat Jaume I

Fecha de defensa: 11 March 2010

Committee:
  1. Francesc Josep Ferri Rabasa Chair
  2. Ramón Alberto Mollineda Cardenas Secretary
  3. José M. Iñesta Quereda Committee member
  4. José Martínez Sotoca Committee member
  5. Mateu Sbert Casasayas Committee member

Type: Thesis

Teseo: 288157 DIALNET

Abstract

El Reconocimiento de Patrones y en particular las estrategias de clasificación no supervisadas, adquieren cada vez mayor importancia debido al coste de obtener suficiente cantidad de muestras etiquetadas, Además, en grandes volúmenes de datos son necesarios los algoritmos de agrupamiento para descubrir información relevante acerca de la estructura interna de los datos sin tener información alguna a priori. Uno de los resultados de la presente tesis doctoral es el diseño de dos algoritmos de agrupamiento, H-Density y DHG, dirigidos a eliminar algunas de las desventajas de algunos de los métodos existentes. Estos algoritmos constituyen una estrategia híbrida entre los enfoques basado en densidad y jerárquico, y constan de dos etapas: en la primera se emplea una función de densidad que divide la base de datos en grupos y en la segunda se desarrolla una estrategia jerárquica que une en cada nivel los dos grupos más semejantes. También se han diseñado dos métodos de validación de agrupamientos con el objetivo de evaluar el resultado de los algoritmos y determinar el número de grupos existentes en una base de datos. Se muestran los resultados de los experimentos sobre bases de datos sintéticas y reales.