La transformació contínua de la distància. Estudi i aplicació a un sistema ocr

ARLANDIS NAVARRO, JOAQUIM FRANCESC

La transformació contínua de la distància. Estudi i aplicació a un sistema ocr

ARLANDIS NAVARRO, JOAQUIM FRANCESC

unter der Leitung von:

Juan-Carlos Pérez-Cortés Doktorvater/Doktormutter

Universität der Verteidigung: Universitat Politècnica de València

Fecha de defensa: 16 von März von 2004

Gericht:

Enrique Vidal Ruiz Präsident/in
José Miguel Valiente González Sekretär/in
Luisa Micó Andrés Vocal
Francesc Josep Ferri Rabasa Vocal
Jordi Vitrià Marca Vocal

Art: Dissertation

Teseo: 105677 DIALNET

Zusammenfassung

La presente tesis se centra en dos aspectos relacionados: la técnica de la transformación de la distancia, con aplicación al reconocimiento de caracteres manuscritos, y el estudio integral de un sistema de reconocimiento óptico de caracteres. Se presenta la transformación contínua de la distancia (CDT), una nueva técnica de extracción de características de imágenes multivaluadas que es una generalziación de la transformación de la distancia (DT) clásica aplicable únicamente a imágenes binarias. Se ha hecho la formalización correspondiente y un análisis de sus interpretación natural y ámbitos de aplicación. La aportación se completa con la formulación de una serie de medidas de disimilitud específicas que pueden ser aplicadas en un clasificador basado en distancias que emplee mapas de características de la transformada. Los resultados experimentales presentados usando estas medidas en la clasificación de caracteres manuscritos aislados son positivos, alcanzándose, por ejemplo, un 0.69% de tasa de error en la clasificación de dígitos manuscritos, o un 3.6% de error en el caso de las letras mayúsculas. Así mismo, se aporta y se evalúa una metodología de clasificación para la reducción del tiempo de computación requerido en la clasificación k-vecinos más cercanos empleando kd-trees y medidas de distancia basadas den la CDT, con la que se consigue una reducción muy significativa en el tiempo de computación sin comportar pérdida de prestaciones. Finalmente, se presenta una aproximación a un sistema integral de reconocimiento óptico de caracteres manuscritos en formularios que incluye aportaciones, como p.e., una estrategia de rechazo para la detección de caracteres anormales y uan propuesta para la corrección de las palabras de campos de formulario reconocidas por el clasificador basada en modelos de lenguaje k-explorables. En los dos casos se aportan medidas de fiabilidad originales y experimento