Elaboración de un tesauro de información de actualidad y conversión en red semántica para su empleo en un sistema de recuperación periodístico

  1. Castillo Blasco, Lourdes
unter der Leitung von:
  1. Alejandro de la Cueva Martín Doktorvater/Doktormutter

Universität der Verteidigung: Universitat de València

Fecha de defensa: 03 von Januar von 2008

Gericht:
  1. María Eulàlia Fuentes Pujol Präsident/in
  2. María Francisca Abad García Sekretärin
  3. Lluís Codina Bonilla Vocal
  4. Francisco Javier García Marco Vocal
  5. Rafael Aleixandre Benavent Vocal

Art: Dissertation

Teseo: 132316 DIALNET lock_openTDX editor

Zusammenfassung

Las experiencias iniciales con el motor de búsqueda e indización automática RetrievalWare en un centro de documentación de información de actualidad, demostraron que las asociaciones semánticas establecidas en el diccionario del sistema no ofrecían un rendimiento totalmente satisfactorio para este tipo de centros. La razón principal es la naturaleza de la red incorporada, elaborada a partir de un diccionario enciclopédico general. Por ello este trabajo plantea la posibilidad de adaptar un tesauro tradicional a las estructuras de diccionarios de este sistema y comparar el efecto de la utilización de un lenguaje controlado (tesauro) y una red semántica basada en unitérminos del lenguaje natural sobre una misma colección documental (base de datos Prensa) y sobre un sistema de recuperación basado en un motor de recuperación y de indización automática (RetrievalWare). Para conseguir este objetivo general ha sido necesario llevar a cabo la creación de un vocabulario controlado, un tesauro de información de actualidad; la conversión de las relaciones paradigmáticas de este tesauro en relaciones cuantitativas, de las que se emplean en redes semánticas, comprobar su funcionamiento y realizar una valoración paralela del rendimiento en la recuperación del tesauro construido y convertido en red semántica y de la red semántica prediseñada por los distribuidores de RetrievalWare. El plan de trabajo y la metodología correspondiente se ha dividido en tres fases, atendiendo a los objetivos planteados. La primera fase ha consistido en la selección y registro de términos. Las fuentes empleadas para la extracción de los términos han tenido en cuenta tanto el criterio de autoridad literaria como el criterio de autoridad del usuario. En la segunda fase se ha elaborado el tesauro con los términos seleccionados utilizando la base de datos relacional Access y en la última fase se han exportado, también mediante Access, los términos del tesauro a un informe compatible con la estructura de la red semántica de RetrievalWare. Para la comprobación automática de errores se han utilizado programas de gestión automática de tesauros. Posteriormente se han realizado pruebas del funcionamiento del nuevo tesauro incorporado como red y además se ha comparado su rendimiento con el diccionario establecido por el sistema. El estudio del rendimiento emplea a usuarios reales que expresan sus solicitudes de información y, posteriormente, juzgan la relevancia de los resultados obtenidos en los procesos de búsqueda, permitiendo el cálculo de exhaustividad y precisión de cada sistema.