Anàlisi discriminant discreta mitjançant suavització de les correspondències múltiples

Pruñonosa Reverter, Jose Vicente

Anàlisi discriminant discreta mitjançant suavització de les correspondències múltiples

Pruñonosa Reverter, Jose Vicente

Dirigida por:

Mario Sendra Pina Director

Universidad de defensa: Universitat de València

Fecha de defensa: 13 de julio de 2004

Tribunal:

Francisco Montes Suay Presidente
José Domingo Bermúdez Edo Secretario
Jorge Mateu Mahiques Vocal
Emilio A. Carbonell Guevara Vocal
Mario Plaza Delgado Vocal

Departamento:

Estadística i Investigació Operativa

Tipo: Tesis

Teseo: 103260 DIALNET TDX editor

Resumen

El punt de partida del mètode que es presenta en aquest treball és la suposició que les variables discretes procedeixen dunes subjacents, mixtures de normals, que han estat tallades en intervals a cada marginal i permutades posteriorment. Daquesta manera podem considerar, com és habitual a la literatura, que els factors significatius afecten a la mitjana de les variables subjacents mentre que els no significatius determinen una dispersió gaussiana arreu dels valors centrals de classe. La discretització serà, al seu torn, producte bé de fenòmens dacumulació-umbralització, típics de molt processos biològics, bé de la imprecisió inherent a laparell de mesura. Lesforç es va centrar, com a conseqüència, en retrobar el més acuradament possible la distribució de probabilitat contínua subjacent i posteriorment aplicar una metodologia de discriminació amb variables contínues. Per tal d'aconseguir aquest objectiu reconstructor , es van desenvolupar dues fases: A la primera, i mitjançant una anàlisi de correspondències múltiples convenientment adaptada a lobjectiu discriminant, se cercaren quantificacions que aproximessin les mitjanes de les celles i a la segona, emprant, un procediment de suavització basat en lalgorisme EM, es va completar la reproducció de la distribució subjacent aplicant una dispersió al voltant daquestes mitjanes. Al Capítol 1 sanalitzen les definicions bàsiques de lanàlisi discriminant i es fa una revisió dels mètodes existents amb lobjectiu esmentat. El segon i el tercer capítol se centren a fer lequivalent amb lanàlisi de correspondències i els mètodes de suavització (fonamentalment kernel i EM) com a elements bàsics a combinar per tal daconseguir l'esmentada reconstrucció. Al Capítol 4 es fa la proposta metodològica i es demostra el resultat que li dóna fonament matemàtic. Finalment, al capítol 5, es discuteixin els resultats amb dades simulades i reals, arribant a les següents conclusions: La prova del mètode amb dades simulades utilitzant un model de normals subjacents amb mitjana diferent per classe i variància comuna pot valorar-se com positiva ja que els seus resultats superen els altres procediments amb què sha comparat. Es considera que aquests esperançadors resultats es deuen a la solidesa del resultat matemàtic provat al capítol 4, el qual ens garanteix que la reconstrucció de les dades subjacents contínues es realitza en la direcció correcta. Daltra banda si la suposició duna multinormal subjacent s'interpreta com el final dun ampli ventall de processos investigadors quan finalment saconsegueix destriar la part rellevant de la que no ho és (en termes de distribució de probabilitat) no resulta sorprenent que un mètode basat en aquestes premisses obtingui bons resultats pràctics, tal i com succeeix als dos exemples reals, de molt diferent procedència, però duna elevada complexitat, analitzats. __________________________________________________________________________________________________