Técnicas estadísticas de clasificación: un estudio comparativo y aplicado

  1. Richard's, María Marta
  2. Solanas Pérez, Antonio
  3. Ledesma, Rubén Daniel
  4. Introzzi, Isabel
  5. López Ramón, María Fernanda
Revista:
Psicothema

ISSN: 0214-9915

Año de publicación: 2008

Volumen: 20

Número: 4

Páginas: 863-871

Tipo: Artículo

Otras publicaciones en: Psicothema

Resumen

El propósito de este trabajo es evaluar y comparar tres técnicas estadísticas de clasificación �regresión logística, análisis discriminante y árboles de clasificación� para identificar las características de personalidad asociadas al riesgo de padecimiento de episodios isquémicos cardiovasculares agudos (EICA). Se utilizaron la tasa de error y el índice C de discriminación como criterios para comparar los resultados obtenidos con las distintas técnicas. El tamaño de la muestra, compuesta por mujeres y hombres con edades comprendidas entre 36 y 80 años, fue igual a 313 participantes, quienes fueron divididos en dos grupos: clínico (n= 143) y control (n= 170), equiparándose por sexo, edad, nivel socioeconómico y nivel educacional. El análisis de los resultados posibilitó la elección de los árboles de clasificación como la técnica más adecuada, ya que aporta un porcentaje de predicción más elevado, un tratamiento simple de los datos y una significativa interpretación clínica. Los resultados posibilitaron reducir a 9, de las 22 originales, las escalas de personalidad asociadas a una mayor probabilidad de padecer EICA y generar un modelo empírico de siete perfiles de personalidad asociados al aumento de la probabilidad de EICA y cinco perfiles de personalidad vinculados a la ausencia de patología.

Referencias bibliográficas

  • Abbate-Daga, G., Amianto, F., Rogna, L., y Fassino, S. (2007). Do anorectic men share personality traits with opiate dependent men?: A case-control study. Addictive Behaviors, 32, 170-174.
  • American Heart Association Journal Report (1996). Being, chronically “blue” raises risk of heart attack, all cause mortality. NR-96-4416, (Circ/Barefoot).
  • APA (1995). American Psychiatric Association. Manual diagnóstico y estadístico de los trastornos mentales. DSM-IV. Barcelona: Masson (orig. 1994).
  • Berry, M.J.A. (1997). Data mining techniques for marketing, sales and customer support. New Cork: John Wiley & Sons.
  • Breiman, L., Friedman, J.H., Olshen, R.A., y Stone, C.J. (1998). Classification and regression trees. Boca Raton: Chapman & Hall.
  • Buceta, J.M., y Bueno, A.M. (1996). Tratamiento psicológico de hábitos y enfermedades. Madrid: Pirámide.
  • Denollet, J., Sys, S.U., Stroobant, N., Rombouts, H., Gillebert, T.C., y Brutsaert, D.L. (1996). Personality as independent predictor of longterm mortality in patients with coronary heart disease. The Lancet, 347, 417-421.
  • Denollet, J., Vaes, J., Dirk, L., y Brutsaert, D.L. (2000). Inadequate response to treatment in coronary heart disease: Adverse effects of type D personality and younger age on 5-year prognosis and quality of life. Circulation, 102, 630-635.
  • Freeman, M.S., Hayes, B.G., Kuch, T.H., y Taub, G. (2007). Personality: A predictor of theoretical orientation of students enrolled in a counseling theories course. Counselor Education and Supervision, 46, 254-265.
  • Hair, J.F., Anderson, R., Tatham, R.L., y Black, W.C. (1999). Análisis multivariante. Madrid: Prentice Hall.
  • Harrell, F.E., y Lee, K.L. (1985). A comparison of the discrimination of discriminant analysis and logistic regresión under multivariate normality. En P.K. Sen (Ed.): Biostatistics in biomedical: Public Health and Envirommental Sciences (pp. 333-343). North-Holland: Elsevier Science Publishers.
  • Kantarazic, M. (2003). Data mining. Concepts, models, methods and algorithms. New York: John Wiley & Sons.
  • Ledesma, R., Molina, G., Young, F.W., y Valero-Mora, P. (2007). Desarrollo de técnicas de visualización multiple en el programa ViSta : ejemplo de aplicación al análisis de componentes principales. Psicothema, 19, 497-505.
  • Marso, S., Griffin, B., y Topol, E. (2002). Cardiología. Madrid: Marban. McGee, D.L., Reed, D., y Yano, K. (1984). The results of logistic analysis when the variables are highly correlated. American Journal of Epidemiology, 37, 713-719.
  • Micceri, T. (1989). The unicorn, the normal curve and other improbable criatures. Psychological Bulletin, 105, 156-166.
  • Millon, T. (1999). Inventario Clínico Multiaxial de Millon-II [MCMI-II] Madrid: TEA Publicaciones de Psicología Aplicada.
  • Millon, T., y Davis, R. (2000). Personality disorders in modern life. New York: Wiley & Sons.
  • Montero, L. (2004). Open course ware. Universidad Politécnica de Catalunya. Recuperado el 13/02/08, de Internet: http://emd.upc.edu/gestor/index.php?idcentre=270&id_assig=270-6-28008&idtit=6&propia=yes
  • Picón, E., y Varela, J. (2000). Segmentando mercados con análisis conjunto. Una aplicación al sector turístico. Psicothema, 12, 453-458.
  • Picón, E., Varela, J., y Lévy, J.P. (2004). Segmentación de mercados. Aspectos estratégicos y metodológicos. Madrid: Pearson Educación, S.A.
  • Pohar, M., Blas, M., y Turk, S. (2004). Comparison of logistic regresion and linear discriminant analysis: A simulation study. Metodoloskizvezki, 1, 143-161.
  • Rice, K.G., y Ashby, J.S. (2007). An efficient method for classifying perfectionists. Journal of Counseling Psychology, 54, 72-85.
  • Richard’s, M.M., y Solanas, A. (en prensa). Millon’s Personality Model and ischemic cardiac-vascular acute episodes: Profiles of risk in a decision tree. International Journal of Clinical and Health Psychology.
  • Román, M.V., y Lévy, J.P. (2003). Clasificación y segmentación jerárquica. En J.P. Lévy y J. Varela (Eds.): Análisis multivariable para las ciencias sociales (pp. 567-630). Madrid: Pearson-Prentice Hall.
  • Sawilowsky, S.S., y Blair, R.C. (1992). A more realistic look at the robustness and Type II error properties of the t test to departures from population normality. Psychological Bulletin, 111, 352-360.
  • Silva, L.C., y Barroso Ultra, I.M. (2001). Selección algorítmica de modelos en las aplicaciones biomédicas de la regresión múltiple. Medicina Clínica, 116, 741-745.
  • SPSS Inc. (2001). Clementine 6.0 User’s Guide. Chicago, IL: Author.
  • Welin, C., Lappas, G., y Wilhelmsen, L. (2000). Independent importance of psychosocial factors for prognosis after myocardial infarction. Journal Internal of Medicine, 247, 629-639.
  • Worth, A.P., y Cronin, M.T.D. (2003). The use of discriminant analysis, logistic regresión and classification tree analysis in the development of classification models for human health effects. Theochem, 622, 97-111.
  • Young, F., Ledesma, R., Molina, G., Valero, P., y Llorens, A. (2001). ViSta «The Visual Statistics System». Metodología de Encuestas, 3, 127-133.
  • Yusuf, S., Hawken, S.P., Ôunpuu, S., Dans, T., Avezum, A., Lanas, F., McQueen, M., Budaj, A., Pais, P., Varigos, J., y Lisheng, L. (2004). Effect of potentially modifiable risk factors associated with myocardial infarction in 52 countries (The interheart study): Case-control study. The Lancet, 364, 937-952.
  • Zellweger, M.J., Osterwalder, R.H., Langewitz, W., y Pfisterer, M.E. (2004). Coronary artery disease and depression. European Heart Journal, 25, 3-9.