Supuestos y consideraciones en los estudios empíricos sobre el funcionamiento diferencial de los items

  1. Ferreres Traver, Adoración
  2. Fidalgo Aliste, Ángel Manuel 1
  1. 1 Universidad de Oviedo
    info

    Universidad de Oviedo

    Oviedo, España

    ROR https://ror.org/006gksa02

Revista:
Psicothema

ISSN: 0214-9915

Año de publicación: 2002

Volumen: 14

Número: 2

Páginas: 491-496

Tipo: Artículo

Otras publicaciones en: Psicothema

Resumen

En este artículo se analizan tres de los supuestos más comunes en los estudios sobre el funcionamiento diferencial de los ítems (DIF), y las consecuencias de su incumplimiento. Primero, que las muestras utilizadas para evaluar el DIF son muestras estadísticamente representativas de las poblaciones de interés. Segundo, que la mayor parte de los ítems que componen el test son ítems válidos. Tercero, que el coste de cometer un error de Tipo I es mayor que el coste de cometer un error de Tipo II. También se analizan las implicaciones que la significación estadística y práctica, las características de los ítems y de las poblaciones, y, finalmente, la concordancia entre los procedimientos de detección, tienen en los estudios empíricos sobre DIF. En resumen, se indican algunas precauciones que hay que tener presentes al analizar estadísticamente el DIF en datos empíricos.

Referencias bibliográficas

  • Ackerman, T.A. (1992). A didactic explanation of item bias, item impact, and item validity from a multidimensional perspective. Journal of Educational Measurement, 29 (1), 67-91.
  • Camilli, G. y Shepard, L.A. (1994). Methods for identifying biased test items. Newbury Park, CA: Sage.
  • Cuesta, M. (1996). Unidimensionalidad. En J. Muñiz (Coord.), Psicometría (pp. 239-292). Madrid: Universitas.
  • Dorans, N.J. y Holland, P.W. (1993). DIF detection and description: Mantel-Haenszel and standardization. En W.P. Holland y H. Wainer (Eds.), Differential item functioning (pp. 35-66). Hillsdale, NJ: LEA.
  • Ferreres, D., González-Romá, V. y Gómez-Benito, J. (2000). Comparación del estadístico Mantel-Haenszel y la regresión logística en el funcionamiento diferencial de los ítems en dos pruebas de aptitud intelectual en un contexto bilingüe. Psicothema, 12 (2), 214-219.
  • Fidalgo, A.M. (1996). Funcionamiento diferencial de los ítems. En J. Muñiz (Coord.), Psicometría (pp. 370-455). Madrid: Universitas.
  • Fidalgo, A.M., Ferreres, D. y González-Romá, V. (2001, Septiembre). Evaluación del funcionamiento diferencial de los ítems en datos empíricos. Comunicación presentada en el VII Congreso de Metodología de las Ciencias Sociales y de la Salud, Madrid.
  • Fidalgo, A.M., Mellenbergh, G.J. y Muñiz, J. (1998). Comparación del procedimiento Mantel-Haenszel frente a los modelos loglineales en la detección del funcionamiento diferencial de los ítems. Psicothema, 10, 219-228.
  • Fidalgo, A.M., Mellenbergh, G.J. y Muñiz, J. (1999). Efectos de la aplicación del procedimiento Mantel-Haenszel en una etapa, en dos etapas e iterativamente sobre los estadísticos Mantel-Haenszel. Psicológica, 20, 227-242.
  • Fidalgo, A.M., Mellenbergh, G.J. y Muñiz, J. (2000). Effects of Amount of DIF, Test Length, and Purification Type on Robustness and Power of Mantel-Haenszel Procedures. Methods of Psychological Research Online, 5 (3), 43-53. Available: http://www.mpr-online.de
  • Fidalgo, A.M., y Muñiz, J. (en prensa). Líneas de investigación actuales sobre el funcionamiento diferencial de los ítems. Metodología de las Ciencias del Comportamiento.
  • Flowers, C.P., Oshima, T.C., y Raju, N.S. (1999). A description and demonstration of the polytomous-DFIT framework. Applied Psychological Measurement, 23 (4), 309-326.
  • Gierl, M.J., Bisanz, J., Bisanz, G.L., Boughton, K.A. y Khaliq, S.N. (2001). Illustrating the utility of differential bundle functioning analyses to identify and interpret group differences on achievement test. Educational Measurement: Issues and Practice, 20, 26-36.
  • Hattie, J. (1985). Metodology Review: assessing unidimensionality of test and items. Applied Psychological Measurement, 9 (2), 139-164.
  • Hidalgo, M.D. y Gómez, J. (1999). Técnicas de funcionamiento diferencial en ítems politómicos. Metodología de las Ciencias del Comportamiento, 2, 167-182.
  • Hidalgo, M.D. y Lopez-Pina, (2000). Funcionamiento diferencial de los ítems: presente y perspectivas de futuro. Metodología de las Ciencias del Comportamiento, 2, 167-182.
  • Kok, F.G. (1988). Item bias and test multidimensionality. En R. Langeheine y J. Rost (Ed.), Latent trait and latent class models (pp. 263-274). New York: Plenum.
  • Mazor, K.M., Hambleton, R.K. y Clauser, B.E. (1998). Multidimensional DIF analyses: The effects of matching on unidimensional subtest scores. Applied Psychological Measurement, 22 (4), 357-367.
  • Mazor, K.M., Kanjee, A. y Clauser, B.E. (1995). Using logistic regression and the Mantel-Haenszel with multiple ability estimates to detect differential item functioning. Journal of Educational Measurement, 32, 131-144.
  • Miller, M.D. y Linn, R.L. (1988). Invariance of item characteristic functions with variations in instructional coverage. Journal of Educational Measurement, 25, 205-219.
  • Muñiz, J., Hambleton, R.K. y Xing, D. (2001). Small sample studies to detect flaws in item translations. International Journal of Testing, 1(2), 115-135.
  • O’Neill, K.A. y McPeek, W.M. (1993). Item and test characteristics that are associated with differential item functioning. En W.P. Holland y H. Wainer (Eds.), Differential item functioning (pp. 255-276). Hillsdale, NJ: LEA.
  • Oshima, T.C., Raju, N.S. y Flowers, C.P., (1997). Development and de- monstration of multidimensional IRT-based internal measures of differential functioning of items and tests. Journal of Educational Measurement, 34, 253-272.
  • Parshall, C.G., y Miller, T.R. (1995). Exact versus asymptotic Mantel-Haenszel DIF statistics: A comparison of performance under small-sample conditions. Journal of Educational Measurement, 32 (3), 302-316.
  • Penfield, R.D. y Lam, T.C.M. (2000). Assessing differential item functioning in performance assessment: review and recommendations. Educational Measurement: Issues and Practice, 19, 5-15.
  • Rosnow, R.L. y Rosenthal, R. (1989). Statistical procedures and the justification of knowledge in psychological science. American Psychologist, 44, 1276-1284.
  • Roussos, L. y Stout, W. (1996a). A multidimensionality-based DIF paradigm. Applied Psychological Measurement, 20 (4), 355-371.
  • Roussos, L. y Stout, W. (1996b). Simulation studies of the effects of small sample size and studied item parameters on SIBTEST and Mantel-Haenszel type I error performance. Journal of Educational Measurement, 33, 215-230.
  • Ryan, K.E. y Chiu, S. (2001). An examination of item context effects, DIF, and gender DIF. Applied Measurement in Education, 14 (1): 73-90.
  • Shealy, R. y Stout, W. (1993). A model-based standarization approach that separates true bias/DIF from group ability differences and detects test bias/DTF as well as item bias/DIF. Psychometrika, 58, 159-194.
  • Stout, W., Li, H., Nandakumar, R. y Bolt, D. (1997). MULTISIB: a procedure to investigate DIF when a test is intentionally two-dimensional. Applied Psychological Measurement, 21 (3), 195-213.
  • Zieky, M. (1993). Practical questions in the use of DIF statistics in test development. En W.P. Holland y H. Wainer (Eds.), Differential item functioning (pp. 337-347). Hillsdale, NJ: LEA.
  • Zwick, R. (1997). The effect of adaptative administration on the variability of the Mantel-Haenszel measure of differential item functioning. Educational and Psychological Measurement, 57, 412-121.