Test-Retest Confiabilidad / Repetibilidad

Actualizado por ultima vez el 5 de febrero de 2022, por Luis Benites.

Confiabilidad de prueba-reprueba

Fiabilidad test-retest

La confiabilidad de la prueba se mide con una correlación test-retest.

La confiabilidad de prueba y repetición de prueba (a veces llamada confiabilidad de repetición de prueba) mide la consistencia de la prueba: la confiabilidad de una prueba medida a lo largo del tiempo. En otras palabras, administre la misma prueba dos veces a las mismas personas en diferentes momentos para ver si las puntuaciones son las mismas. Por ejemplo, realice la prueba un lunes y luego nuevamente el lunes siguiente. Luego se correlacionan las dos puntuaciones.
El sesgo es un problema conocido con este tipo de prueba de confiabilidad, debido a:

  • Retroalimentación entre pruebas,
  • Los participantes adquieren conocimientos sobre el propósito de la prueba, por lo que están más preparados la segunda vez.

Esta prueba de confiabilidad también puede tomar mucho tiempo para calcular las correlaciones. Dependiendo de la cantidad de tiempo entre las dos pruebas, esto podría ser meses o incluso años.

Cálculo de los coeficientes de confiabilidad Test-Retest

Encontrar un coeficiente de correlación para los dos conjuntos de datos es una de las formas más comunes de encontrar una correlación entre las dos pruebas. Los coeficientes de confiabilidad test-retest (también llamados coeficientes de estabilidad) varían entre 0 y 1, donde:

  • 1: fiabilidad perfecta,
  • ≥ 0,9: excelente fiabilidad,
  • ≥ 0,8 < 0,9: buena fiabilidad,
  • ≥ 0,7 < 0,8: fiabilidad aceptable,
  • ≥ 0,6 < 0,7: fiabilidad cuestionable,
  • ≥ 0,5 < 0,6: escasa fiabilidad,
  • < 0,5: fiabilidad inaceptable,
  • 0: sin fiabilidad.

En esta escala, una correlación de .9 (90%) indicaría una correlación muy alta (buena confiabilidad) y un valor de 10% muy baja (mala confiabilidad).

  • Para medir la confiabilidad de dos pruebas, use el coeficiente de correlación de Pearson . Una desventaja: sobrestima la verdadera relación para muestras pequeñas (menos de 15).
  • Si tiene más de dos pruebas, use Correlación intraclase . Esto también se puede usar para dos pruebas y tiene la ventaja de que no sobrestima las relaciones para muestras pequeñas. Sin embargo, es más difícil de calcular, en comparación con la simplicidad de Pearson.

Referencias

Everitt, BS; Skrondal, A. (2010), The Cambridge Dictionary of Statistics , Cambridge University Press.
Lindström, D. (2010). Schaum’s Easy Outline of Statistics , segunda edición (Schaum’s Easy Outlines) 2ª edición. Educación McGraw-Hill
Vogt, WP (2005). Diccionario de estadística y metodología: una guía no técnica para las ciencias sociales . SABIO.
Wheelan, C. (2014). Estadísticas desnudas . WW Norton y compañía

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué son las “Estadísticas Paramétricas”? Paramétrico puede referirse a (haga clic para pasar a la sección): Pruebas estadísticas paramétricas Datos…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!