¿Qué es la restricción de rango?

Actualizado por ultima vez el 7 de mayo de 2021, por .

A menudo, en estadística, nos interesa medir la correlación entre dos variables. Esto nos ayuda a comprender lo siguiente:

  • La dirección de la relación entre dos variables.A medida que aumenta una variable, ¿la otra variable tiende a aumentar o disminuir?
  • La fuerza de la relación entre dos variables.¿Qué tan cerca cambian de valor las dos variables?

Desafortunadamente, un problema que puede ocurrir al medir la correlación entre dos variables se conoce como restricción de rango . Esto ocurre cuando el rango de valores medidos para una de las variables está restringido por alguna razón.

Por ejemplo, supongamos que nos gustaría medir la correlación entre las horas estudiadas y la puntuación del examen de los estudiantes de una escuela en particular.

Si recopilamos datos sobre estas dos variables para los 1000 estudiantes de la escuela, podemos encontrar que la correlación entre las horas estudiadas y la puntuación del examen es 0,73 .

Esta correlación es bastante alta, lo que indica una fuerte relación positiva entre las dos variables. A medida que los estudiantes estudian más, tienden a obtener puntajes más altos en los exámenes.

Sin embargo, suponga que solo recopilamos datos para estudiantes en cursos de Honores. Puede resultar que todos estos estudiantes hayan estudiado durante al menos 6 horas.

Así, si calculamos la correlación entre las horas estudiadas y la puntuación del examen de estos alumnos, estaríamos utilizando un rango restringido para la variable horas estudiadas .

Ejemplo de rango restringido

Si ampliamos la gráfica de dispersión para el rango donde Horas es mayor que 6, así es como se ve la gráfica:

Diagrama de dispersión para el ejemplo de rango restringido

La correlación entre las dos variables en este gráfico resulta ser 0.37 , que es significativamente menor que 0.73 .

Por lo tanto, si solo recopilamos datos sobre las horas estudiadas y la puntuación del examen para los estudiantes en los cursos de Honores, podríamos asumir que existe una relación débil entre las horas estudiadas y la puntuación del examen.

Sin embargo, este resultado sería engañoso porque usamos un rango restringido para una de las variables.

Ejemplos del mundo real de rango restringido

El problema de un rango restringido puede ocurrir en muchos estudios de investigación diferentes en la práctica. Aqui hay un par de ejemplos:

1. Estudios de deportistas de alto rendimiento . Los investigadores pueden estar interesados ​​en estudiar si un determinado régimen de ejercicios produce más masa muscular que un régimen estándar.

Si los investigadores solo recopilan datos de atletas de alto rendimiento, es probable que todos estos atletas ya tengan una gran cantidad de masa muscular, por lo que habrá un rango estrecho de valores disponibles para calcular la correlación entre el régimen de entrenamiento y la masa muscular producida.

2. Estudios de estudiantes de alto rendimiento. Los investigadores pueden estar interesados ​​en estudiar si un determinado programa de tutoría tiene o no un efecto positivo en las calificaciones. Por naturaleza, los estudiantes que están ansiosos por mejorar sus calificaciones y participar en el programa de tutoría pueden ya ser estudiantes de alto rendimiento.

Por lo tanto, es posible que no haya mucho margen de mejora en las calificaciones de estos estudiantes. Cuando los investigadores calculan la correlación entre las horas dedicadas al programa de tutoría y el aumento resultante en las calificaciones, la verdadera correlación puede subestimarse porque el rango de mejora en las calificaciones se ha restringido.

Cómo contabilizar rangos restringidos

Una forma popular de explicar los rangos restringidos se conoce como el Caso 2 de Thorndike , una fórmula desarrollada por el psicometrista Robert L. Thorndike.

Esta fórmula proporciona una estimación de la correlación real entre dos variables y utiliza el siguiente cálculo:

Correlación verdadera = √ (1- (SD 2 y restringido -SD 2 y no restringido )) * (1-r 2 restringido )

dónde:

  • DE 2 y restringido : la desviación estándar al cuadrado de los datos disponibles sobre la variable de respuesta y.
  • DE 2 y sin restricciones : la desviación estándar al cuadrado conocida de la variable de respuesta para la población.
  • r 2 restringido : La correlación al cuadrado de los datos restringidos disponibles.

Se ha demostrado que esta fórmula es eficaz para producir estimaciones insesgadas de la correlación verdadera entre dos variables cuando una de las variables tiene un rango restringido.

Tenga en cuenta que para utilizar esta fórmula, debe tener una estimación de la desviación estándar de la población real para la variable de respuesta.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Hay dos formas sencillas de cambiar el título de la leyenda en un gráfico ggplot2: Método 1: usar labs ()…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!