Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 11 de septiembre de 2021, por Luis Benites.
Los residuos estandarizados son muy similares al tipo de estandarización que realiza anteriormente en estadísticas con puntajes z . Los puntajes Z le permiten estandarizar las distribuciones normales para que pueda comparar sus valores; los residuos estandarizados normalizan sus datos en análisis de regresión y pruebas de hipótesis de chi cuadrado.
Un residuo estandarizado es una relación: La diferencia entre el conteo observado y el conteo esperado y la desviación estándar del conteo esperado en la prueba de chi-cuadrado. La frase “la relación entre la diferencia entre el conteo observado y el conteo esperado y la desviación estándar del conteo esperado” suena como un trabalenguas, pero en realidad es más fácil de explicar con una ecuación.
Residual estandarizado = (recuento observado – recuento esperado) / √recuento esperado
Básicamente, está tomando una frecuencia observada (algo que mide) para una categoría particular en una tabla de contingencia y comparándola con la frecuencia esperada para esa categoría. La frecuencia «esperada» se basa en su hipótesis nula , o hecho aceptado, para esa categoría en particular.
¿Qué significan los residuos estandarizados?
El residual estandarizado es una medida de la fuerza de la diferencia entre los valores observados y esperados. Es una medida de cuán significativas son sus celdas para el valor de chi-cuadrado. Cuando compara las celdas, el residuo estandarizado facilita ver qué celdas contribuyen más al valor y cuáles contribuyen menos. Si su muestra es lo suficientemente grande, el residual estandarizado se puede comparar aproximadamente con un puntaje z . La estandarización puede funcionar incluso si sus variables no se distribuyen normalmente.
Regla general para interpretar residuos estandarizados
Una regla general para averiguar qué significa el residuo estandarizado es:
- Si el residual es menor que -2, la frecuencia observada de la celda es menor que la frecuencia esperada.
- Mayor que 2 y la frecuencia observada es mayor que la frecuencia esperada.
Si sus residuos son +/-3, significa que está sucediendo algo extremadamente inusual. Si obtienes +/-4, ¡es algo de Twilight Zone! Esto tiene sentido si piensa en la regla 68 95 99.7 : si sus datos se distribuyen normalmente, el 95% de sus datos deberían estar dentro de 2 desviaciones estándar de la media . Si tiene algo más grande que eso, entonces está viendo un valor atípico .
Residuos ajustados
Los residuos ajustados son otra forma de hacer lo mismo: compare los resultados de su celda. La fórmula para el residual ajustado es:
Residual ajustado = (observado – esperado) / √[esperado x (1 – proporción total de fila) x (1- proporción total de columna)]
Los residuos ajustados se utilizan en el software (como el software SDA de la Universidad de California en Berkeley). Ese software en particular colorea las celdas de rojo si tienen recuentos más grandes de lo esperado y de azul si tienen recuentos más bajos de lo esperado.
Supongamos que desea calcular los residuos ajustados para la celda A en la siguiente tabla:
- La proporción total de la fila para la celda A es 39/90 = 0,43
- La proporción total de la columna para la celda A es 39/130 = 0,3
Referencias
Everitt, BS; Skrondal, A. (2010), The Cambridge Dictionary of Statistics , Cambridge University Press.
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: