Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 17 de julio de 2024, por Luis Benites.
Muchas pruebas estadísticas se basan en algo llamado supuesto de normalidad .
Esta suposición establece que si recolectamos muchas muestras aleatorias independientes de una población y calculamos algún valor de interés (como la media muestral ) y luego creamos un histograma para visualizar la distribución de las medias muestrales, deberíamos observar una curva de campana perfecta .
Muchas técnicas estadísticas hacen esta suposición sobre los datos, que incluyen:
1. Prueba t de una muestra : se supone que los datos de la muestra se distribuyen normalmente.
2. Prueba t de dos muestras : se supone que ambas muestras tienen una distribución normal.
3. ANOVA : Se asume que los residuos del modelo están distribuidos normalmente.
4. Regresión lineal : se supone que los residuos del modelo están distribuidos normalmente.
Si se viola esta suposición, los resultados de estas pruebas se vuelven poco confiables y no podemos generalizar nuestros hallazgos a partir de los datos de la muestra a la población general con confianza. Por eso es importante comprobar si se cumple esta suposición.
Hay dos formas habituales de comprobar si se cumple este supuesto de normalidad:
1. Visualiza la normalidad
2. Realice una prueba estadística formal
Las siguientes secciones explican los gráficos específicos que puede crear y las pruebas estadísticas específicas que puede realizar para verificar la normalidad.
Visualiza la normalidad
Una forma rápida e informal de comprobar si un conjunto de datos se distribuye normalmente es crear un histograma o una gráfica QQ.
1. Histograma
Si un histograma para un conjunto de datos tiene aproximadamente una forma de campana, es probable que los datos se distribuyan normalmente.
2. Gráfico QQ
Un gráfico QQ, abreviatura de gráfico «cuantiles-cuantiles», es un tipo de gráfico que muestra cuantiles teóricos a lo largo del eje x (es decir, dónde estarían sus datos si siguieran una distribución normal) y cuantiles de muestra a lo largo del eje y (es decir, dónde se encuentran sus datos).
Si los valores de los datos caen a lo largo de una línea aproximadamente recta en un ángulo de 45 grados, se supone que los datos se distribuyen normalmente.
Realizar una prueba estadística formal
También puede realizar una prueba estadística formal para determinar si un conjunto de datos se distribuye normalmente.
Si el valor p de la prueba es menor que un cierto nivel de significancia (como α = 0.05), entonces tiene suficiente evidencia para decir que los datos no se distribuyen normalmente.
Hay tres pruebas estadísticas que se usan comúnmente para probar la normalidad:
1. La prueba de Jarque-Bera
- Cómo realizar una prueba de Jarque-Bera en Excel
- Cómo realizar una prueba de Jarque-Bera en R
- Cómo realizar una prueba de Jarque-Bera en Python
2. La prueba de Shapiro-Wilk
3. La prueba de Kolmogorov-Smirnov
- Cómo realizar una prueba de Kolmogorov-Smirnov en R
- Cómo realizar una prueba de Kolmogorov-Smirnov en Python
Qué hacer si se viola el supuesto de normalidad
Si resulta que sus datos no se distribuyen normalmente, tiene dos opciones:
1. Transforma los datos.
Una opción es simplemente transformar los datos para que se distribuyan de manera más normal. Las transformaciones comunes incluyen:
- Transformación de registro: transforme los datos de y a log (y) .
- Transformación de raíz cuadrada: transforma los datos de y a √y
- Transformación de raíz cúbica: transforma los datos de yay 1/3
- Transformación de Box-Cox: transforme los datos mediante un procedimiento de Box-Cox
Al realizar estas transformaciones, la distribución de los valores de los datos normalmente se distribuye de manera más normal.
2. Realice una prueba no paramétrica
Las pruebas estadísticas que suponen una normalidad se conocen como pruebas paramétricas . Pero también hay una familia de pruebas conocidas como pruebas no paramétricas que no hacen esta suposición de normalidad.
Si resulta que sus datos no se distribuyen normalmente, simplemente puede realizar una prueba no paramétrica. A continuación, se muestran algunas versiones no paramétricas de pruebas estadísticas comunes:
Prueba paramétrica | Equivalente no paramétrico |
---|---|
Prueba t para una muestra | Prueba de rango con signo de Wilcoxon de una muestra |
Prueba t de dos muestras | Prueba U de Mann-Whitney |
Prueba t de muestras pareadas | Prueba de rango con signo de Wilcoxon de dos muestras |
ANOVA unidireccional | Prueba de Kruskal-Wallis |
Cada una de estas pruebas no paramétricas le permite realizar una prueba estadística sin satisfacer el supuesto de normalidad.
Recursos adicionales
Los cuatro supuestos hechos en una prueba T
Los cuatro supuestos de la regresión lineal
Los cuatro supuestos de ANOVA
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: