¿Qué es el supuesto de normalidad en estadística?

Actualizado por ultima vez el 7 de mayo de 2021, por .

Muchas pruebas estadísticas se basan en algo llamado supuesto de normalidad .

Esta suposición establece que si recolectamos muchas muestras aleatorias independientes de una población y calculamos algún valor de interés (como la media muestral ) y luego creamos un histograma para visualizar la distribución de las medias muestrales, deberíamos observar una curva de campana perfecta .

Muchas técnicas estadísticas hacen esta suposición sobre los datos, que incluyen:

1. Prueba t de una muestra : se supone que los datos de la muestra se distribuyen normalmente.

2. Prueba t de dos muestras : se supone que ambas muestras tienen una distribución normal.

3. ANOVA : Se asume que los residuos del modelo están distribuidos normalmente.

4. Regresión lineal : se supone que los residuos del modelo están distribuidos normalmente.

Si se viola esta suposición, los resultados de estas pruebas se vuelven poco confiables y no podemos generalizar nuestros hallazgos a partir de los datos de la muestra a la población general con confianza. Por eso es importante comprobar si se cumple esta suposición.

Hay dos formas habituales de comprobar si se cumple este supuesto de normalidad:

1. Visualiza la normalidad

2. Realice una prueba estadística formal

Las siguientes secciones explican los gráficos específicos que puede crear y las pruebas estadísticas específicas que puede realizar para verificar la normalidad.

Visualiza la normalidad

Una forma rápida e informal de comprobar si un conjunto de datos se distribuye normalmente es crear un histograma o una gráfica QQ.

1. Histograma

Si un histograma para un conjunto de datos tiene aproximadamente una forma de campana, es probable que los datos se distribuyan normalmente.

2. Gráfico QQ

Un gráfico QQ, abreviatura de gráfico «cuantiles-cuantiles», es un tipo de gráfico que muestra cuantiles teóricos a lo largo del eje x (es decir, dónde estarían sus datos si siguieran una distribución normal) y cuantiles de muestra a lo largo del eje y (es decir, dónde se encuentran sus datos).

Si los valores de los datos caen a lo largo de una línea aproximadamente recta en un ángulo de 45 grados, se supone que los datos se distribuyen normalmente.

Realizar una prueba estadística formal

También puede realizar una prueba estadística formal para determinar si un conjunto de datos se distribuye normalmente.

Si el valor p de la prueba es menor que un cierto nivel de significancia (como α = 0.05), entonces tiene suficiente evidencia para decir que los datos no se distribuyen normalmente.

Hay tres pruebas estadísticas que se usan comúnmente para probar la normalidad:

1. La prueba de Jarque-Bera

2. La prueba de Shapiro-Wilk

3. La prueba de Kolmogorov-Smirnov

Qué hacer si se viola el supuesto de normalidad

Si resulta que sus datos no se distribuyen normalmente, tiene dos opciones:

1. Transforma los datos.

Una opción es simplemente transformar los datos para que se distribuyan de manera más normal. Las transformaciones comunes incluyen:

  • Transformación de registro: transforme los datos de y a log (y) .
  • Transformación de raíz cuadrada: transforma los datos de y a √y
  • Transformación de raíz cúbica: transforma los datos de yay 1/3
  • Transformación de Box-Cox: transforme los datos mediante un procedimiento de Box-Cox

Al realizar estas transformaciones, la distribución de los valores de los datos normalmente se distribuye de manera más normal.

2. Realice una prueba no paramétrica

Las pruebas estadísticas que suponen una normalidad se conocen como pruebas paramétricas . Pero también hay una familia de pruebas conocidas como pruebas no paramétricas que no hacen esta suposición de normalidad.

Si resulta que sus datos no se distribuyen normalmente, simplemente puede realizar una prueba no paramétrica. A continuación, se muestran algunas versiones no paramétricas de pruebas estadísticas comunes:

Prueba paramétrica Equivalente no paramétrico
Prueba t para una muestra Prueba de rango con signo de Wilcoxon de una muestra
Prueba t de dos muestras Prueba U de Mann-Whitney
Prueba t de muestras pareadas Prueba de rango con signo de Wilcoxon de dos muestras
ANOVA unidireccional Prueba de Kruskal-Wallis

Cada una de estas pruebas no paramétricas le permite realizar una prueba estadística sin satisfacer el supuesto de normalidad.

Recursos adicionales

Los cuatro supuestos hechos en una prueba T
Los cuatro supuestos de la regresión lineal
Los cuatro supuestos de ANOVA

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un gráfico de burbujas es un tipo de gráfico que le permite visualizar tres variables en un conjunto de datos…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!