Cómo probar la normalidad en Stata

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Muchas pruebas estadísticas requieren que una o más variables se distribuyan normalmente para que los resultados de la prueba sean fiables.

Este tutorial explica varios métodos que puede utilizar para probar la normalidad entre variables en Stata.

Para cada uno de estos métodos, usaremos el conjunto de datos integrado de Stata llamado auto . Puede cargar este conjunto de datos con el siguiente comando:

sysuse auto

Método 1: histogramas

Una forma informal de ver si una variable se distribuye normalmente es crear un histograma para ver la distribución de la variable. Si la variable tiene una distribución normal, el histograma debería adoptar una forma de “campana” con más valores ubicados cerca del centro y menos valores ubicados en las colas.

Podemos usar el comando hist para crear un histograma para la variable de desplazamiento :

desplazamiento hist

Ejemplo de histograma en Stata

Podemos agregar una curva de densidad normal a un histograma usando el comando normal :

desplazamiento hist, normal

Histograma con curva normal en Stata

Es bastante obvio que el desplazamiento de la variable está sesgado hacia la derecha (por ejemplo, la mayoría de los valores se concentran a la izquierda y una larga “cola” de valores se extiende hacia la derecha) y no sigue una distribución normal.

Método 2: Prueba de Shapiro-Wilk

Una forma formal de probar la normalidad es utilizar la prueba de Shapiro-Wilk . La hipótesis nula de esta prueba es que la variable tiene una distribución normal. Si el valor p de la prueba es menor que algún nivel de significancia (las opciones comunes incluyen 0.01, 0.05 y 0.10), entonces podemos rechazar la hipótesis nula y concluir que hay evidencia suficiente para decir que la variable no está distribuida normalmente.

* Esta prueba se puede utilizar cuando el número total de observaciones está entre 4 y 2000.

Podemos usar el comando swilk para realizar una prueba de Shapiro-Wilk en el desplazamiento variable :

desplazamiento swilk

Salida de prueba de Shapiro Wilk en Stata

A continuación, se explica cómo interpretar el resultado de la prueba:

Obs: 74. Este es el número de observaciones utilizadas en la prueba.

W: 0,92542.Esta es la estadística de prueba para la prueba.

Prob> z: 0,00031.Este es el valor p asociado con la estadística de prueba.

Dado que el valor p es menor que 0.05, podemos rechazar la hipótesis nula de la prueba. Tenemos evidencia suficiente para decir que el desplazamiento variable no se distribuye normalmente.

También podemos realizar la prueba de Shapiro-Wilk en más de una variable a la vez enumerando varias variables después del comando swilk :

longitud de mpg de desplazamiento de swilk

Varias pruebas de Shapiro-Wilk a la vez en Stata

Usando un nivel de significancia de 0.05, concluiríamos que el desplazamiento y las millas por galón no están distribuidos normalmente, pero no tenemos evidencia suficiente para decir que la longitud no está distribuida normalmente.

Método 3: Prueba de Shapiro-Francia

Otra forma formal de probar la normalidad es utilizar la prueba Shapiro-Francia . La hipótesis nula de esta prueba es que la variable tiene una distribución normal. Si el valor p de la prueba es menor que algún nivel de significancia, entonces podemos rechazar la hipótesis nula y concluir que hay suficiente evidencia para decir que la variable no está distribuida normalmente.

* Esta prueba se puede usar cuando el número total de observaciones está entre 10 y 5,000.

Podemos usar el comando sfrancia para realizar una prueba de Shapiro-Wilk en el desplazamiento variable :

desplazamiento sfrancia

Salida de la prueba Shapiro-Francia en Stata

A continuación, se explica cómo interpretar el resultado de la prueba:

Obs: 74. Este es el número de observaciones utilizadas en la prueba.

W ‘: 0,93011.Esta es la estadística de prueba para la prueba.

Prob> z: 0,00094.Este es el valor p asociado con la estadística de prueba.

Dado que el valor p es menor que 0.05, podemos rechazar la hipótesis nula de la prueba. Tenemos evidencia suficiente para decir que el desplazamiento variable no se distribuye normalmente.

De manera similar a la prueba de Shapiro-Wilk, puede realizar la prueba de Shapiro-Francia en más de una variable a la vez enumerando varias variables después del comando sfrancia .

Método 4: Prueba de asimetría y curtosis

Otra forma de probar la normalidad es utilizar la prueba de asimetría y curtosis, que determina si la asimetría y la curtosis de una variable son coherentes con la distribución normal.

La hipótesis nula de esta prueba es que la variable tiene una distribución normal. Si el valor p de la prueba es menor que algún nivel de significancia, entonces podemos rechazar la hipótesis nula y concluir que hay suficiente evidencia para decir que la variable no está distribuida normalmente.

* Esta prueba requiere un mínimo de 8 observaciones para usarse.

Podemos usar el comando sktest para realizar una prueba de asimetría y curtosis en la variable de desplazamiento :

desplazamiento sktest

Asimetría y curtosis para la normalidad en Stata

A continuación, se explica cómo interpretar el resultado de la prueba:

Obs: 74. Este es el número de observaciones utilizadas en la prueba.

adj chi (2): 5,81.Este es el estadístico de la prueba de chi-cuadrado para la prueba.

Prob> chi2: 0.0547.Este es el valor p asociado con la estadística de prueba.

Dado que el valor p no es menor que 0.05, no rechazamos la hipótesis nula de la prueba. No tenemos pruebas suficientes para decir que el desplazamiento no se distribuye normalmente.

De manera similar a las otras pruebas de normalidad, puede realizar la Prueba de asimetría y curtosis en más de una variable a la vez enumerando varias variables después del comando sktest .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Un intervalo de confianza para una desviación estándar es un rango de valores que probablemente contenga una desviación estándar de…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!