- 0
- 0
- 0
- 0
Se utiliza una prueba de bondad de ajuste de chi-cuadrado para determinar si una variable categórica sigue o no una distribución hipotética.
Este tutorial explica cómo realizar una prueba de bondad de ajuste de chi-cuadrado en Stata.
Ejemplo: prueba de bondad de ajuste de chi-cuadrado en Stata
Para ilustrar cómo realizar esta prueba, usaremos un conjunto de datos llamado nlsw88 , que contiene información sobre estadísticas laborales para mujeres en los EE. UU. En 1988.
Utilice los siguientes pasos para realizar una prueba de bondad de ajuste de chi-cuadrado para determinar si la verdadera distribución de la raza en este conjunto de datos es la siguiente: 70% blancos, 20% negros, 10% otros.
Paso 1: cargue y vea los datos sin procesar.
Primero, cargaremos los datos escribiendo el siguiente comando:
sysuse nlsw88
Podemos ver los datos sin procesar escribiendo el siguiente comando:
br
Cada línea muestra información de un individuo, incluida su edad, raza, estado civil, nivel de educación y una variedad de otros factores.
Paso 2: Cargue el paquete de bondad de ajuste.
Para realizar una prueba de bondad de ajuste, necesitaremos instalar el paquete csgof . Podemos hacerlo escribiendo el siguiente comando:
findit csgof
Aparecerá una nueva ventana. Haga clic en el enlace que dice csgof de https://stats.idre.ucla.edu/stat/stata/ado/analysis .
Aparecerá otra ventana. Haga clic en el enlace que dice haga clic aquí para instalar .
El paquete solo debería tardar unos segundos en instalarse.
Paso 3: Realice la prueba de bondad de ajuste.
Una vez que el paquete está instalado, podemos realizar la prueba de bondad de ajuste en los datos para determinar si la verdadera distribución de la raza es la siguiente: 70% blancos, 20% negros, 10% otros.
Usaremos la siguiente sintaxis para realizar la prueba:
csgof variable_of_interest, expperc (lista_de_porcentajes_esperados)
Aquí está la sintaxis exacta que usaremos en nuestro caso:
raza csgof, expperc (70, 20, 10)
A continuación se explica cómo interpretar la salida:
Cuadro de resumen: este cuadro nos muestra el porcentaje esperado, la frecuencia esperada y la frecuencia observada para cada carrera. Por ejemplo:
- El porcentaje esperado de individuos blancos fue del 70%. Este es el porcentaje que especificamos.
- La frecuencia esperada de individuos blancos fue de 1.572,2. Esto se calcula utilizando el hecho de que había 2246 personas en el conjunto de datos, por lo que el 70% de ese número es 1572,2.
- La frecuencia observada de individuos blancos fue de 1.637. Este es el número real de individuos blancos en el conjunto de datos.
Chisq (2): este es el estadístico de la prueba Chi-cuadrado para la prueba de bondad de ajuste. Resulta ser 218.13.
p: Este es el valor p asociado con el estadístico de prueba de Chi-Cuadrado. Resulta ser 0. Dado que esto es menor que 0.05, no rechazamos la hipótesis nula de que la verdadera distribución de la raza es 70% Blanca, 20% Negra, 10% Otra. Tenemos suficiente evidencia para concluir que la verdadera distribución de la raza es diferente de esta distribución hipotética.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: