Las cuatro suposiciones hechas en una prueba T

Se utiliza una prueba t de dos muestras para comprobar si las medias de dos poblaciones son iguales o no.

Este tipo de prueba hace las siguientes suposiciones sobre los datos:

1. Independencia: las observaciones en una muestra son independientes de las observaciones en la otra muestra.

2. Normalidad: Ambas muestras tienen una distribución aproximadamente normal.

3. Homogeneidad de varianzas: ambas muestras tienen aproximadamente la misma varianza.

4. Muestreo aleatorio: Ambas muestras se obtuvieron mediante un método de muestreo aleatorio.

Si se infringe una o más de estas suposiciones, los resultados de la prueba t de dos muestras pueden ser poco fiables o incluso engañosos.

En este tutorial proporcionamos una explicación de cada suposición, cómo determinar si se cumple la suposición y qué hacer si se viola la suposición.

Supuesto 1: Independencia

Una prueba t de dos muestras supone que las observaciones de una muestra son independientes de las observaciones de la otra muestra.

Esta es una suposición crucial porque si los mismos individuos aparecen en ambas muestras, entonces no es válido sacar conclusiones sobre las diferencias entre las muestras.

Cómo comprobar esta suposición

La forma más sencilla de verificar este supuesto es verificar que cada observación solo aparece en cada muestra una vez y que las observaciones de cada muestra se recopilaron mediante un muestreo aleatorio.

Qué hacer si se viola esta suposición

Si se viola esta suposición, los resultados de la prueba t de dos muestras son completamente inválidos. En este escenario, es mejor recolectar dos nuevas muestras usando un método de muestreo aleatorio y asegurarse de que cada individuo en una muestra no pertenezca a la otra muestra.

Supuesto 2: Normalidad

Una prueba t de dos muestras supone que ambas muestras tienen una distribución aproximadamente normal.

Esta es una suposición crucial porque si las muestras no se distribuyen normalmente, entonces no es válido usar los valores p de la prueba para sacar conclusiones sobre las diferencias entre las muestras.

Cómo comprobar esta suposición

Si los tamaños de muestra son pequeños (n <50), entonces podemos usar una prueba de Shapiro-Wilk para determinar si cada tamaño de muestra tiene una distribución normal. Si el valor p de la prueba es menor que un cierto nivel de significancia, es probable que los datos no estén distribuidos normalmente.

Si los tamaños de muestra son grandes, entonces es mejor usar un gráfico QQ para verificar visualmente si los datos se distribuyen normalmente.

Si los puntos de datos caen aproximadamente a lo largo de una línea diagonal recta en una gráfica QQ, es probable que el conjunto de datos siga una distribución normal.

Qué hacer si se viola esta suposición

Si se viola esta suposición, podemos realizar una prueba U de Mann-Whitney , que se considera el equivalente no paramétrico de la prueba t de dos muestras y no supone que las dos muestras estén distribuidas normalmente.

Supuesto 3: homogeneidad de las variaciones

Una prueba t de dos muestras supone que las dos muestras tienen varianzas aproximadamente iguales.

Cómo comprobar esta suposición

Usamos la siguiente regla empírica para determinar si las varianzas entre las dos muestras son iguales: si la razón de la varianza más grande a la varianza más pequeña es menor que 4, entonces podemos asumir que las varianzas son aproximadamente iguales y usar las dos muestras t -prueba.

Por ejemplo, suponga que la muestra 1 tiene una varianza de 24,5 y la muestra 2 tiene una varianza de 15,2. La relación entre la varianza de la muestra más grande y la varianza de la muestra más pequeña se calcularía como:

Relación: 24,5 / 15,2 = 1,61

Dado que esta razón es menor que 4, podríamos asumir que las varianzas entre los dos grupos son aproximadamente iguales.

Qué hacer si se viola esta suposición

Si se viola esta suposición, podemos realizar la prueba t de Welch , que es una versión no paramétrica de la prueba t de dos muestras y no supone que las dos muestras tengan varianzas iguales.

Supuesto 4: muestreo aleatorio

Una prueba t de dos muestras supone que ambas muestras se obtuvieron mediante un método de muestreo aleatorio.

Cómo comprobar esta suposición

No existe una prueba estadística formal que podamos utilizar para probar esta suposición. En su lugar, solo debemos asegurarnos de que ambas muestras se obtuvieron mediante un método de muestreo aleatorio de modo que cada individuo de la población de interés tuviera la misma probabilidad de ser incluido en cualquiera de las muestras.

Qué hacer si se viola esta suposición

Si se viola esta suposición, es poco probable que nuestras dos muestras sean representativas de la población de interés. En este caso, no podemos generalizar los hallazgos de la prueba t de dos muestras a la población general con confiabilidad.

En este escenario, es mejor recolectar dos nuevas muestras usando un método de muestreo aleatorio.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La distribución de Poisson es una distribución de probabilidad que se utiliza para modelar la probabilidad de que ocurra un…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!