Cómo realizar una prueba T de muestras emparejadas en Python

Se utiliza una prueba t de muestras pareadas para comparar las medias de dos muestras cuando cada observación en una muestra se puede emparejar con una observación en la otra muestra.

Este tutorial explica cómo realizar una prueba t de muestras emparejadas en Python.

Ejemplo: prueba T de muestras emparejadas en Python

Supongamos que queremos saber si un determinado programa de estudios tiene un impacto significativo en el rendimiento del estudiante en un examen en particular. Para probar esto, tenemos 15 estudiantes en una clase que toman una prueba previa. Luego, hacemos que cada uno de los estudiantes participe en el programa de estudio durante dos semanas. Luego, los alumnos vuelven a realizar una prueba de similar dificultad.

Para comparar la diferencia entre las puntuaciones medias de la primera y la segunda prueba, utilizamos una prueba t de muestras pareadas porque para cada estudiante la puntuación de la primera prueba se puede emparejar con la puntuación de la segunda prueba.

Realice los siguientes pasos para realizar una prueba t de muestras emparejadas en Python.

Paso 1: crea los datos.

Primero, crearemos dos matrices para contener los puntajes previos y posteriores a la prueba:

pre = [88, 82, 84, 93, 75, 78, 84, 87, 95, 91, 83, 89, 77, 68, 91] 
post = [91, 84, 88, 90, 79, 80, 88, 90, 90, 96, 88, 89, 81, 74, 92]

Paso 2: Realice una prueba T de muestras pareadas.

A continuación, usaremos la función ttest_rel () de la biblioteca scipy.stats para realizar una prueba t de muestras emparejadas, que usa la siguiente sintaxis:

ttest_rel (a, b)

dónde:

  • a: una matriz de observaciones de muestra del grupo 1
  • b: una matriz de observaciones de muestra del grupo 2

A continuación, se explica cómo utilizar esta función en nuestro ejemplo específico:

importar scipy.stats como estadísticas

# realizar la prueba t de muestras emparejadas
stats.ttest_rel (pre, post)

(estadístico = -2,9732, valor de p = 0,0101)

La estadística de prueba es -2,9732 y el valor p de dos caras correspondiente es 0,0101 .

Paso 3: Interprete los resultados.

En este ejemplo, la prueba t de muestras pareadas utiliza las siguientes hipótesis nulas y alternativas:

H 0 : Las puntuaciones medias antes y después de la prueba son iguales

H A : Las puntuaciones medias antes y después de la prueba no son iguales

Dado que el valor p ( 0.0101 ) es menor que 0.05, rechazamos la hipótesis nula. Tenemos evidencia suficiente para decir que la puntuación media real de la prueba es diferente para los estudiantes antes y después de participar en el programa de estudio.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Puede generar rápidamente una distribución normal en R utilizando la función rnorm () , que utiliza la siguiente sintaxis: rnorm…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!