Cómo realizar una prueba T de dos muestras en Python

Se utiliza una prueba t de dos muestras para comprobar si las medias de dos poblaciones son iguales o no.

Este tutorial explica cómo realizar una prueba t de dos muestras en Python.

Ejemplo: prueba t de dos muestras en Python

Los investigadores quieren saber si dos especies diferentes de plantas tienen la misma altura media. Para probar esto, recolectan una muestra aleatoria simple de 20 plantas de cada especie.

Utilice los siguientes pasos para realizar una prueba t de dos muestras para determinar si las dos especies de plantas tienen la misma altura.

Paso 1: crea los datos.

Primero, crearemos dos matrices para contener las medidas de cada grupo de 20 plantas:

importar numpy como np

group1 = np.array ([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array ([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Paso 2: Realice una prueba t de dos muestras.

A continuación, usaremos la función ttest_ind () de la biblioteca scipy.stats para realizar una prueba t de dos muestras, que usa la siguiente sintaxis:

ttest_ind (a, b, equal_var = Verdadero)

dónde:

  • a: una matriz de observaciones de muestra para el grupo 1
  • b: una matriz de observaciones de muestra para el grupo 2
  • equal_var: si es Verdadero, realice una prueba t estándar independiente de 2 muestras que asume varianzas poblacionales iguales. Si es Falso, realice la prueba t de Welch , que no asume varianzas poblacionales iguales. Esto es Verdadero por defecto.

Antes de realizar la prueba, debemos decidir si asumiremos que las dos poblaciones tienen varianzas iguales o no. Como regla general, podemos asumir que las poblaciones tienen varianzas iguales si la relación entre la varianza de la muestra más grande y la varianza de la muestra más pequeña es menor que 4: 1.

#find varianza para cada grupo
imprimir (np.var (grupo1), np.var (grupo2))

7.73 12.26

La razón entre la varianza de la muestra más grande y la varianza de la muestra más pequeña es 12.26 / 7.73 = 1.586 , que es menor que 4. Esto significa que podemos asumir que las varianzas de la población son iguales.

Por lo tanto, podemos proceder a realizar la prueba t de dos muestras con varianzas iguales:

importar scipy.stats como estadísticas

#realice dos pruebas t de muestra con varianzas iguales
stats.ttest_ind (a = group1, b = group2, equal_var = True)

(estadístico = -0,6337, valor p = 0,53005)

El estadístico de la prueba t es -0,6337 y el valor p de dos colas correspondiente es 0,53005 .

Paso 3: Interprete los resultados.

Las dos hipótesis para esta prueba t de dos muestras en particular son las siguientes:

H 0 : µ 1 = µ 2 (las dos medias poblacionales son iguales)

H A : µ 1 ≠ µ 2 (las dos medias poblacionales no son iguales)

Debido a que el valor p de nuestra prueba (0.53005) es mayor que alfa = 0.05, no rechazamos la hipótesis nula de la prueba. No tenemos evidencia suficiente para decir que la altura media de las plantas entre las dos poblaciones sea diferente.

Recursos adicionales

Cómo realizar una prueba T de una muestra en Python
Cómo realizar una prueba T de muestras emparejadas en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La prueba de Friedman es una alternativa no paramétrica al ANOVA de medidas repetidas . Se utiliza para determinar si…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!