Cómo realizar una prueba T de dos muestras en Python

Contenido de este artículo

0.1 Ejemplo: prueba t de dos muestras en Python
0.2 Recursos adicionales

1 Redactor del artículo
2 ¿Te hemos ayudado?

Se utiliza una prueba t de dos muestras para comprobar si las medias de dos poblaciones son iguales o no.

Este tutorial explica cómo realizar una prueba t de dos muestras en Python.

Ejemplo: prueba t de dos muestras en Python

Los investigadores quieren saber si dos especies diferentes de plantas tienen la misma altura media. Para probar esto, recolectan una muestra aleatoria simple de 20 plantas de cada especie.

Utilice los siguientes pasos para realizar una prueba t de dos muestras para determinar si las dos especies de plantas tienen la misma altura.

Paso 1: crea los datos.

Primero, crearemos dos matrices para contener las medidas de cada grupo de 20 plantas:

importar numpy como np

group1 = np.array ([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array ([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Paso 2: Realice una prueba t de dos muestras.

A continuación, usaremos la función ttest_ind () de la biblioteca scipy.stats para realizar una prueba t de dos muestras, que usa la siguiente sintaxis:

ttest_ind (a, b, equal_var = Verdadero)

dónde:

a: una matriz de observaciones de muestra para el grupo 1
b: una matriz de observaciones de muestra para el grupo 2
equal_var: si es Verdadero, realice una prueba t estándar independiente de 2 muestras que asume varianzas poblacionales iguales. Si es Falso, realice la prueba t de Welch , que no asume varianzas poblacionales iguales. Esto es Verdadero por defecto.

Antes de realizar la prueba, debemos decidir si asumiremos que las dos poblaciones tienen varianzas iguales o no. Como regla general, podemos asumir que las poblaciones tienen varianzas iguales si la relación entre la varianza de la muestra más grande y la varianza de la muestra más pequeña es menor que 4: 1.

#find varianza para cada grupo
imprimir (np.var (grupo1), np.var (grupo2))

7.73 12.26

La razón entre la varianza de la muestra más grande y la varianza de la muestra más pequeña es 12.26 / 7.73 = 1.586 , que es menor que 4. Esto significa que podemos asumir que las varianzas de la población son iguales.

Por lo tanto, podemos proceder a realizar la prueba t de dos muestras con varianzas iguales:

importar scipy.stats como estadísticas

#realice dos pruebas t de muestra con varianzas iguales
stats.ttest_ind (a = group1, b = group2, equal_var = True)

(estadístico = -0,6337, valor p = 0,53005)

El estadístico de la prueba t es -0,6337 y el valor p de dos colas correspondiente es 0,53005 .

Paso 3: Interprete los resultados.

Las dos hipótesis para esta prueba t de dos muestras en particular son las siguientes:

H ₀ : µ ₁ = µ ₂ (las dos medias poblacionales son iguales)

H _A : µ ₁ ≠ µ ₂ (las dos medias poblacionales no son iguales)

Debido a que el valor p de nuestra prueba (0.53005) es mayor que alfa = 0.05, no rechazamos la hipótesis nula de la prueba. No tenemos evidencia suficiente para decir que la altura media de las plantas entre las dos poblaciones sea diferente.

Recursos adicionales

Cómo realizar una prueba T de una muestra en Python
Cómo realizar una prueba T de muestras emparejadas en Python

https://r-project.org
https://www.python.org/
https://www.stata.com/

Redactor del artículo

Luis Benites
Director de Statologos.com
Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Equipo de Statologos

Luis Benites

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Director de Statologos.com
Dereck Amesquita

I am a Bachelor of Science in Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.
Statistics content writer
Cisco Pfoccori

15 años haciendo SEO, monetizando, haciendo nichos y ayudando a empresas a mejoras sus estrategia digital. Pueden contactarme si necesitan mejorar su digitalización, actualmente trabajo para CirculoSEO.
Editor de contenido y SEO

Ejemplo: prueba t de dos muestras en Python

Recursos adicionales

Redactor del artículo

¿Te hemos ayudado?

Artículos relacionados:

Deja un comentario Cancelar la respuesta

You have Successfully Subscribed!