Cómo realizar una prueba F en Python

Se usa una prueba F para probar si dos varianzas poblacionales son iguales. Las hipótesis nula y alternativa para la prueba son las siguientes:

H 0 : σ 1 2 = σ 2 2 (las varianzas de población son iguales)

H 1 : σ 1 2 ≠ σ 2 2 (las varianzas de la población no son iguales)

Este tutorial explica cómo realizar una prueba F en Python.

Ejemplo: prueba F en Python

Supongamos que tenemos las siguientes dos muestras:

x = [18, 19, 22, 25, 27, 28, 41, 45, 51, 55] 
y = [14, 15, 15, 17, 18, 22, 25, 25, 27, 34]

Podemos usar la siguiente función para realizar una prueba F para determinar si las dos poblaciones de las que provienen estas muestras tienen varianzas iguales:

importar numpy como np

#define la función F-test 
def f_test (x, y):
    x = np. matriz (x)
    y = np.array (y)
    f = np.var (x, ddof = 1) /np.var (y, ddof = 1) #calcular el estadístico de prueba F 
    dfn = x.size-1 #definir grados de libertad numerador 
    dfd = y.size-1 #define grados de libertad denominador 
    p = 1-scipy.stats.f.cdf (f, dfn, dfd) # encontrar el valor p del estadístico de prueba F 
    devuelve f, p

# realizar la prueba F
 f_test (x, y)

(4.38712, 0.019127)

El estadístico de prueba F es 4.38712 y el valor p correspondiente es 0.019127 . Dado que este valor p es menor que .05, rechazaríamos la hipótesis nula. Esto significa que tenemos suficiente evidencia para decir que las dos variaciones de población no son iguales.

Notas

  • El estadístico de la prueba F se calcula como s 1 2 / s 2 2 . De forma predeterminada, numpy.var calcula la varianza de la población. Para calcular la varianza de la muestra, necesitamos especificar ddof = 1 .
  • El valor p corresponde a 1 – CDF de la distribución F con grados de libertad del numerador = n 1 -1 y grados de libertad del denominador = n 2 -1.
  • Esta función solo funciona cuando la varianza de la primera muestra es mayor que la varianza de la segunda muestra. Por lo tanto, defina las dos muestras de tal manera que trabajen con la función.

Cuándo usar la prueba F

La prueba F generalmente se usa para responder una de las siguientes preguntas:

1. ¿Dos muestras provienen de poblaciones con varianzas iguales?

2. ¿Un nuevo tratamiento o proceso reduce la variabilidad de algún tratamiento o proceso actual?

Relacionado: Cómo realizar una prueba F en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Una hipótesis estadística es una suposición sobre un parámetro de población . Por ejemplo, podemos suponer que la altura media…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!