Cómo realizar un ANCOVA en Python

Actualizado por ultima vez el 7 de mayo de 2021, por .

Se utiliza un ANCOVA («análisis de covarianza») para determinar si existe o no una diferencia estadísticamente significativa entre las medias de tres o más grupos independientes, después de controlar por una o más covariables .

Este tutorial explica cómo realizar un ANCOVA en Python.

Ejemplo: ANCOVA en Python

Una maestra quiere saber si tres técnicas de estudio diferentes tienen un impacto en los puntajes de los exámenes, pero quiere tener en cuenta la calificación actual que el estudiante ya tiene en la clase.

Realizará un ANCOVA utilizando las siguientes variables:

  • Variable factor: técnica de estudio
  • Covariable: grado actual
  • Variable de respuesta: puntaje del examen

Utilice los siguientes pasos para realizar un ANCOVA en este conjunto de datos:

Paso 1: Ingrese los datos.

Primero, crearemos un DataFrame de pandas para contener nuestros datos:

importar numpy como np
 importar pandas como pd

#crear datos
df = pd.DataFrame ({'técnica': np.repeat (['A', 'B', 'C'], 5),
                   'current_grade': [67, 88, 75, 77, 85,
                                     92, 69, 77, 74, 88, 
                                     96, 91, 88, 82, 80],
                   'exam_score': [77, 89, 72, 74, 69,
                                  78, 88, 93, 94, 90,
                                  85, 81, 83, 88, 79]})
#ver datos 
df

   técnica current_grade exam_score
0 A 67 77
1 A 88 89
2 A 75 72
3 A 77 74
4 A 85 69
5 B 92 78
6 B 69 88
7 B 77 93
8 B 74 94
9 B 88 90
10 C 96 85
11 C 91 81
12 C 88 83
13 C 82 88
14 C 80 79

Paso 2: Realice el ANCOVA.

A continuación, realizaremos un ANCOVA usando la función ancova () de la biblioteca pingouin:

pip instalar pingouin  
desde pingouin importar ancova

# realizar ANCOVA 
ancova (data = df , dv = ' exam_score ', covar = ' current_grade ', between = ' técnica ')


        Fuente SS DF F p-unc np2
0 técnica 390.575130 2 4.80997 0.03155 0.46653
1 grado_actual 4.193886 1 0.10329 0.75393 0.00930
2 Residual 446.606114 11 NaN NaN NaN

Paso 3: Interprete los resultados.

De la tabla ANCOVA vemos que el valor p (p-unc = “valor p no corregido”) para la técnica de estudio es 0.03155 . Dado que este valor es menor que 0.05, podemos rechazar la hipótesis nula de que cada una de las técnicas de estudio conduce a la misma calificación promedio en el examen, incluso después de tomar en cuenta la calificación actual del estudiante en la clase .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Las frecuencias relativas nos dicen con qué frecuencia ocurren ciertos eventos, en relación con el número total de eventos. Por…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!