ANOVA unidireccional: definición, fórmula y ejemplo

Actualizado el 17 de julio de 2024, por Luis Benites.

Un ANOVA de una vía («análisis de varianza») compara las medias de tres o más grupos independientes para determinar si existe una diferencia estadísticamente significativa entre las medias de la población correspondiente.

Este tutorial explica lo siguiente:

  • La motivación para realizar un ANOVA de una vía.
  • Los supuestos que deben cumplirse para realizar un ANOVA unidireccional.
  • El proceso para realizar un ANOVA unidireccional.
  • Un ejemplo de cómo realizar un ANOVA unidireccional.

ANOVA unidireccional: motivación

Supongamos que queremos saber si tres programas de preparación para exámenes diferentes conducen a diferentes puntuaciones medias en un examen de ingreso a la universidad. Dado que hay millones de estudiantes de secundaria en todo el país, llevaría demasiado tiempo y sería costoso acudir a cada estudiante y dejarles usar uno de los programas de preparación de exámenes.

En su lugar, podríamos seleccionar tres muestras aleatorias de 100 estudiantes de la población y permitir que cada muestra use uno de los tres programas de preparación de exámenes para prepararse para el examen. Luego, podríamos registrar los puntajes de cada estudiante una vez que tomen el examen.

Seleccionar muestras de una población

Sin embargo, está prácticamente garantizado que la puntuación media del examen entre las tres muestras será al menos un poco diferente.La pregunta es si esta diferencia es estadísticamente significativa o no . Afortunadamente, un ANOVA unidireccional nos permite responder a esta pregunta.

ANOVA unidireccional: supuestos

Para que los resultados de un ANOVA unidireccional sean válidos, se deben cumplir los siguientes supuestos:

1. Normalidad : cada muestra se extrajo de una población distribuida normalmente.

2. Varianzas iguales : las varianzas de las poblaciones de las que provienen las muestras son iguales. Puede utilizar la prueba de Bartlett para verificar esta suposición.

3. Independencia : las observaciones de cada grupo son independientes entre sí y las observaciones dentro de los grupos se obtuvieron mediante una muestra aleatoria.

Lea este artículo para obtener detalles detallados sobre cómo verificar estas suposiciones.

ANOVA unidireccional: el proceso

Un ANOVA unidireccional utiliza las siguientes hipótesis nulas y alternativas:

  • H 0 (hipótesis nula): μ 1 = μ 2 = μ 3 =… = μ k (todas las medias poblacionales son iguales)
  • H 1 (hipótesis alternativa): al menos una media poblacional es diferente del resto

Por lo general, utilizará algún software estadístico (como R, Excel, Stata, SPSS, etc.) para realizar un ANOVA unidireccional, ya que es complicado de realizar a mano.

Independientemente del software que utilice, recibirá la siguiente tabla como resultado:

Fuente Suma de cuadrados (SS) df Cuadrados medios (MS) F pag
Tratamiento SSR df r MSR MSR / MSE F df r , df e
Error SSE df e MSE
Total SST df t

dónde:

  • SSR: suma de cuadrados de regresión
  • SSE: error suma de cuadrados
  • SST: suma total de cuadrados (SST = SSR + SSE)
  • df r : grados de libertad de regresión (df r = k-1)
  • df e : grados de libertad de error (df e = nk)
  • gl t : grados de libertad totales (gl t = n-1)
    • k: número total de grupos
    • n: total de observaciones
  • MSR: cuadrado medio de regresión (MSR = SSR / df r )
  • MSE: error cuadrático medio (MSE = SSE / df e )
  • F: el estadístico de la prueba F (F = MSR / MSE)
  • p: El valor p que corresponde a F dfr, dfe

Si el valor p es menor que el nivel de significancia elegido (por ejemplo, 0,05), puede rechazar la hipótesis nula y concluir que al menos una de las medias de la población es diferente de las demás.

Nota: Si rechaza la hipótesis nula, esto indica que al menos una de las medias poblacionales es diferente de las demás, pero la tabla ANOVA no especifica qué medias poblacionales son diferentes. Para determinar esto, debe realizar pruebas post hoc , también conocidas como pruebas de “comparaciones múltiples”.

ANOVA unidireccional: ejemplo

Supongamos que queremos saber si tres programas de preparación de exámenes diferentes conducen a diferentes puntuaciones medias en un examen determinado. Para probar esto, reclutamos a 30 estudiantes para que participen en un estudio y los dividimos en tres grupos. Los estudiantes de cada grupo se asignan al azar para utilizar uno de los tres programas de preparación de exámenes durante las próximas tres semanas para prepararse para un examen. Al final de las tres semanas, todos los estudiantes toman el mismo examen.

Los puntajes del examen para cada grupo se muestran a continuación:

Ejemplo de datos ANOVA unidireccionales

Para realizar un ANOVA unidireccional sobre estos datos, usaremos la Calculadora ANOVA unidireccional de Statología con la siguiente entrada:

Ejemplo de cálculo de ANOVA unidireccional

En la tabla de salida, vemos que el estadístico de prueba F es 2.358 y el valor p correspondiente es 0.11385 .

Interpretación de la tabla de salida de ANOVA

Dado que este valor p no es menor que 0.05, no rechazamos la hipótesis nula. Esto significa que no tenemos pruebas suficientes para decir que existe una diferencia estadísticamente significativa entre las puntuaciones medias de los exámenes de los tres grupos.

Recursos adicionales

Los siguientes artículos explican cómo realizar un ANOVA unidireccional utilizando diferentes softwares estadísticos:

Cómo realizar un ANOVA unidireccional en Excel
Cómo realizar un ANOVA unidireccional en R
Cómo realizar un ANOVA unidireccional en Python
Cómo realizar un ANOVA unidireccional en SPSS
Cómo realizar un ANOVA unidireccional en Stata
Cómo realizar un ANOVA unidireccional en una calculadora TI-84 Calculadora
ANOVA unidireccional en línea

Redactor del artículo

  • Luis Benites
    Directo & CEO de Statologos LSI

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

Deja un comentario

Puede usar la siguiente sintaxis básica para convertir una marca de tiempo en una fecha y hora en un DataFrame…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!