¿Qué son los errores estándar agrupados? (Definición y ejemplo)

Los errores estándar agrupados se utilizan en modelos de regresión cuando algunas observaciones de un conjunto de datos están naturalmente «agrupadas» juntas o relacionadas de alguna manera.

Para comprender cuándo usar errores estándar agrupados, es útil dar un paso atrás y comprender el objetivo del análisis de regresión.

En estadística, los modelos de regresión se utilizan para cuantificar la relación entre una o más variables predictoras y una variable de respuesta .

Siempre que ajuste un modelo de regresión, su salida se mostrará en una tabla de regresión que se parece a la siguiente:

A continuación, se explica cómo interpretar los valores de la tabla:

  • Coeficiente: el aumento promedio en la variable de respuesta asociada con un aumento de una unidad en una variable predictora específica, asumiendo que todas las demás variables predictoras se mantienen constantes.
  • Error estándar: una medida de la precisión de la estimación del coeficiente.
  • t Stat: el estadístico t para la variable predictora, calculado como coeficiente / error estándar.
  • valor p: el valor p asociado con el estadístico t. Si este valor es menor que un cierto nivel de significancia (por ejemplo, 0.05), decimos que existe una relación estadísticamente significativa entre la variable predictora y la variable de respuesta.

Uno de los supuestos clave del análisis de regresión es el supuesto de independencia . Estos supuestos establecen que cada observación en el conjunto de datos debe ser independiente de cualquier otra observación.

En la práctica, esta suposición a veces se viola.

Por ejemplo, suponga que un investigador desea ajustar un modelo de regresión utilizando las horas estudiadas como variable de predicción y la puntuación del examen como variable de respuesta. Decide recopilar datos para 50 estudiantes distribuidos en cinco aulas diferentes.

En este escenario, los estudiantes se agrupan naturalmente en aulas, lo que significa que los datos recopilados para cada estudiante no serán independientes.

Por ejemplo, algunas aulas pueden tener un maestro excelente, mientras que otras tienen un maestro por debajo de la media que hace un mal trabajo en la enseñanza de su materia.

Si el investigador se ajusta a un modelo de regresión sin tener en cuenta esta naturaleza agrupada de los datos, los errores estándar de los coeficientes de regresión serán más pequeños de lo que deberían ser .

Esto resultará en los siguientes errores:

  • Las estadísticas t serán demasiado grandes.
  • Los valores p serán demasiado pequeños.
  • Los intervalos de confianza serán demasiado estrechos.

En pocas palabras, los resultados del análisis de regresión no serán confiables.

Para dar cuenta de esto, podemos usar errores estándar agrupados . Afortunadamente, en la mayoría de los programas estadísticos se puede indicar explícitamente al programa que utilice errores estándar agrupados al ajustar un modelo de regresión.

Por ejemplo, en Stata puede usar el comando cluster (nombre de variable) para decirle a Stata que use errores estándar agrupados al ajustar un modelo de regresión.

En la práctica, puede usar la siguiente sintaxis para ajustar un modelo de regresión en Stata con errores estándar agrupados:

Regresar xy, cluster (nombre_variable)

dónde:

  • x: la variable predictora
  • y: la variable de respuesta
  • variable_name: el nombre de la variable en la que se deben agrupar los datos

Esto devolverá una tabla de regresión con errores estándar agrupados.

Recursos adicionales

Introducción a la regresión lineal simple
Introducción a la regresión lineal múltiple
Los cuatro supuestos de la regresión lineal
Cómo leer e interpretar una tabla de regresión

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

El Herramientas para análisis es un país libre complemento de Microsoft Excel en el programa que proporciona las herramientas necesarias…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!