Sesgo de agregación: definición y falacia ecológica

Actualizado por ultima vez el 25 de noviembre de 2021, por Luis Benites.

¿Qué es el sesgo de agregación?

En los estudios ecológicos, el sesgo de agregación es la diferencia esperada entre los efectos para el grupo y los efectos para el individuo , si no hay confusión .

Si hay confusión , entonces la diferencia entre los efectos grupales e individuales es una combinación de confusión y sesgo de agregación. El sesgo de agregación conduce a la “ falacia ecológica ”, la conclusión de que lo que es cierto para el grupo debe ser cierto para el subgrupo o el individuo. Se llama sesgo de agregación porque usa datos agregados y los extrapola de manera inapropiada.

Por ejemplo, es posible que tenga datos que muestren que los estudiantes del centro de la ciudad tienden a tener un desempeño deficiente en las pruebas estandarizadas. Eso no significa que ningún individuo se desempeñe mal . Del mismo modo, puede mostrar que un estado en particular tiene un ingreso per cápita más bajo que el promedio. No se puede decir con certeza que todos los condados de ese estado tengan un ingreso inferior al promedio. Y definitivamente no se puede decir que todas las personas en el estado tienen bajos ingresos.

sesgo de agregación

El sesgo de agregación puede distorsionar los resultados de las pruebas de hipótesis, como la prueba t.

Los problemas de agregación pueden sesgar los resultados de los experimentos y las encuestas. También puede distorsionar los resultados de la prueba de hipótesis y el análisis de regresión.

Luloff y Greenwood (1980) encontraron que una mayor agregación provoca resultados impredecibles:

Ejemplo de investigación

Quizás el ejemplo más famoso de una falacia ecológica es el estudio de Durkheim de 1897, que infirió que los protestantes tenían más probabilidades de suicidarse, basándose en datos que mostraban que los países con poblaciones protestantes más grandes tenían tasas de suicidio más altas que los condados con poblaciones católicas más grandes. El estudio no tuvo en cuenta las variables de confusión, como el hecho de que los países protestantes diferían en muchos aspectos de los países católicos. Además, Durkeim no analizó los grupos religiosos dentro de los países al determinar las tasas de suicidio, solo tomó datos de los países en su conjunto.

Referencias

Abhishek et al. (2015) Sesgo de agregación en datos de búsqueda patrocinados: la maldición y la cura. Ciencias del marketing 34(1):59-77. http://dx.doi.org/10.1287/mksc.2014.0884
Durkheim, E. (1897). El suicidio. París: F. Alcan. Traducción al inglés de JA Spalding (1951). Toronto, Canadá: FreePress/Collier-MacMillan.
Hensher, D. et al. (2015). Análisis de elección aplicada 2ª edición . Prensa de la Universidad de Cambridge.
Rey, G. (2004). Inferencia Ecológica: Nuevas Estrategias Metodológicas . Prensa de la Universidad de Cambridge; Edición ilustrada.
Luloff, AE et al. (1980). Definiciones de comunidad: una ilustración del
sesgo de agregación. Boletín de la estación 516. Estación Experimental Agrícola de New Hampshire. Durham, NH: Universidad de New Hampshire.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

La distribución de Irwin-Hall ( Uniform Sum Distribution ) es la distribución de la suma de n valores tomados de…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!