Sesgo de Berkson: definición + ejemplos

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

El sesgo de Berkson es un tipo de sesgo que ocurre en la investigación cuando dos variables parecen estar correlacionadas negativamente en los datos de la muestra, pero en realidad están correlacionadas positivamente en la población general .

Por ejemplo, supongamos que Tom quiere estudiar la correlación entre la calidad de las hamburguesas y la calidad de los batidos en los restaurantes locales.

Sale y recopila los siguientes datos sobre siete restaurantes diferentes:

Crea un diagrama de dispersión para visualizar los datos:

Ejemplo de la paradoja de Berkson

El coeficiente de correlación de Pearson entre estas dos variables es -0,75 , que es una fuerte correlación negativa.

Este hallazgo es contrario a la intuición de Tom: él pensaría que los restaurantes que hacen buenas hamburguesas también hacen buenos batidos.

Sin embargo, resulta que Tom simplemente se saltó todos los restaurantes de la ciudad que preparan malas hamburguesas y malos batidos.

Si hubiera visitado estos restaurantes, habría recopilado el siguiente conjunto de datos:

Y así es como se ve un diagrama de dispersión para este conjunto de datos:

El coeficiente de correlación de Pearson entre las dos variables resulta ser 0,46 , que es una correlación positiva moderadamente fuerte.

Al observar solo un subconjunto de los restaurantes de la ciudad, Tom concluyó incorrectamente que había una correlación negativa entre la calidad de las hamburguesas y la calidad del batido.

En realidad, resulta que existe una relación positiva (como era de esperar) entre estas dos variables. Este es un ejemplo clásico del sesgo de Berkson.

Consulte los siguientes ejemplos para ver más escenarios en los que ocurre el sesgo de Berkson en la práctica.

Ejemplo 1: Admisiones universitarias

Suponga que una universidad solo admite estudiantes que tienen un GPA lo suficientemente alto y una puntuación ACT lo suficientemente alta.

Es bien sabido que estas dos variables se correlacionan positivamente, pero resulta que entre los estudiantes que deciden ir a una universidad en particular, parece haber una correlación negativa entre las dos.

Sin embargo, esta correlación negativa sólo se produce debido a que los estudiantes que tienen tanto un alto puntaje de GPA y ACT pueden ir a una universidad de élite, mientras que los estudiantes que tienen tanto una baja puntuación de GPA y ACT no ser admitido en absoluto.

Aunque la correlación entre ACT y GPA es positiva en la población, la correlación parece ser negativa en la muestra. Este es un caso del sesgo de Berkson.

Ejemplo 2: preferencias de citas

Muchas personas solo saldrán con parejas que sean atractivas y tengan una buena personalidad.

En el mundo real, puede que no haya ninguna correlación entre estas dos variables, pero al reducir el grupo de citas, una persona puede ignorar por completo a las parejas potenciales que son poco atractivas y tienen una buena personalidad.

Así, entre los socios potenciales puede parecer que existe una correlación negativa entre estas dos variables: las personas más atractivas tienen peor personalidad y las personas con mejores personalidades parecen menos atractivas.

El sesgo de Berkson

Aunque no existe correlación entre estas dos variables en la población, parece haber una correlación negativa en la muestra de socios potenciales. Este es simplemente un caso del sesgo de Berkson.

Cómo prevenir el sesgo de Berkson

La forma más obvia de prevenir el sesgo de Berkson en los estudios de investigación es recolectar una muestra aleatoria simple de una población. Es decir, asegúrese de que todos los miembros de la población de interés tengan las mismas posibilidades de ser incluidos en la muestra.

Por ejemplo, si está estudiando la prevalencia de enfermedades en un determinado país, debe recopilar una muestra de personas de todo el país, no solo de aquellas personas a las que es conveniente llegar en los hospitales.

Al usar una muestra aleatoria simple, los investigadores pueden maximizar las posibilidades de que su muestra sea representativa de la población, lo que significa que pueden generalizar sus hallazgos de la muestra a la población general con confianza.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Los investigadores a menudo toman muestras de una población y usan los datos de la muestra para sacar conclusiones sobre…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!