Pesos relativos

Actualizado por ultima vez el 24 de diciembre de 2021, por Luis Benites.

¿Qué son los pesos relativos?

Los pesos relativos de Johnson son una forma de cuantificar la importancia relativa de las variables predictoras correlacionadas en el análisis de regresión. “Importancia relativa” en este contexto significa la proporción de la varianza en y explicada por x j . Dicho de otra manera, te ayuda a descubrir qué variables contribuyen más al r-cuadrado.

Cálculos

Los cálculos reales son complejos y generalmente se realizan con software. Chao et. al delinear los pasos generales como:

  1. Transforme las variables predictoras en un conjunto de variables ortogonales (no correlacionadas). Estas variables están «máximamente relacionadas» con las variables predictoras desde una perspectiva de mínimos cuadrados no ponderados.
  2. Haga una regresión de las variables dependientes en el nuevo conjunto de variables transformadas.

Para la mayoría de los programas de software estadístico (como SPSS o JMP), ejecute la regresión de componentes principales para producir las variables ortogonales. A continuación, ejecute la regresión de mínimos cuadrados utilizando los resultados de la PCR para predecir las variables y. Los pesos relativos combinados deben sumar el r cuadrado inicial.

Comparación con otros índices

Según Chao et. Al, Se han propuesto muchos índices de importancia relativa a lo largo de los años, incluida la Medida del producto, el Índice de dominancia general y la correlación semiparcial al cuadrado. Pesos relativos de Johnson es superior porque tiene mejores fundamentos teóricos y siempre produce resultados claros incluso si los predictores tienen una colinealidad muy alta . Aunque los pesos relativos y el índice de dominancia general (regresión de Shapley) producen resultados similares, el método de Shapley es computacionalmente complejo para más de una docena de variables y, por lo tanto, se usa con menos frecuencia. Por ejemplo, un modelo de pesos relativos de 30 variables se ejecutará casi instantáneamente en una computadora doméstica, mientras que una regresión de Shapley de 30 variables podría llevar días .

Referencias
Chao, Yi-Chun. Cuantificación de la importancia relativa de los predictores en análisis de regresión lineal múltiple para estudios de salud pública . Revista de Higiene Ocupacional y Ambiental Volumen: 5 Número 8 (2007) ISSN: 1545-9624

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Una distribución de datos es una función o un listado que muestra todos los posibles valores (o intervalos) de los…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!