Cómo trazar varios resultados de regresión lineal en R

Cuando realizamos una regresión lineal simple en R, es fácil visualizar la línea de regresión ajustada porque solo estamos trabajando con una única variable predictora y una única variable de respuesta .

Por ejemplo, el siguiente código muestra cómo ajustar un modelo de regresión lineal simple a un conjunto de datos y graficar los resultados:

#create dataset
 data <- data.frame (x = c (1, 1, 2, 4, 4, 5, 6, 7, 7, 8, 9, 10, 11, 11),
                   y = c (13, 14, 17, 23, 24, 25, 25, 24, 28, 32, 33, 35, 40, 41))

#ajustar modelo de modelo de regresión lineal simple
 <- lm (y ~ x, data = data)

# crear un diagrama de dispersión del diagrama de datos
 (datos $ x, datos $ y)

#add línea de regresión ajustada
 abline (modelo)

Trace una línea de regresión lineal simple en R con un diagrama de dispersión

Sin embargo, cuando realizamos una regresión lineal múltiple , resulta difícil visualizar los resultados porque hay varias variables predictoras y no podemos simplemente trazar una línea de regresión en un gráfico 2-D.

En su lugar, podemos usar gráficos de variables agregadas (a veces llamados «gráficos de regresión parcial»), que son gráficos individuales que muestran la relación entre la variable de respuesta y una variable predictora, mientras se controla la presencia de otras variables predictoras en el modelo .

El siguiente ejemplo muestra cómo realizar una regresión lineal múltiple en R y visualizar los resultados usando gráficos de variables agregadas.

Ejemplo: trazar varios resultados de regresión lineal en R

Supongamos que ajustamos el siguiente modelo de regresión lineal múltiple a un conjunto de datos en R usando el conjunto de datos mtcars incorporado :

#fit modelo de modelo de regresión lineal múltiple
 <- lm (mpg ~ disp + hp + drat, data = mtcars)

#ver resultados del modelo
resumen (modelo)

Llamada:
lm (fórmula = mpg ~ disp + hp + drat, data = mtcars)

Derechos residuales de autor:
    Mín. 1T Mediana 3T Máx. 
-5,1225 -1,8454 -0,4456 1,1342 6,4958 

Coeficientes:
             Estimar Std. Valor t de error Pr (> | t |)   
(Intercepción) 19,344293 6,370882 3,036 0,00513 **
disp -0.019232 0.009371 -2.052 0.04960 * 
CV -0,031229 0,013345 -2,340 0,02663 * 
drat 2.714975 1.487366 1.825 0.07863. 
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Error estándar residual: 3.008 en 28 grados de libertad
R cuadrado múltiple: 0,775, R cuadrado ajustado: 0,7509 
Estadístico F: 32,15 en 3 y 28 DF, valor de p: 3,28e-09

De los resultados podemos ver que los valores p para cada uno de los coeficientes es menor que 0.1. En aras de la simplicidad, asumiremos que cada una de las variables predictoras son significativas y deben incluirse en el modelo.

Para producir gráficos de variables adicionales, podemos usar la función avPlots () del paquete del automóvil :

#cargar biblioteca de paquetes de
 coche (coche)

#produce parcelas variables agregadas
avPlots (modelo)

Trazar regresión lineal múltiple en R

A continuación se explica cómo interpretar cada trama:

  • El eje x muestra una única variable predictora y el eje y muestra la variable de respuesta.
  • La línea azul muestra la asociación entre la variable predictora y la variable de respuesta, mientras mantiene constante el valor de todas las demás variables predictoras .
  • Los puntos que están etiquetados en cada gráfico representan las 2 observaciones con los residuos más grandes y las 2 observaciones con el apalancamiento parcial más grande.

Tenga en cuenta que el ángulo de la línea en cada gráfico coincide con el signo del coeficiente de la ecuación de regresión estimada.

Por ejemplo, aquí están los coeficientes estimados para cada variable predictora del modelo:

  • disp: -0.019232
  • CV: -0.031229
  • maldito : 2.714975

Observe que el ángulo de la línea es positivo en la gráfica de la variable agregada para drat mientras que es negativo tanto para disp como para hp , lo que coincide con los signos de sus coeficientes estimados:

Parcela variable agregada en R

Aunque no podemos trazar una sola línea de regresión ajustada en una gráfica 2-D ya que tenemos múltiples variables predictoras, estas gráficas de variables agregadas nos permiten observar la relación entre cada variable predictora individual y la variable de respuesta mientras se mantienen constantes otras variables predictoras.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

ANCOVA significa "análisis de covarianza".Para comprender cómo funciona un ANCOVA, es útil comprender primero el ANOVA. Se utiliza un ANOVA…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!