Cómo trazar varios resultados de regresión lineal en R

Cuando realizamos una regresión lineal simple en R, es fácil visualizar la línea de regresión ajustada porque solo estamos trabajando con una única variable predictora y una única variable de respuesta .

Por ejemplo, el siguiente código muestra cómo ajustar un modelo de regresión lineal simple a un conjunto de datos y graficar los resultados:

#create dataset
 data <- data.frame (x = c (1, 1, 2, 4, 4, 5, 6, 7, 7, 8, 9, 10, 11, 11),
                   y = c (13, 14, 17, 23, 24, 25, 25, 24, 28, 32, 33, 35, 40, 41))

#ajustar modelo de modelo de regresión lineal simple
 <- lm (y ~ x, data = data)

# crear un diagrama de dispersión del diagrama de datos
 (datos $ x, datos $ y)

#add línea de regresión ajustada
 abline (modelo)

Sin embargo, cuando realizamos una regresión lineal múltiple , resulta difícil visualizar los resultados porque hay varias variables predictoras y no podemos simplemente trazar una línea de regresión en un gráfico 2-D.

En su lugar, podemos usar gráficos de variables agregadas (a veces llamados «gráficos de regresión parcial»), que son gráficos individuales que muestran la relación entre la variable de respuesta y una variable predictora, mientras se controla la presencia de otras variables predictoras en el modelo .

El siguiente ejemplo muestra cómo realizar una regresión lineal múltiple en R y visualizar los resultados usando gráficos de variables agregadas.

Ejemplo: trazar varios resultados de regresión lineal en R

Supongamos que ajustamos el siguiente modelo de regresión lineal múltiple a un conjunto de datos en R usando el conjunto de datos mtcars incorporado :

#fit modelo de modelo de regresión lineal múltiple
 <- lm (mpg ~ disp + hp + drat, data = mtcars)

#ver resultados del modelo
resumen (modelo)

Llamada:
lm (fórmula = mpg ~ disp + hp + drat, data = mtcars)

Derechos residuales de autor:
    Mín. 1T Mediana 3T Máx. 
-5,1225 -1,8454 -0,4456 1,1342 6,4958 

Coeficientes:
             Estimar Std. Valor t de error Pr (> | t |)   
(Intercepción) 19,344293 6,370882 3,036 0,00513 **
disp -0.019232 0.009371 -2.052 0.04960 * 
CV -0,031229 0,013345 -2,340 0,02663 * 
drat 2.714975 1.487366 1.825 0.07863. 
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Error estándar residual: 3.008 en 28 grados de libertad
R cuadrado múltiple: 0,775, R cuadrado ajustado: 0,7509 
Estadístico F: 32,15 en 3 y 28 DF, valor de p: 3,28e-09

De los resultados podemos ver que los valores p para cada uno de los coeficientes es menor que 0.1. En aras de la simplicidad, asumiremos que cada una de las variables predictoras son significativas y deben incluirse en el modelo.

Para producir gráficos de variables adicionales, podemos usar la función avPlots () del paquete del automóvil :

#cargar biblioteca de paquetes de
 coche (coche)

#produce parcelas variables agregadas
avPlots (modelo)

A continuación se explica cómo interpretar cada trama:

El eje x muestra una única variable predictora y el eje y muestra la variable de respuesta.
La línea azul muestra la asociación entre la variable predictora y la variable de respuesta, mientras mantiene constante el valor de todas las demás variables predictoras .
Los puntos que están etiquetados en cada gráfico representan las 2 observaciones con los residuos más grandes y las 2 observaciones con el apalancamiento parcial más grande.

Tenga en cuenta que el ángulo de la línea en cada gráfico coincide con el signo del coeficiente de la ecuación de regresión estimada.

Por ejemplo, aquí están los coeficientes estimados para cada variable predictora del modelo:

disp: -0.019232
CV: -0.031229
maldito : 2.714975

Observe que el ángulo de la línea es positivo en la gráfica de la variable agregada para drat mientras que es negativo tanto para disp como para hp , lo que coincide con los signos de sus coeficientes estimados:

Aunque no podemos trazar una sola línea de regresión ajustada en una gráfica 2-D ya que tenemos múltiples variables predictoras, estas gráficas de variables agregadas nos permiten observar la relación entre cada variable predictora individual y la variable de respuesta mientras se mantienen constantes otras variables predictoras.

https://r-project.org
https://www.python.org/
https://www.stata.com/

Redactor del artículo

Luis Benites
Director de Statologos.com
Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Ejemplo: trazar varios resultados de regresión lineal en R

Redactor del artículo

¿Te hemos ayudado?

Artículos relacionados:

Deja un comentario Cancelar la respuesta

You have Successfully Subscribed!