Cómo trazar valores predichos en R (con ejemplos)

A menudo, es posible que desee trazar los valores predichos de un modelo de regresión en R para visualizar las diferencias entre los valores predichos y los valores reales.

Este tutorial proporciona ejemplos de cómo crear este tipo de gráfico en base R y ggplot2.

Ejemplo 1: Gráfico de valores predichos frente a valores reales en base R

El siguiente código muestra cómo ajustar un modelo de regresión lineal múltiple en R y luego crear un gráfico de valores predichos frente a valores reales:

#create data 
df <- data. marco (x1 = c (3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2 = c (6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y = c (22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#ajustar modelo de modelo de regresión lineal múltiple
 <- lm (y ~ x1 + x2, data = df)

#plot gráfico de valores predichos vs. reales
 (x = predecir (modelo), y = df $ y,
     xlab = ' Valores predichos ',
     ylab = ' Valores reales ',
     main = ' Valores predichos frente a valores reales ')

#add línea diagonal para la línea de regresión estimada
 abline (a = 0 , b = 1 )

Gráfico de valores predichos en R

El eje x muestra los valores predichos del modelo y el eje y muestra los valores reales del conjunto de datos. La línea diagonal en el medio del gráfico es la línea de regresión estimada.

Dado que cada uno de los puntos de datos se encuentra bastante cerca de la línea de regresión estimada, esto nos dice que el modelo de regresión hace un buen trabajo al ajustar los datos.

También podemos crear un marco de datos que muestre los valores reales y predichos para cada punto de datos:

# crear un marco de datos de valores reales y pronosticados 
valores <- datos. marco (actual = df $ y, predicho = predecir (modelo))

#ver marco de datos
valores

   real predicho
1 22 22.54878
2 24 23.56707
3 24 23,96341
4 25 24,98171
5 25 25.37805
6 27 26.79268
7 29 28.60366
8 31 30.41463
9 32 33.86585
10 36 34.88415

Ejemplo 2: Gráfico de valores predichos frente a valores reales en ggplot2

El siguiente código muestra cómo crear un gráfico de valores predichos frente a valores reales utilizando el paquete de visualización de datos ggplot2 :

biblioteca (ggplot2) 
 
#create data
df <- data. marco(x1 = c (3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2 = c (6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y = c (22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#ajustar modelo de modelo de regresión lineal múltiple
 <- lm (y ~ x1 + x2, data = df)

#plot predicho vs valores reales
 ggplot (df, aes (x = predecir (modelo), y = y)) +
  geom_point () +
  geom_abline (intersección = 0 , pendiente = 1 ) +
  laboratorios (x = ' Valores predichos ', y = ' Valores reales ', título = ' Valores predichos frente a valores reales ')

Una vez más, el eje x muestra los valores predichos del modelo y el eje y muestra los valores reales del conjunto de datos.

Recursos adicionales

Cómo crear un gráfico de residuos en R
Cómo crear un histograma de residuos en R
Cómo calcular residuos estandarizados en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La prueba de Grubbs se utiliza para identificar la presencia de valores atípicos en un conjunto de datos. Para utilizar…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!