Cómo trazar una línea de regresión por grupo con ggplot2

Podemos usar la siguiente sintaxis para trazar una línea de regresión por grupo usando el paquete de visualización de R ggplot2 :

ggplot (df, aes (x = x_variable, y = y_variable, color = group_variable)) +
  geom_point () +
  geom_smooth (método = " lm ", relleno = NA )

Este tutorial proporciona un ejemplo rápido de cómo utilizar esta función en la práctica.

Ejemplo: trazar líneas de regresión por grupo con ggplot2

Supongamos que tenemos el siguiente conjunto de datos que muestra las siguientes tres variables para 15 estudiantes diferentes:

  • Número de horas estudiadas
  • Puntuación del examen recibida
  • Técnica de estudio utilizada (A, B o C)
#create dataset
 df <- data.frame (horas = c (1, 2, 3, 3, 4, 1, 2, 2, 3, 4, 1, 2, 3, 4, 4),
                 puntuación = c (84, 86, 85, 87, 94, 74, 76, 75, 77, 79, 65, 67, 69, 72, 80),
                 técnica = rep (c (' A ', ' B ', ' C '), cada uno = 5 ))

#ver conjunto de datos
df

   técnica de puntuación de horas
1 1 84 A
2 2 86 A
3 3 85 A
4 3 87 A
5 4 94 A
6 1 74 B
7 2 76 B
8 2 75 B
9 3 77 B
10 4 79 B
11 1 65 C
12 2 67 C
13 3 69 C
14 4 72 C
15 4 80 C

El siguiente código muestra cómo trazar una línea de regresión que captura la relación entre las horas estudiadas y la puntuación del examen recibida para cada una de las tres técnicas de estudio:

#cargar biblioteca
 ggplot2
 (ggplot2)
 #crear líneas de regresión para los tres grupos
 ggplot (df, aes (x = horas, y = puntuación, color = técnica)) +
  geom_point () +
  geom_smooth (método = " lm ", relleno = NA )

Línea de regresión por grupo en ggplot2

Tenga en cuenta que en geom_smooth () usamos method = ‘lm ”para especificar una tendencia lineal.

También podríamos usar otros métodos de suavizado como «glm», «loess» o «gam» para capturar tendencias no lineales en los datos. Puede encontrar la documentación completa de geom_smooth () aquí .

Tenga en cuenta que también podríamos usar diferentes formas para mostrar los puntajes del examen para cada uno de los tres grupos:

ggplot (df, aes (x = horas, y = puntuación, color = técnica, forma = técnica)) +
  geom_point () +
  geom_smooth (método = " lm ", relleno = NA )

Varias líneas de regresión en un gráfico en ggplot2

Puede encontrar más tutoriales de ggplot2 aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El análisis discriminante lineal es un método que puede utilizar cuando tiene un conjunto de variables predictoras y le gustaría…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!