Podemos usar la siguiente sintaxis para trazar una línea de regresión por grupo usando el paquete de visualización de R ggplot2 :
ggplot (df, aes (x = x_variable, y = y_variable, color = group_variable)) + geom_point () + geom_smooth (método = " lm ", relleno = NA )
Este tutorial proporciona un ejemplo rápido de cómo utilizar esta función en la práctica.
Ejemplo: trazar líneas de regresión por grupo con ggplot2
Supongamos que tenemos el siguiente conjunto de datos que muestra las siguientes tres variables para 15 estudiantes diferentes:
- Número de horas estudiadas
- Puntuación del examen recibida
- Técnica de estudio utilizada (A, B o C)
#create dataset df <- data.frame (horas = c (1, 2, 3, 3, 4, 1, 2, 2, 3, 4, 1, 2, 3, 4, 4), puntuación = c (84, 86, 85, 87, 94, 74, 76, 75, 77, 79, 65, 67, 69, 72, 80), técnica = rep (c (' A ', ' B ', ' C '), cada uno = 5 )) #ver conjunto de datos df técnica de puntuación de horas 1 1 84 A 2 2 86 A 3 3 85 A 4 3 87 A 5 4 94 A 6 1 74 B 7 2 76 B 8 2 75 B 9 3 77 B 10 4 79 B 11 1 65 C 12 2 67 C 13 3 69 C 14 4 72 C 15 4 80 C
El siguiente código muestra cómo trazar una línea de regresión que captura la relación entre las horas estudiadas y la puntuación del examen recibida para cada una de las tres técnicas de estudio:
#cargar biblioteca ggplot2 (ggplot2) #crear líneas de regresión para los tres grupos ggplot (df, aes (x = horas, y = puntuación, color = técnica)) + geom_point () + geom_smooth (método = " lm ", relleno = NA )
Tenga en cuenta que en geom_smooth () usamos method = ‘lm ”para especificar una tendencia lineal.
También podríamos usar otros métodos de suavizado como «glm», «loess» o «gam» para capturar tendencias no lineales en los datos. Puede encontrar la documentación completa de geom_smooth () aquí .
Tenga en cuenta que también podríamos usar diferentes formas para mostrar los puntajes del examen para cada uno de los tres grupos:
ggplot (df, aes (x = horas, y = puntuación, color = técnica, forma = técnica)) + geom_point () + geom_smooth (método = " lm ", relleno = NA )
Puede encontrar más tutoriales de ggplot2 aquí .
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/