Cómo trazar una línea de regresión por grupo con ggplot2

Podemos usar la siguiente sintaxis para trazar una línea de regresión por grupo usando el paquete de visualización de R ggplot2 :

ggplot (df, aes (x = x_variable, y = y_variable, color = group_variable)) +
  geom_point () +
  geom_smooth (método = " lm ", relleno = NA )

Este tutorial proporciona un ejemplo rápido de cómo utilizar esta función en la práctica.

Ejemplo: trazar líneas de regresión por grupo con ggplot2

Supongamos que tenemos el siguiente conjunto de datos que muestra las siguientes tres variables para 15 estudiantes diferentes:

  • Número de horas estudiadas
  • Puntuación del examen recibida
  • Técnica de estudio utilizada (A, B o C)
#create dataset
 df <- data.frame (horas = c (1, 2, 3, 3, 4, 1, 2, 2, 3, 4, 1, 2, 3, 4, 4),
                 puntuación = c (84, 86, 85, 87, 94, 74, 76, 75, 77, 79, 65, 67, 69, 72, 80),
                 técnica = rep (c (' A ', ' B ', ' C '), cada uno = 5 ))

#ver conjunto de datos
df

   técnica de puntuación de horas
1 1 84 A
2 2 86 A
3 3 85 A
4 3 87 A
5 4 94 A
6 1 74 B
7 2 76 B
8 2 75 B
9 3 77 B
10 4 79 B
11 1 65 C
12 2 67 C
13 3 69 C
14 4 72 C
15 4 80 C

El siguiente código muestra cómo trazar una línea de regresión que captura la relación entre las horas estudiadas y la puntuación del examen recibida para cada una de las tres técnicas de estudio:

#cargar biblioteca
 ggplot2
 (ggplot2)
 #crear líneas de regresión para los tres grupos
 ggplot (df, aes (x = horas, y = puntuación, color = técnica)) +
  geom_point () +
  geom_smooth (método = " lm ", relleno = NA )

Línea de regresión por grupo en ggplot2

Tenga en cuenta que en geom_smooth () usamos method = ‘lm ”para especificar una tendencia lineal.

También podríamos usar otros métodos de suavizado como «glm», «loess» o «gam» para capturar tendencias no lineales en los datos. Puede encontrar la documentación completa de geom_smooth () aquí .

Tenga en cuenta que también podríamos usar diferentes formas para mostrar los puntajes del examen para cada uno de los tres grupos:

ggplot (df, aes (x = horas, y = puntuación, color = técnica, forma = técnica)) +
  geom_point () +
  geom_smooth (método = " lm ", relleno = NA )

Varias líneas de regresión en un gráfico en ggplot2

Puede encontrar más tutoriales de ggplot2 aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

El análisis discriminante lineal es un método que puede utilizar cuando tiene un conjunto de variables predictoras y le gustaría…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!