Cómo crear una gráfica de interacción en R (paso a paso)

Una gráfica de interacción es un tipo de gráfica que muestra los valores medios de varios grupos para dos variables diferentes.

Gráfico de interacción en el ejemplo de R

Este tipo de gráfico se utiliza a menudo en experimentos diseñados, ANOVA y análisis de regresión .

Este tutorial proporciona un ejemplo paso a paso de cómo crear una gráfica de interacción en R usando la biblioteca de visualización de datos ggplot2 .

Paso 1: crear los datos

Para este ejemplo, crearemos un conjunto de datos falso que contiene las siguientes tres variables para ocho estudiantes diferentes:

  • Técnica de estudio utilizada (‘A’ o ‘B’)
  • Horas de estudio
  • Puntuación del examen final

El siguiente código muestra cómo crear este conjunto de datos:

#create data 
df <- data. marco (tipo = c ('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 horas = c (1, 1, 2, 2, 1, 1, 2, 2),
                 puntuación = c (80, 82, 89, 93, 76, 79, 95, 99))

#ver datos
 df

  tipo puntaje de horas
1 A 1 80
2 A 1 82
3 A 2 89
4 A 2 93
5 B 1 76
6 B 1 79
7 B 2 95
8 B 2 99

Paso 2: crear la gráfica de interacción

A continuación, crearemos un gráfico de interacción para visualizar el puntaje promedio del examen basado en el total de horas dedicadas a estudiar y estudiar la técnica utilizada:

biblioteca (dplyr)
 biblioteca (ggplot2)

# encontrar la puntuación media del examen según las horas estudiadas y el tipo de estudio
 summary_data <- df%>% 
   group_by (horas, tipo)%>% 
   resume (score_groups = mean (puntuación))

#create interacción gráfica
 summary_data%>%
  ggplot () +
  aes (x = horas, y = puntuación_grupos, color = tipo) +
   geom_line ( aes (grupo = tipo)) +
   geom_point ()

Gráfico de interacción en R con ggplot2

A continuación se explica cómo interpretar la trama:

  • El eje x muestra el total de horas dedicadas al estudio.
  • El eje y muestra la puntuación media del examen.
  • Las dos líneas muestran la puntuación media del examen según la técnica de estudio utilizada.

Podemos ver que la puntuación media del examen es más alta para los alumnos que estudiaron más horas, independientemente de la técnica de estudio que utilizaron.

Sin embargo, dado que las dos líneas se cruzan, esto es una indicación de que existe un efecto de interacción presente.

Esto significa que la puntuación del examen depende de una interacción entre la técnica de estudio utilizada y el número de horas dedicadas al estudio.

Paso 3: modificar la gráfica de interacción (opcional)

Por último, podemos modificar las etiquetas de los ejes, el título y la estética general del gráfico para que se vea un poco mejor:

#create la gráfica de interacción con una mejor apariencia
 summary_data%>%
  ggplot () +
  aes (x = horas, y = score_groups, color = tipo) +
   geom_line ( aes (grupo = tipo)) +
   geom_point () +
   labs (title = ' Puntuación del examen por horas estudiadas y técnica de estudio ',
       color = ' Técnica ',
       x = ' Horas dedicadas a estudiar ',
       y = ' Puntuación media del examen ') +
   theme_minimal ()

Gráfico de interacción en el ejemplo de R

Nota: Elegimos usar theme_minimal () para el tema de la trama, pero puede encontrar una lista completa de los mejores temas de ggplot2 aquí .

Puede encontrar más tutoriales de R en esta página .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Una hipótesis estadística es una suposición sobre un parámetro de población . Por ejemplo, podemos suponer que la altura media…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!