Cómo agregar varias columnas en R (con ejemplos)

Actualizado el 7 de mayo de 2021, por Luis Benites.

Podemos usar la función aggregate () en R para producir estadísticos de resumen para una o más variables en un marco de datos.

Esta función utiliza la siguiente sintaxis básica:

agregado (suma_var ~ grupo_var, datos = gl, DIVERSIÓN = media)

dónde:

  • sum_var: la variable a resumir
  • group_var: la variable para agrupar
  • datos: el nombre del marco de datos
  • DIVERSIÓN: la estadística de resumen para calcular

Este tutorial proporciona varios ejemplos de cómo usar esta función para agregar una o más columnas a la vez en R, usando el siguiente marco de datos como ejemplo:

#create data frame 
df <- data. frame (equipo = c ('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'),
                 conf = c ('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'),
                 puntos = c (1, 3, 3, 4, 5, 7, 7, 9),
                 rebotes = c (7, 7, 8, 3, 2, 7, 14, 13))

#ver marco de datos
 df

  rebotes de puntos de conf del equipo
1 AE 1 7
2 AE 3 7
3 AW 3 8
4 BW 4 3
5 BW 5 2
6 BW 7 7
7 CW 7 14
8 CW 9 13

Ejemplo 1: resumir una variable y agrupar por una variable

El siguiente código muestra cómo encontrar la media de puntos anotados, agrupados por equipo:

# encontrar la media de puntos anotados, agrupados por equipo 
agregado (puntos ~ equipo, datos = gl, DIVERSIÓN = media, na. rm = VERDADERO )

  puntos de equipo
1 A 2.333333
2 B 5.333333
3 C 8.000000

Ejemplo 2: resumir una variable y agrupar por varias variables

El siguiente código muestra cómo encontrar los puntos medios anotados, agrupados por equipo y conferencia:

# encontrar la media de puntos anotados, agrupados por equipo y 
agregado de conferencia (puntos ~ equipo + conf, datos = df, DIVERSIÓN = media, na. rm = VERDADERO )

  puntos de conf del equipo
1 AE 2.000000
2 AW 3.000000
3 BW 5.333333
4 CW 8.000000

Ejemplo 3: resumir múltiples variables y agrupar por una variable

El siguiente código muestra cómo encontrar los puntos medios y los rebotes medios, agrupados por equipo:

# encontrar la media de puntos anotados, agrupados por equipo y 
agregado de conferencia ( cbind (puntos, rebotes) ~ equipo, datos = gl, DIVERSIÓN = media, na. rm = VERDADERO )

  rebotes de puntos de equipo
1 A 2,333333 7,333333
2 B 5.333333 4.000000
3 C 8.000000 13.500000

Ejemplo 4: Resumir múltiples variables y agrupar por múltiples variables

El siguiente código muestra cómo encontrar los puntos medios y los rebotes medios, agrupados por equipo y conferencia:

# encontrar la media de puntos anotados, agrupados por equipo y 
agregado de conferencia ( cbind (puntos, rebotes) ~ equipo + conf, datos = gl, DIVERSIÓN = media, na. rm = VERDADERO )

  rebotes de puntos de conf del equipo
1 AE 2.000000 7.0
2 AW 3.000000 8.0
3 BW 5.333333 4.0
4 CW 8.000000 13.5

Recursos adicionales

Cómo calcular la media de varias columnas en R
Cómo sumar columnas específicas en R
Cómo sumar filas específicas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Uno de los supuestos clave en la regresión lineal es que no existe correlación entre los residuos, por ejemplo, los…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!