Cómo contar observaciones por grupo en R

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

A menudo, puede estar interesado en contar el número de observaciones (o filas) por grupo en R. Afortunadamente, esto es fácil de hacer usando la función count () de la biblioteca dplyr .

biblioteca (dplyr)

Este tutorial explica varios ejemplos de cómo utilizar esta función en la práctica utilizando el siguiente marco de datos:

#create marco de datos
df <- data.frame (equipo = c ('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'C', 'C'),
                 posición = c ('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '),
                 puntos = c (4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))

#ver marco de datos
 df

   puntos de posición del equipo
1 AG 4
2 AG 13
3 AF 7
4 BG 8
5 BF 15
6 BF 15
7 BF 17
8 BG 9
9 CG 21
10 CF 22
11 CF 25
12 CF 31

Ejemplo 1: contar por una variable

El siguiente código muestra cómo contar el número total de jugadores por equipo:

#contar observaciones totales por variable 'equipo'
df%>% count (equipo)

# A tibble: 3 x 2
  equipo n
   
1 A 3
2 B 5
3 C 4

De la salida podemos ver que:

  • El equipo A tiene 3 jugadores
  • El equipo B tiene 5 jugadores
  • El equipo C tiene 4 jugadores

Esta función única count () nos da una buena idea de la distribución de jugadores por equipo.

Tenga en cuenta que también podemos ordenar los recuentos si nos gustaría:

#contar observaciones totales por variable 'equipo' 
df%>% count (equipo, sort = TRUE )

# A tibble: 3 x 2
  equipo n
   
1 B 5
2 C 4
3 A 3

Ejemplo 2: contar por múltiples variables

También podemos ordenar por más de una variable:

#contar observaciones totales por 'equipo' y 'posición'
 df%>% count (equipo, posición)

# A tibble: 6 x 3
  posición del equipo m
       
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 CG 1

De la salida podemos ver que:

  • El equipo A tiene 1 jugador en la posición ‘F’ (delantero) y 2 jugadores en la posición ‘G’ (guardia).
  • El equipo B tiene 3 jugadores en la posición ‘F’ (adelante) y 2 jugadores en la posición ‘G’ (guardia).
  • El equipo C tiene 3 jugadores en la posición ‘F’ (adelante) y 1 jugador en la posición ‘G’ (guardia).

Ejemplo 3: recuento ponderado

También podemos «ponderar» los recuentos de una variable por otra variable. Por ejemplo, el siguiente código muestra cómo contar el total de observaciones por equipo, usando la variable ‘puntos’ como ponderación:

df%>% count (equipo, peso = puntos )

# A tibble: 3 x 2
  equipo n
   
1 A 24
2 B 64
3 C 99

Puede encontrar la documentación completa para el recuento () la función aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Se utiliza una prueba U de Mann-Whitney (a veces llamada prueba de suma de rangos de Wilcoxon) para comparar las…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!