Cómo crear una tabla de frecuencia de múltiples variables en R

Para calcular una tabla de frecuencia para múltiples variables en un marco de datos en R, puede usar la función apply () , que usa la siguiente sintaxis:

aplicar (X, MARGIN FUN)

dónde:

  • X: una matriz, matriz o marco de datos
  • MARGEN: aplica una función en filas (1) o columnas (2)
  • FUN: La función que se aplicará

Los siguientes ejemplos muestran cómo utilizar esta sintaxis en la práctica.

Ejemplo 1: Tabla de frecuencia para todas las variables en R

El siguiente código muestra cómo calcular una tabla de frecuencia para cada variable en un marco de datos:

#create data frame 
df <- data. marco (var1 = c (1, 1, 2, 2, 2, 2, 3),
                 var2 = c ('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3 = c (6, 7, 7, 7, 8, 8, 9))

#ver las primeras filas del marco de datos
cabeza (df)

  var1 var2 var3
1 1 A 6
2 1 A 7
3 2 A 7
4 2 A 7
5 2 B 8
6 2 B 8

#calcular tabla de frecuencia para cada variable en el marco de datos
 aplicar ((df), 2, tabla)

$ var1

1 2 3 
2 4 1 

$ var2

AB 
4 3 

$ var3

6 7 8 9 
1 3 2 1

El resultado son tres tablas de frecuencia, una para cada variable en el marco de datos.

A continuación, se explica cómo interpretar la primera tabla de frecuencias:

  • El valor 1 aparece 2 veces en la columna «var1»
  • El valor 2 aparece 4 veces en la columna «var2».
  • El valor 3 aparece 1 vez en la columna «var3»

Las otras tablas de frecuencias se pueden interpretar de manera similar.

Ejemplo 2: Tabla de frecuencia para variables específicas en R

El siguiente código muestra cómo calcular una tabla de frecuencia para variables específicas en un marco de datos

#create data frame 
df <- data. marco (var1 = c (1, 1, 2, 2, 2, 2, 3),
                 var2 = c ('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3 = c (6, 7, 7, 7, 8, 8, 9))

#calcular la tabla de frecuencias para las columnas var1 y var3 se
 aplican ((df [c (' var1 ', ' var3 ')]), 2, table)

$ var1

1 2 3 
2 4 1

$ var3

6 7 8 9 
1 3 2 1

Ejemplo 3: Tabla de frecuencia para todas las variables menos una en R

Supongamos que tenemos una columna de índice en un marco de datos y nos gustaría calcular una tabla de frecuencia para cada variable en el marco de datos, excepto la columna de índice.

El siguiente código muestra cómo hacerlo:

#create data frame 
df <- data. marco (índice = c (1, 2, 3, 4, 5, 6, 7),
                 var2 = c ('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3 = c (6, 7, 7, 7, 8, 8, 9))

#calcular la tabla de frecuencia para todas las columnas, excepto la columna de índice,
 aplicar ((df [-1]), 2, tabla)

$ var2

AB 
4 3 

$ var3

6 7 8 9 
1 3 2 1

Recursos adicionales

Cómo crear una tabla bidireccional en R
Cómo crear un histograma de frecuencia relativa en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

La distribución de Poisson es una distribución de probabilidad que se utiliza para modelar la probabilidad de que ocurra un…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!