Cómo crear una tabla de contingencia en R

Actualizado por ultima vez el 7 de mayo de 2021, por .

Una tabla de contingencia (a veces denominada «tablas de referencias cruzadas») es un tipo de tabla que resume la relación entre dos variables categóricas.

Afortunadamente, es fácil crear una tabla de contingencia para variables en R usando la función de tabla dinámica. Este tutorial muestra un ejemplo de cómo hacerlo.

Ejemplo: tabla de contingencia en R

Supongamos que tenemos el siguiente conjunto de datos que muestra información para 20 pedidos de productos diferentes, incluido el tipo de producto comprado junto con el país en el que se compró el producto:

#crear datos
df <- data.frame (order_num = 1:20,
                 producto = rep (c (' TV ', ' Radio ', ' Computadora '), tiempos = c (9, 6, 5)),
                 país = rep (c (' A ', ' B ', ' C ', ' D '), tiempos = 5))

#ver datos
 df

   order_num producto país
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computadora D
17 17 Computadora A
18 18 Computadora B
19 19 Computadora C
20 20 Computadora D

Para crear una tabla de contingencia, simplemente podemos usar la función table () y proporcionar las variables producto y país como argumentos:

#crear tabla de contingencia
table <- table (df $ producto, df $ país)

tabla de contingencia #view
 mesa

           A B C D
  Ordenador 1 1 1 2
  Radio 1 2 2 1
  TV 3 2 2 2

También podemos usar la función addmargins () para agregar márgenes a la tabla:

#add márgenes a la tabla de contingencia
table_w_margins <- addmargins (tabla)

#ver tabla de contingencia
 table_w_margins

            Suma ABCD
  Computadora 1 1 1 2 5
  Radio 1 2 2 1 6
  TV 3 2 2 2 9
  Suma 5 5 5 5 20

A continuación se explica cómo interpretar la tabla:

  • El valor de la esquina inferior derecha muestra el número total de productos pedidos: 20.
  • Los valores del lado derecho muestran las sumas de las filas: se encargaron un total de 5 computadoras, se encargaron 6 radios y se encargaron 9 televisores.
  • Los valores en la parte inferior de la tabla muestran las sumas de las columnas: Se ordenó un total de 5 productos del país A, 5 del país B, 5 del país C y 5 del país D.
  • Los valores dentro de la tabla muestran el número de productos específicos pedidos de cada país: 1 computadora del país A, 1 radio del país A, 3 televisores del país A, etc.

Recursos adicionales

Cómo promediar entre columnas en R
Cómo sumar columnas específicas en R
Cómo calcular la media de varias columnas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En estadística, un problema de la tercera variable ocurre cuando una correlación observada entre dos variables en realidad puede explicarse…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!