Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 17 de julio de 2024, por Luis Benites.
Una tabla de contingencia (a veces denominada «tablas de referencias cruzadas») es un tipo de tabla que resume la relación entre dos variables categóricas.
Afortunadamente, es fácil crear una tabla de contingencia para variables en R usando la función de tabla dinámica. Este tutorial muestra un ejemplo de cómo hacerlo.
Ejemplo: tabla de contingencia en R
Supongamos que tenemos el siguiente conjunto de datos que muestra información para 20 pedidos de productos diferentes, incluido el tipo de producto comprado junto con el país en el que se compró el producto:
#crear datos df <- data.frame (order_num = 1:20, producto = rep (c (' TV ', ' Radio ', ' Computadora '), tiempos = c (9, 6, 5)), país = rep (c (' A ', ' B ', ' C ', ' D '), tiempos = 5)) #ver datos df order_num producto país 1 1 TV A 2 2 TV B 3 3 TV C 4 4 TV D 5 5 TV A 6 6 TV B 7 7 TV C 8 8 TV D 9 9 TV A 10 10 Radio B 11 11 Radio C 12 12 Radio D 13 13 Radio A 14 14 Radio B 15 15 Radio C 16 16 Computadora D 17 17 Computadora A 18 18 Computadora B 19 19 Computadora C 20 20 Computadora D
Para crear una tabla de contingencia, simplemente podemos usar la función table () y proporcionar las variables producto y país como argumentos:
#crear tabla de contingencia table <- table (df $ producto, df $ país) tabla de contingencia #view mesa A B C D Ordenador 1 1 1 2 Radio 1 2 2 1 TV 3 2 2 2
También podemos usar la función addmargins () para agregar márgenes a la tabla:
#add márgenes a la tabla de contingencia table_w_margins <- addmargins (tabla) #ver tabla de contingencia table_w_margins Suma ABCD Computadora 1 1 1 2 5 Radio 1 2 2 1 6 TV 3 2 2 2 9 Suma 5 5 5 5 20
A continuación se explica cómo interpretar la tabla:
- El valor de la esquina inferior derecha muestra el número total de productos pedidos: 20.
- Los valores del lado derecho muestran las sumas de las filas: se encargaron un total de 5 computadoras, se encargaron 6 radios y se encargaron 9 televisores.
- Los valores en la parte inferior de la tabla muestran las sumas de las columnas: Se ordenó un total de 5 productos del país A, 5 del país B, 5 del país C y 5 del país D.
- Los valores dentro de la tabla muestran el número de productos específicos pedidos de cada país: 1 computadora del país A, 1 radio del país A, 3 televisores del país A, etc.
Recursos adicionales
Cómo promediar entre columnas en R
Cómo sumar columnas específicas en R
Cómo calcular la media de varias columnas en R
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: