Cómo crear una tabla de contingencia en Python

Una tabla de contingencia es un tipo de tabla que resume la relación entre dos variables categóricas.

Para crear una tabla de contingencia en Python, podemos usar la función pandas.crosstab () , que usa la siguiente sintaxis:

pandas.crosstab (índice, columnas)

dónde:

  • índice: nombre de la variable para mostrar en las filas de la tabla de contingencia
  • columnas: nombre de la variable para mostrar en las columnas de la tabla de contingencia

El siguiente ejemplo paso a paso muestra cómo usar esta función para crear una tabla de contingencia en Python.

Paso 1: crear los datos

Primero, creemos un conjunto de datos que muestre información para 20 pedidos de productos diferentes, incluido el tipo de producto comprado (TV, computadora o radio) junto con el país (A, B o C) en el que se compró el producto:

importar pandas como pd

#create data 
df = pd. DataFrame ({'Orden': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
                            11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
                   'Producto': ['TV', 'TV', 'Comp', 'TV', 'TV', 'Comp',
                               'Comp', 'Comp', 'TV', 'Radio', 'TV', 'Radio', 'Radio',
                               'Radio', 'Comp', 'Comp', 'TV', 'TV', 'Radio', 'TV'],
                   'País': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B',
                               'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C']})

#ver datos
 df

        País del producto del pedido
0 1 TV A
1 2 TV A
2 3 Comp A
3 4 TV A
4 5 TV B
5 6 Comp B
6 7 Comp B
7 8 Comp B
8 9 TV B
9 10 Radio B
10 11 TV B
11 12 Radio B
12 13 Radio C
13 14 Radio C
14 15 Comp C
15 16 Comp C
16 17 TV C
17 18 TV C
18 19 Radio C
19 20 TV C

Paso 2: crear la tabla de contingencia

El siguiente código muestra cómo crear una tabla de contingencia para contar el número de cada producto pedido por cada país:

#create tabla de contingencia 
pd. tabla de referencias cruzadas (índice = gl [' País '], columnas = gl [' Producto '])

Producto Comp Radio TV
País			
A 1 0 3
B 3 2 3
C 2 3 3

He aquí cómo interpretar la tabla:

  • Se compró un total de 1 computadora en el país A.
  • Se adquirieron un total de 3 computadoras en el país B.
  • Se adquirieron un total de 2 computadoras del país C.
  • Se adquirieron un total de 0 radios del país A.
  • Se adquirieron un total de 2 radios del país B.
  • Se adquirieron un total de 3 radios del país C.
  • Se adquirieron un total de 3 televisores del país A.
  • Se adquirieron un total de 3 televisores del país B.
  • Se adquirieron un total de 3 televisores del país C.

Paso 3: agregar totales de margen a la tabla de contingencia

Podemos usar el argumento márgenes = Verdadero para agregar los totales de los márgenes a la tabla de contingencia:

#add márgenes a la tabla de contingencia 
pd. tabla de referencias cruzadas (índice = gl [' País '], columnas = gl [' Producto '], márgenes = Verdadero )

Producto Comp Radio TV Todo
País				
A 1 0 3 4
B 3 2 3 8
C 2 3 3 8
Todos 6 5 9 20 

La forma de interpretar los valores de la tabla es la siguiente:

Totales de fila:

  • Se realizaron un total de 4 pedidos desde el país A.
  • Se realizaron un total de 8 pedidos desde el país B.
  • Se realizaron un total de 8 pedidos desde el país C.

Totales de columna:

  • Se adquirieron un total de 6 computadoras.
  • Se adquirieron un total de 5 radios.
  • Se adquirieron un total de 9 televisores.

El valor en la esquina inferior derecha de la tabla muestra que se ordenó un total de 20 productos de todos los países.

Recursos adicionales

Cómo crear una tabla de contingencia en R
Cómo crear una tabla de contingencia en Excel

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un ANOVA de una vía ("análisis de varianza") compara las medias de tres o más grupos independientes para determinar si…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!