Cómo contar valores perdidos en un marco de datos de Pandas

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

A menudo, puede estar interesado en contar la cantidad de valores faltantes en un DataFrame de pandas.

Este tutorial muestra varios ejemplos de cómo contar los valores perdidos usando el siguiente DataFrame:

importar pandas como pd
 importar numpy como np

#create DataFrame con algunos valores faltantes
df = pd.DataFrame ({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view 
Impresión de DataFrame (df)

      a B C
0 4,0 NaN 11,0
1 NaN 6,0 8,0
2 NaN 8,0 10,0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12,0 NaN NaN

Cuente los valores perdidos totales en todo el marco de datos

El siguiente código muestra cómo calcular el número total de valores faltantes en todo el DataFrame:

df. isnull (). suma (). suma ()

5

Esto nos dice que hay 5 valores perdidos totales.

Cuente los valores perdidos totales por columna

El siguiente código muestra cómo calcular el número total de valores faltantes en cada columna del DataFrame:

df. isnull (). suma ()

un 2
b 2
c 1

Esto nos dice:

  • La columna ‘a’ tiene 2 valores perdidos.
  • La columna ‘b’ tiene 2 valores perdidos.
  • La columna ‘c’ tiene 1 valor faltante.

También puede mostrar el número de valores perdidos como un porcentaje de toda la columna:

df. isnull (). suma () / len (gl) * 100

a 33.333333
b 33.333333
c 16.666667

Esto nos dice:

  • Falta el 33,33% de los valores de la columna ‘a’.
  • Falta el 33,33% de los valores de la columna ‘b’.
  • Falta el 16,67% de los valores de la columna ‘c’.

Cuente los valores perdidos totales por fila

El siguiente código muestra cómo calcular el número total de valores faltantes en cada fila del DataFrame:

df. isnull (). suma (eje = 1 )

0 1
1 1
2 1
3 0
4 0
5 2

Esto nos dice:

  • La fila 1 tiene 1 valor faltante.
  • La fila 2 tiene 1 valor faltante.
  • La fila 3 tiene 1 valor faltante.
  • La fila 4 tiene 0 valores perdidos.
  • La fila 5 tiene 0 valores perdidos.
  • La fila 6 tiene 2 valores perdidos.

Recursos adicionales

Cómo encontrar valores únicos en varias columnas en Pandas
Cómo crear una nueva columna basada en una condición en Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

En estadística, los deciles son números que dividen un conjunto de datos en diez grupos de igual frecuencia. El primer…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!