Cómo rellenar los valores de NA para varias columnas en Pandas

Actualizado el 7 de mayo de 2021, por Luis Benites.

La función pandas fillna () es útil para completar los valores faltantes en las columnas de un DataFrame de pandas.

Este tutorial proporciona varios ejemplos de cómo usar esta función para completar los valores faltantes para varias columnas del siguiente marco de datos de pandas:

importar pandas como pd
 importar numpy como np

#create DataFrame
 df = pd. DataFrame ({'equipo': ['A', np. Nan , 'B', 'B', 'B', 'C', 'C', 'C'],
                   'puntos': [25, np. nan , 15 años, np. nan , 19, 23, 25, 29],
                   'asiste': [5, 7, 7, 9, 12, 9, np. nan , 4],
                   'rebotes': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
imprimir (df)

  puntos de equipo ayuda a rebotes
0 A 25,0 5,0 11
1 NaN NaN 7,0 8
2 B 15,0 7,0 10
3 B NaN 9,0 6
4 B 19,0 12,0 6
5 C 23,0 9,0 5
6 C 25,0 NaN 9
7 C 29,0 4,0 12

Ejemplo 1: Complete los valores perdidos de todas las columnas

El siguiente código muestra cómo completar los valores faltantes con un cero para todas las columnas en el DataFrame:

# reemplace todos los valores faltantes con cero 
gl. fillna (valor = 0 , inplace = True )

#view Impresión de DataFrame
 (df)

  puntos de equipo ayuda a rebotes
0 A 25,0 5,0 11
1 0 0,0 7,0 8
2 B 15,0 7,0 10
3 B 0,0 9,0 6
4 B 19,0 12,0 6
5 C 23,0 9,0 5
6 C 25,0 0,0 9
7 C 29,0 4,0 12

Ejemplo 2: Complete los valores perdidos de varias columnas

El siguiente código muestra cómo completar los valores faltantes con un cero solo para los puntos y ayuda a las columnas en el DataFrame:

#sustituya los valores faltantes en puntos y asiste columnas con cero 
gl [['puntos', 'asistencias']] = df [['puntos', 'asistencias']]. fillna (valor = 0 )

#view Impresión de DataFrame
 (df)

  puntos de equipo ayuda a rebotes
0 A 25,0 5,0 11
1 NaN 0,0 7,0 8
2 B 15,0 7,0 10
3 B 0,0 9,0 6
4 B 19,0 12,0 6
5 C 23,0 9,0 5
6 C 25,0 0,0 9
7 C 29,0 4,0 12

Ejemplo 3: Complete los valores perdidos de varias columnas con valores diferentes

El siguiente código muestra cómo completar los valores faltantes en tres columnas diferentes con tres valores diferentes:

# reemplace los valores faltantes en tres columnas con tres valores diferentes 
df. fillna ({'equipo': ' Desconocido ', 'puntos': 0 , 'asistencias': ' cero '}, inplace = True )

#view Impresión de DataFrame
 (df)

      puntos de equipo ayuda a rebotes
0 A 25,0 5 11
1 Desconocido 0.0 7 8
2 B 15.0 7 10
3 B 0.0 9 6
4 B 19,0 12 6
5 C 23,0 9 5
6 C 25,0 cero 9
7 C 29,0 4 12

Observe que cada uno de los valores faltantes en las tres columnas se reemplazó con algún valor único.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

El análisis de componentes principales (PCA) es una técnica de aprendizaje automático no supervisada que busca encontrar componentes principales (combinaciones…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!