Cómo rellenar los valores de NA para varias columnas en Pandas

Actualizado por ultima vez el 7 de mayo de 2021, por .

La función pandas fillna () es útil para completar los valores faltantes en las columnas de un DataFrame de pandas.

Este tutorial proporciona varios ejemplos de cómo usar esta función para completar los valores faltantes para varias columnas del siguiente marco de datos de pandas:

importar pandas como pd
 importar numpy como np

#create DataFrame
 df = pd. DataFrame ({'equipo': ['A', np. Nan , 'B', 'B', 'B', 'C', 'C', 'C'],
                   'puntos': [25, np. nan , 15 años, np. nan , 19, 23, 25, 29],
                   'asiste': [5, 7, 7, 9, 12, 9, np. nan , 4],
                   'rebotes': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
imprimir (df)

  puntos de equipo ayuda a rebotes
0 A 25,0 5,0 11
1 NaN NaN 7,0 8
2 B 15,0 7,0 10
3 B NaN 9,0 6
4 B 19,0 12,0 6
5 C 23,0 9,0 5
6 C 25,0 NaN 9
7 C 29,0 4,0 12

Ejemplo 1: Complete los valores perdidos de todas las columnas

El siguiente código muestra cómo completar los valores faltantes con un cero para todas las columnas en el DataFrame:

# reemplace todos los valores faltantes con cero 
gl. fillna (valor = 0 , inplace = True )

#view Impresión de DataFrame
 (df)

  puntos de equipo ayuda a rebotes
0 A 25,0 5,0 11
1 0 0,0 7,0 8
2 B 15,0 7,0 10
3 B 0,0 9,0 6
4 B 19,0 12,0 6
5 C 23,0 9,0 5
6 C 25,0 0,0 9
7 C 29,0 4,0 12

Ejemplo 2: Complete los valores perdidos de varias columnas

El siguiente código muestra cómo completar los valores faltantes con un cero solo para los puntos y ayuda a las columnas en el DataFrame:

#sustituya los valores faltantes en puntos y asiste columnas con cero 
gl [['puntos', 'asistencias']] = df [['puntos', 'asistencias']]. fillna (valor = 0 )

#view Impresión de DataFrame
 (df)

  puntos de equipo ayuda a rebotes
0 A 25,0 5,0 11
1 NaN 0,0 7,0 8
2 B 15,0 7,0 10
3 B 0,0 9,0 6
4 B 19,0 12,0 6
5 C 23,0 9,0 5
6 C 25,0 0,0 9
7 C 29,0 4,0 12

Ejemplo 3: Complete los valores perdidos de varias columnas con valores diferentes

El siguiente código muestra cómo completar los valores faltantes en tres columnas diferentes con tres valores diferentes:

# reemplace los valores faltantes en tres columnas con tres valores diferentes 
df. fillna ({'equipo': ' Desconocido ', 'puntos': 0 , 'asistencias': ' cero '}, inplace = True )

#view Impresión de DataFrame
 (df)

      puntos de equipo ayuda a rebotes
0 A 25,0 5 11
1 Desconocido 0.0 7 8
2 B 15.0 7 10
3 B 0.0 9 6
4 B 19,0 12 6
5 C 23,0 9 5
6 C 25,0 cero 9
7 C 29,0 4 12

Observe que cada uno de los valores faltantes en las tres columnas se reemplazó con algún valor único.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El análisis de componentes principales (PCA) es una técnica de aprendizaje automático no supervisada que busca encontrar componentes principales (combinaciones…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!