Cómo calcular la media de varias columnas en R

A menudo, es posible que desee calcular la media de varias columnas en R. Afortunadamente, puede hacerlo fácilmente utilizando la función colMeans () .

colMeans (df)

Los siguientes ejemplos muestran cómo utilizar esta función en la práctica.

Uso de colMeans () para encontrar la media de varias columnas

El siguiente código muestra cómo usar la función colMeans () para encontrar la media de cada columna en un marco de datos:

#create marco de datos
df <- data.frame (var1 = c (1, 3, 3, 4, 5),
                 var2 = c (7, 7, 8, 3, 2),
                 var3 = c (3, 3, 6, 6, 8),
                 var4 = c (1, 1, 2, 8, 9))

# encontrar la media de cada columna
colMeans (df)

var1 var2 var3 var4 
 3,2 5,4 5,2 4,2 

También podemos especificar para qué columnas encontrar la media:

# encontrar la media de las columnas 2 y 3
colMeans (df [, c (2, 3)])

var2 var3 
 5,4 5,2 

# encontrar la media de las tres primeras columnas
colMeans (df [, 1: 3])

var1 var2 var3 
 3,2 5,4 5,2

Si hay algunas columnas que no son numéricas, puede usar sapply () para especificar que solo le gustaría encontrar la media de las columnas que son numéricas:

#create marco de datos
df <- data.frame (var1 = c (1, 3, 3, 4, 5),
                 var2 = c (7, 7, 8, 3, 2),
                 var3 = c (3, 3, 6, 6, 8),
                 var4 = c (1, 1, 2, 8, 9),
                 var5 = c ('a', 'a', 'b', 'b', 'c'))

# encontrar la media de solo columnas numéricas 
colMeans (df [ sapply (df, is.numeric)])

var1 var2 var3 var4 
 3,2 5,4 5,2 4,2 

Y si hay valores perdidos en alguna columna, puede usar el argumento na.rm = TRUE para ignorar los valores perdidos al calcular las medias:

# crear un marco de datos con algunos valores faltantes
df <- data.frame (var1 = c (1, 3, NA, NA, 5),
                 var2 = c (7, 7, 8, 3, 2),
                 var3 = c (3, 3, 6, 6, 8),
                 var4 = c (1, 1, 2, 8, NA))

# encontrar la media de cada columna e ignorar los valores faltantes 
colMeans (df, na.rm = TRUE )

var1 var2 var3 var4 
 3,0 5,4 5,2 3,0

Recursos adicionales

Cómo recorrer los nombres de las columnas en R
Cómo sumar columnas específicas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un residual es la diferencia entre un valor observado y un valor predicho en un modelo de regresión . Se…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!