Cómo calcular la media de varias columnas en R

A menudo, es posible que desee calcular la media de varias columnas en R. Afortunadamente, puede hacerlo fácilmente utilizando la función colMeans () .

colMeans (df)

Los siguientes ejemplos muestran cómo utilizar esta función en la práctica.

Uso de colMeans () para encontrar la media de varias columnas

El siguiente código muestra cómo usar la función colMeans () para encontrar la media de cada columna en un marco de datos:

#create marco de datos
df <- data.frame (var1 = c (1, 3, 3, 4, 5),
                 var2 = c (7, 7, 8, 3, 2),
                 var3 = c (3, 3, 6, 6, 8),
                 var4 = c (1, 1, 2, 8, 9))

# encontrar la media de cada columna
colMeans (df)

var1 var2 var3 var4 
 3,2 5,4 5,2 4,2 

También podemos especificar para qué columnas encontrar la media:

# encontrar la media de las columnas 2 y 3
colMeans (df [, c (2, 3)])

var2 var3 
 5,4 5,2 

# encontrar la media de las tres primeras columnas
colMeans (df [, 1: 3])

var1 var2 var3 
 3,2 5,4 5,2

Si hay algunas columnas que no son numéricas, puede usar sapply () para especificar que solo le gustaría encontrar la media de las columnas que son numéricas:

#create marco de datos
df <- data.frame (var1 = c (1, 3, 3, 4, 5),
                 var2 = c (7, 7, 8, 3, 2),
                 var3 = c (3, 3, 6, 6, 8),
                 var4 = c (1, 1, 2, 8, 9),
                 var5 = c ('a', 'a', 'b', 'b', 'c'))

# encontrar la media de solo columnas numéricas 
colMeans (df [ sapply (df, is.numeric)])

var1 var2 var3 var4 
 3,2 5,4 5,2 4,2 

Y si hay valores perdidos en alguna columna, puede usar el argumento na.rm = TRUE para ignorar los valores perdidos al calcular las medias:

# crear un marco de datos con algunos valores faltantes
df <- data.frame (var1 = c (1, 3, NA, NA, 5),
                 var2 = c (7, 7, 8, 3, 2),
                 var3 = c (3, 3, 6, 6, 8),
                 var4 = c (1, 1, 2, 8, NA))

# encontrar la media de cada columna e ignorar los valores faltantes 
colMeans (df, na.rm = TRUE )

var1 var2 var3 var4 
 3,0 5,4 5,2 3,0

Recursos adicionales

Cómo recorrer los nombres de las columnas en R
Cómo sumar columnas específicas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Un residual es la diferencia entre un valor observado y un valor predicho en un modelo de regresión . Se…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!