Cómo calcular una media ponderada en R

Para calcular una media ponderada en R, puede usar la función incorporada weighted.mean () , que usa la siguiente sintaxis:

ponderada media (x, w)

dónde:

  • x: un vector de valores de datos sin procesar
  • w: un vector de pesos

Este tutorial muestra varios ejemplos de cómo utilizar esta función en la práctica.

Ejemplo 1: media ponderada de un vector

El siguiente código muestra cómo calcular la media ponderada para un vector de datos dado:

#define vector de valores de datos
datos <- c (3, 5, 6, 7, 8)

#definir vector de pesos
 pesos <- c (.1, .3, .3, .2, .1)

#calcular la media 
ponderada ponderada. media (x = datos, w = pesos)

[1] 5,8

La media ponderada resulta ser 5,8 .

Ejemplo 2: Media ponderada de una columna en un marco de datos

El siguiente código muestra cómo calcular la media ponderada de una columna en un marco de datos, utilizando otra columna como ponderaciones:

#create marco de datos
df <- data.frame (valores = c (3, 5, 6, 7, 8),
                 pesos = c (.1, .3, .3, .2, .1))

#calcular la media 
ponderada ponderada. media (x = df $ valores, w = df $ pesos)
[1] 5,8

La media ponderada resulta ser 5,8 .

Tenga en cuenta que también puede calcular la media ponderada de una columna en un marco de datos utilizando un vector separado como pesos:

#create marco de datos
df <- data.frame (valores = c (3, 5, 6, 7, 8),
                 otros_datos = c (6, 12, 14, 14, 7),
                 más_datos = c (3, 3, 4, 7, 9))

#definir vector de pesos
 pesos <- c (.1, .3, .3, .2, .1)

#calcular la media 
ponderada ponderada. media (x = df $ valores, w = pesos)
[1] 5,8

Una vez más, la media ponderada resulta ser 5,8 .

Cuándo usar una media ponderada

En la práctica, se usa una media ponderada cuando consideramos que algunos valores de datos son más importantes que otros y, por lo tanto, queremos que esos valores más importantes contribuyan más a la media final.

Recursos adicionales

Cómo calcular la media de varias columnas en R
Cómo calcular la media por grupo en R
Cómo sumar columnas específicas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La distribución de Rayleigh es una distribución de probabilidad continua que se utiliza para modelar variables aleatorias que solo pueden…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!