Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 8 de septiembre de 2022, por Dereck Amesquita.
Un coeficiente de variación , a menudo abreviado como CV , es una forma de medir qué tan dispersos están los valores en un conjunto de datos en relación con la media. Se calcula como:
CV = σ / μ
dónde:
- σ: la desviación estándar del conjunto de datos
- μ: la media del conjunto de datos
En términos sencillos, el coeficiente de variación es simplemente la relación entre la desviación estándar y la media.
Cuándo usar el coeficiente de variación
El coeficiente de variación se usa a menudo para comparar la variación entre dos conjuntos de datos diferentes.
En el mundo real, a menudo se usa en finanzas para comparar el rendimiento promedio esperado de una inversión en relación con la desviación estándar esperada de la inversión. Esto permite a los inversores comparar la relación riesgo-rendimiento entre inversiones.
Por ejemplo, suponga que un inversionista está considerando invertir en los siguientes dos fondos mutuos:
Fondo de inversión A: media = 9%, desviación estándar = 12,4%
Fondo de inversión B: media = 5%, desviación estándar = 8,2%
Al calcular el coeficiente de variación de cada fondo, el inversor encuentra:
CV para Fondo Mutuo A = 12,4% / 9% = 1,38
CV para Fondo Mutuo B = 8.2% / 5% = 1.64
Dado que el fondo mutuo A tiene un coeficiente de variación más bajo, ofrece un mejor rendimiento medio en relación con la desviación estándar.
Cómo calcular el coeficiente de variación en R
Para calcular el coeficiente de variación de un conjunto de datos en R, puede utilizar la siguiente sintaxis:
cv <- sd(datos) / media(datos) * 100
Los siguientes ejemplos muestran cómo utilizar esta sintaxis en la práctica.
Ejemplo 1: coeficiente de variación para un solo vector
El siguiente código muestra cómo calcular CV para un solo vector:
# Crear vector de datos datos <- c (45, 32, 22, 17, 55, 37) # Calcular CV cv <- sd(datos) / mean(datos) * 100 # Ver CV cv [1] 40.90
El coeficiente de variación resulta ser 40.90. Es decir, los datos se encuentran un 40.90% desviados de su media .
Ejemplo 2: coeficiente de variación para varios vectores
El siguiente código muestra cómo calcular el CV para varios vectores en un marco de datos usando la función sapply () :
# Creamos data frame data <- data.frame (a = c (88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b = c (77, 88, 85, 76, 81, 82, 88, 91, 92, 99), c = c (67, 68, 68, 74, 74, 76, 76, 77, 78, 84)) #calcular CV para cada columna en el marco de datos sapply (data, function (x) sd (x) / mean (x) * 100 ) A B C 11.012892 8.330843 7.154009
Asegúrese de usar na.rm = T si también faltan valores en sus datos. Esto le dice a R que simplemente ignore los valores perdidos al calcular el coeficiente de variación:
#create data frame datos <- data.frame (a = c (88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b = c (77, 88, 85, 76, 81, 82, 88, 91, NA , 99), c = c (67, 68, 68, 74, 74, 76, 76, 77, 78, NA )) #calcular CV para cada columna en el marco de datos sapply (datos, function (x) sd (x, na.rm = T ) / mean (x, na.rm = T ) * 100 ) A B C 11.012892 8.497612 5.860924
Recursos adicionales
Cómo calcular la desviación absoluta mediana en R
Cómo calcular la desviación estándar en R
Cómo encontrar el rango en R
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: