Cómo calcular el coeficiente de variación en Python

Un coeficiente de variación , a menudo abreviado como CV , es una forma de medir qué tan dispersos están los valores en un conjunto de datos en relación con la media. Se calcula como:

CV = σ / μ

dónde:

  • σ: la desviación estándar del conjunto de datos
  • μ: la media del conjunto de datos

En términos sencillos, el coeficiente de variación es simplemente la relación entre la desviación estándar y la media.

Cuándo usar el coeficiente de variación

El coeficiente de variación se usa a menudo para comparar la variación entre dos conjuntos de datos diferentes.

En el mundo real, a menudo se usa en finanzas para comparar el rendimiento promedio esperado de una inversión en relación con la desviación estándar esperada de la inversión. Esto permite a los inversores comparar la relación riesgo-rendimiento entre inversiones.

Por ejemplo, suponga que un inversionista está considerando invertir en los siguientes dos fondos mutuos:

Fondo de inversión A: media = 9%, desviación estándar = 12,4%

Fondo de inversión B: media = 5%, desviación estándar = 8,2%

Al calcular el coeficiente de variación de cada fondo, el inversor encuentra:

CV para Fondo Mutuo A = 12,4% / 9% = 1,38

CV para Fondo Mutuo B = 8.2% / 5% = 1.64

Dado que el fondo mutuo A tiene un coeficiente de variación más bajo, ofrece un mejor rendimiento medio en relación con la desviación estándar.

Cómo calcular el coeficiente de variación en Python

Para calcular el coeficiente de variación de un conjunto de datos en Python, puede usar la siguiente sintaxis:

importar numpy como np

cv = lambda x: np. std (x, ddof = 1 ) / np. media (x) * 100

Los siguientes ejemplos muestran cómo utilizar esta sintaxis en la práctica.

Ejemplo 1: coeficiente de variación para una sola matriz

El siguiente código muestra cómo calcular CV para una sola matriz:

#create vector of data
 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82]

#define la función para calcular cv 
cv = lambda x: np. std (x, ddof = 1 ) / np. mean (x) * 100 
 
#calcular CV
 cv (datos)

9.234518

El coeficiente de variación resulta ser 9.23 .

Ejemplo 2: coeficiente de variación para varios vectores

El siguiente código muestra cómo calcular el CV para varias columnas en un DataFrame de pandas:

importar numpy como np 
importar pandas como pd

#define la función para calcular cv 
cv = lambda x: np. std (x, ddof = 1 ) / np. media (x) * 100

#create pandas DataFrame
gl = pd. DataFrame ({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95],
                   'b': [77, 88, 85, 76, 81, 82, 88, 91, 92, 99],
                   'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, 84]})

#calcular CV para cada columna en el marco de datos
 df. aplicar (cv)

a 11.012892
b 8.330843
c 7.154009
dtype: float64

Tenga en cuenta que los valores perdidos simplemente se ignorarán al calcular el coeficiente de variación:

importar numpy como np 
importar pandas como pd

#define función para calcular cv
cv = lambda x: np. std (x, ddof = 1 ) / np. media (x) * 100

#create pandas DataFrame
gl = pd. DataFrame ({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95],
                   'b': [77, 88, 85, 76, 81, 82, 88, 91, np. nan , 99],
                   'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, np. nan ]})

#calcular CV para cada columna en el marco de datos
 df. aplicar (cv)

a 11.012892
b 8.497612
c 5.860924
dtype: float64

Recursos adicionales

Cómo calcular el coeficiente de variación en R
Cómo calcular el coeficiente de variación en Excel
Cómo calcular el coeficiente de variación en Google Sheets

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

R es uno de los lenguajes de programación más populares para trabajar con datos. Pero antes de que podamos trabajar…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!