¿Cómo calcular la asimetría y la curtosis en R?

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

En estadística, la asimetría y la curtosis son dos formas de medir la forma de una distribución.

La asimetría es una medida de la asimetría de una distribución. Este valor puede ser positivo o negativo.

  • Un sesgo negativo indica que la cola está en el lado izquierdo de la distribución, que se extiende hacia valores más negativos.
  • Un sesgo positivo indica que la cola está en el lado derecho de la distribución, que se extiende hacia valores más positivos.
  • Un valor de cero indica que no hay ningún sesgo en la distribución, lo que significa que la distribución es perfectamente simétrica.

La curtosis es una medida de si una distribución es de cola gruesa o de cola ligera en relación con una distribución normal .

  • La curtosis de una distribución normal es 3.
  • Si una distribución dada tiene una curtosis menor que 3, se dice que es playkurtic , lo que significa que tiende a producir menos valores atípicos y menos extremos que la distribución normal.
  • Si una distribución dada tiene una curtosis mayor que 3, se dice que es leptocúrtica , lo que significa que tiende a producir más valores atípicos que la distribución normal.

Nota: Algunas fórmulas (definición de Fisher) restan 3 de la curtosis para facilitar la comparación con la distribución normal. Usando esta definición, una distribución tendría una curtosis mayor que una distribución normal si tuviera un valor de curtosis mayor que 0.

Este tutorial explica cómo calcular tanto la asimetría como la curtosis de un conjunto de datos dado en R.

Ejemplo: Asimetría y Curtosis en R

Supongamos que tenemos el siguiente conjunto de datos:

datos = c (88, 95, 92, 97, 96, 97, 94, 86, 91, 95, 97, 88, 85, 76, 68)

Podemos visualizar rápidamente la distribución de valores en este conjunto de datos creando un histograma:

hist (datos, col = '#104E8B')

Asimetría y curtosis en R

En el histograma podemos ver que la distribución parece estar sesgada a la izquierda. Es decir, más valores se concentran en el lado derecho de la distribución.

Para calcular la asimetría y la curtosis de este conjunto de datos, podemos usar las funciones de skewness() y kurtosis() de la biblioteca de momentos en R:

Calcular el Sesgo en R y RStudio

Para calcular el sesgo en R y RStudio vamos a usar la función skewness.

install.packages("moments")
library(moments)

#Calcular el sesgo
skewness(data)

[1] -1.391777

Calcular la curtosis en R y RStudio

Para calcular curtosis en R y RStudio vamos a usar la función kurtosis.

#Calcular la curtosis
kurtosis(data)

[1] 4.177865

La asimetría resulta ser -1,391777 y la curtosis resulta ser 4,177865 .

Interpretaciones del sesgo y la curtosis

Dado que la asimetría es negativa, esto indica que la distribución está sesgada a la izquierda. Esto confirma lo que vimos en el histograma.

Dado que la curtosis es mayor que 3, esto indica que la distribución tiene más valores en las colas en comparación con una distribución normal.

El test de Jarque Bera

La biblioteca de moments también ofrece la función jarque.test () , que realiza una prueba de bondad de ajuste que determina si los datos de la muestra tienen asimetría y curtosis que coinciden con una distribución normal. Las hipótesis nula y alternativa de esta prueba son las siguientes:

Hipótesis nula : el conjunto de datos tiene una asimetría y una curtosis que coincide con una distribución normal.

Hipótesis alternativa : el conjunto de datos tiene una asimetría y una curtosis que no coincide con una distribución normal.

El siguiente código muestra cómo realizar esta prueba:

jarque.test (datos)

	Prueba de normalidad de Jarque-Bera

datos: datos
JB = 5.7097, valor p = 0.05756
hipótesis alternativa: mayor

El valor p de la prueba resulta ser 0.05756 . Dado que este valor no es menor que α = .05, no rechazamos la hipótesis nula. No tenemos evidencia suficiente para decir que este conjunto de datos tiene una asimetría y una curtosis diferente a la distribución normal.

Puede encontrar la documentación completa de la biblioteca de momentos aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

2 comentarios en «¿Cómo calcular la asimetría y la curtosis en R?»

Deja un comentario

R cuadrado , a menudo escrito R 2 , es la proporción de la varianza en la variable de respuesta…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!