¿Qué son las curvas de densidad? (Explicación y ejemplos)

Una curva de densidad es una curva en un gráfico que representa la distribución de valores en un conjunto de datos. Es útil por tres razones:

1. Una curva de densidad nos da una buena idea de la «forma» de una distribución, incluido si una distribución tiene uno o más «picos» de valores frecuentes y si la distribución está sesgada o no hacia la izquierda o hacia la derecha. .

2. Una curva de densidad nos permite ver visualmente dónde se ubican la media y la mediana de una distribución.

3. Una curva de densidad nos permite ver visualmente qué porcentaje de observaciones en un conjunto de datos se encuentran entre diferentes valores.

La curva de densidad más famosa es la curva en forma de campana que representa la distribución normal .

Para comprender mejor las curvas de densidad, considere el siguiente ejemplo.

Ejemplo: creación e interpretación de una curva de densidad

Supongamos que tenemos el siguiente conjunto de datos que muestra la altura de 20 plantas diferentes (en pulgadas) en un campo determinado:

4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 2, 2

Si creáramos un histograma simple para mostrar las frecuencias relativas de cada valor, se vería así:

Histograma de frecuencia relativa en R

El eje x muestra el valor de los datos y el eje y muestra la frecuencia relativa (por ejemplo, el valor «7» aparece 5 veces de 20 valores totales en el conjunto de datos, por lo que tiene una frecuencia relativa del 25% o 0,25 .

Y si creáramos una curva de densidad para capturar la «forma» de esta distribución, se vería así:

Ejemplo de curva de densidad

La curva es más alta cerca del centro de la distribución porque ahí es donde se encuentran la mayoría de valores. También es más bajo cerca de los extremos de la distribución porque menos plantas adoptan esos valores (por ejemplo, una altura de 4 pulgadas o 10 pulgadas).

Cómo interpretar las curvas de densidad

Las curvas de densidad vienen en todas las formas y tamaños y nos permiten obtener una comprensión visual rápida de la distribución de valores en un conjunto de datos determinado. En particular, son útiles para ayudarnos a visualizar:

1. Asimetría

La asimetría es una forma de describir la simetría de una distribución. Las curvas de densidad nos permiten ver rápidamente si un gráfico está sesgado a la izquierda, a la derecha o no tiene sesgo:

Ejemplo de curva de densidad sesgada a la izquierda

Ejemplo de curva de densidad sesgada a la derecha

Ejemplo de curva de densidad simétrica

2. La ubicación de la media y la mediana

Dependiendo de la asimetría de una curva de densidad, podemos saber rápidamente si la media o la mediana es mayor en una distribución dada. En particular:

  • Si se deja sesgada una curva de densidad , entonces la media es menor que la mediana.
  • Si una curva de densidad está sesgada a la derecha , entonces la media es mayor que la mediana.
  • Si una curva de densidad no tiene sesgo , entonces la media es igual a la mediana.

3. Número de picos

Las curvas de densidad también nos permiten ver rápidamente cuántos «picos» hay en una distribución determinada. En cada uno de los ejemplos anteriores, las distribuciones solo tenían un pico, por lo que describiríamos esas distribuciones como unimodales .

Sin embargo, algunas distribuciones pueden tener dos picos que llamamos distribuciones bimodales . Y en casos raros también podemos tener distribuciones multimodales que tienen dos o más picos.

Simplemente creando una curva de densidad para un conjunto de datos dado, podemos ver rápidamente cuántos picos hay en la distribución.

Propiedades de las curvas de densidad

Las curvas de densidad tienen las siguientes propiedades:

  • El área debajo de la curva siempre suma el 100%.
  • La curva nunca descenderá por debajo del eje x.

Tenga en cuenta estos dos hechos cuando cree o interprete curvas de densidad para diferentes distribuciones.

Recursos adicionales

Introducción a los histogramas de frecuencia relativa
Cómo hacer una curva de campana en Excel
Cómo hacer una curva de campana en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La regresión lineal múltiple es un método que podemos utilizar para cuantificar la relación entre dos o más variables predictoras…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!