Función de distribución empírica / CDF empírica

Actualizado por ultima vez el 31 de mayo de 2022, por Luis Benites.

Definición de función de distribución empírica

Una función de distribución acumulativa empírica (también llamada función de distribución empírica , ECDF, o simplemente EDF) y una función de distribución acumulativa son básicamente lo mismo: ambos son modelos de probabilidad para datos. Sin embargo, mientras que un CDF es un modelo hipotético de una distribución, el ECDF modela datos empíricos (es decir, observados). Para decirlo de otra manera, el ECDF es la distribución de probabilidad que obtendría si tomara muestras de su muestra , en lugar de la población . Digamos que tienes un conjunto de datos experimentales (observados) x 1 , x 2 …,x n . El EDF le dará la fracción de observaciones de muestra menores o iguales a un valor particular de x.

Más formalmente, si tiene un conjunto de estadísticas de orden (y 1 < y 2 < … < y n ) de una muestra aleatoria observada, entonces la función de distribución empírica se define como una suma de iid variables aleatorias : Donde I = la función indicadora (Mahmud, 2000). La fórmula es en realidad más fácil de trabajar de lo que parece. El siguiente ejemplo muestra cómo puede usar la fórmula para generar un EDF para sus datos experimentales y cómo se puede usar el EDF como comparación con una distribución hipotética.
función de distribución empírica

Cómo usar la fórmula para crear un EDF a partir de datos

Digamos que tienes 50 observaciones de un experimento. Para crear el FED:

Paso 1: Ingrese sus datos en la columna A de una hoja de cálculo. Ordenar en orden ascendente (de menor a mayor). Nota : solo muestro los primeros 11 valores en esta imagen debido a limitaciones de espacio, pero debe ingresar todos los suyos.
fcdf

Paso 2: En la columna B, escriba k/n, donde:

  • “k” es la observación numerada (esto es fácil, es solo 1, 2, 3, 4, 5…)
  • “n” es el número en su muestra. Para este ejemplo, tengo 50 observaciones, así que ingresé 1/50.

Para este ejemplo (las 11 observaciones truncadas), mis entradas son 1/50, 2/50, 3/50, 4/50, 6/50, 7/50, 8/50, 9/50, 10/50 y 11 /50:
FED

¡Eso es todo!

Usando el EDF como una comparación

Si desea comparar sus datos con otra distribución , simplemente ingrese los valores de la distribución en la columna C. Por ejemplo, la siguiente imagen muestra valores para la distribución gamma para α = 4 y β = .25, aunque puede comparar sus datos con cualquier distribución de probabilidad que desee.

Nota : Puede encontrar instrucciones para ingresar valores gamma en Excel en la página de distribución gamma ):
edf2

El diagrama de dispersión resultante le brinda una idea de si los valores coinciden con la distribución teórica elegida. A partir de estos datos limitados, parece que los datos empíricos podrían ser una buena combinación para la distribución gamma:
edf3

Referencias

Funciones de distribución empíricas. Recuperado el 2 de noviembre de 2017 de: http://homepages.cae.wisc.edu/~ie642/content/Techniques/EmpiricalDistributions/empirica.htm
Mahmoud, H. (2000). Clasificación: una teoría de la distribución. John Wiley & Sons.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

La clase de distribuciones normal sesgada de Azzalini es una familia de distribuciones que incluye la distribución normal como un…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!