CDF vs. PDF: ¿Cuál es la diferencia?

Actualizado por ultima vez el 7 de mayo de 2021, por .

Este tutorial proporciona una explicación simple de la diferencia entre un PDF (función de densidad de probabilidad) y un CDF (función de distribución acumulativa) en estadística.

Variables aleatorias

Antes de que podamos definir un PDF o un CDF, primero debemos comprender las variables aleatorias.

Una variable aleatoria , generalmente denotada como X, es una variable cuyos valores son resultados numéricos de algún proceso aleatorio. Hay dos tipos de variables aleatorias: discretas y continuas.

Variables aleatorias discretas

Una variable aleatoria discreta es aquella que puede tomar solo un número contable de valores distintos como 0, 1, 2, 3, 4, 5… 100, 1 millón, etc. Algunos ejemplos de variables aleatorias discretas incluyen:

  • El número de veces que una moneda cae en cruz después de haber sido lanzada 20 veces.
  • La cantidad de veces que un dado cae en el número 4 después de haber sido lanzado 100 veces.

Variables aleatorias continuas

Una variable aleatoria continua es aquella que puede tomar un número infinito de valores posibles. Algunos ejemplos de variables aleatorias continuas incluyen:

  • Altura de una persona
  • Peso de un animal
  • Tiempo requerido para correr una milla

Por ejemplo, la altura de una persona podría ser 60,2 pulgadas, 65,2344 pulgadas, 70,431222 pulgadas, etc. Hay una cantidad infinita de valores posibles para la altura.

Regla de oro: si puedes contar el número de resultados, entonces estás trabajando con una variable aleatoria discreta (por ejemplo, contando el número de veces que una moneda cae en cara). Pero si puede medir el resultado, está trabajando con una variable aleatoria continua (por ejemplo, medición, altura, peso, tiempo, etc.)

Funciones de densidad de probabilidad

Una función de densidad de probabilidad (pdf) nos dice la probabilidad de que una variable aleatoria tome un cierto valor.

Por ejemplo, supongamos que tiramos un dado una vez. Si dejamos que x denote el número en el que caen los dados, entonces la función de densidad de probabilidad para el resultado se puede describir de la siguiente manera:

P (x <1) : 0

P (x = 1) : 1/6

P (x = 2) : 1/6

P (x = 3) : 1/6

P (x = 4) : 1/6

P (x = 5) : 1/6

P (x = 6) : 1/6

P (x> 6) : 0

Tenga en cuenta que este es un ejemplo de una variable aleatoria discreta, ya que x solo puede tomar valores enteros.

Para una variable aleatoria continua, no podemos usar un PDF directamente, ya que la probabilidad de que x tome cualquier valor exacto es cero.

Por ejemplo, suponga que queremos saber la probabilidad de que una hamburguesa de un restaurante en particular pese un cuarto de libra (0,25 libras). Dado que el peso es una variable continua, puede tomar una cantidad infinita de valores.

Por ejemplo, una hamburguesa determinada podría pesar en realidad 0.250001 libras, o 0.24 libras o 0.2488 libras. La probabilidad de que una hamburguesa determinada pese exactamente 0,25 libras es esencialmente cero.

Funciones de distribución acumulativa

Una función de distribución acumulativa (CDF) nos dice la probabilidad de que una variable aleatoria tome un valor menor o igual que x .

Por ejemplo, supongamos que tiramos un dado una vez. Si dejamos que x denote el número en el que caen los dados, entonces la función de distribución acumulativa para el resultado se puede describir de la siguiente manera:

P (x ≤ 0) : 0

P (x ≤ 1) : 1/6

P (x ≤ 2) : 2/6

P (x ≤ 3) : 3/6

P (x ≤ 4) : 4/6

P (x ≤ 5) : 5/6

P (x ≤ 6) : 6/6

P (x> 6) : 0

Observe que la probabilidad de que x sea ​​menor o igual a 6 es 6/6, que es igual a 1. Esto se debe a que los dados caerán en 1, 2, 3, 4, 5 o 6 con una probabilidad del 100%.

Este ejemplo usa una variable aleatoria discreta, pero también se puede usar una función de densidad continua para una variable aleatoria continua.

Las funciones de distribución acumulativa tienen las siguientes propiedades:

  • La probabilidad de que una variable aleatoria tome un valor menor que el valor más pequeño posible es cero. Por ejemplo, la probabilidad de que un dado caiga en un valor menor que 1 es cero.
  • La probabilidad de que una variable aleatoria tome un valor menor o igual al mayor valor posible es uno. Por ejemplo, la probabilidad de que un dado caiga en un valor de 1, 2, 3, 4, 5 o 6 es uno. Debe aterrizar en uno de esos números.
  • El CDF siempre es no decreciente. Es decir, la probabilidad de que un dado caiga en un número menor o igual a 1 es 1/6, la probabilidad de que caiga en un número menor o igual a 2 es 2/6, la probabilidad de que caiga en un número menor o igual a 3 es 3/6, etc. Las probabilidades acumuladas son siempre no decrecientes.

Relacionado: puede usar un gráfico de ojiva para visualizar una función de distribución acumulativa.

La relación entre un CDF y un PDF

En términos técnicos, una función de densidad de probabilidad (pdf) es la derivada de una función de distribución acumulativa (cdf).

Además, el área bajo la curva de una PDF entre infinito negativo yx es igual al valor de x en la CDF.

Para obtener una explicación detallada de la relación entre un pdf y un cdf, junto con la prueba de por qué el pdf es el derivado del cdf, consulte un libro de texto estadístico.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Ocasionalmente, es posible que desee agregar una columna vacía a un DataFrame de pandas. Afortunadamente, esto es bastante fácil de…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!