Distribución normal frente a distribución normal estándar: la diferencia

La distribución normal es la distribución de probabilidad más utilizada en estadística.

Tiene las siguientes propiedades:

  • Simétrico
  • En forma de campana
  • La media y la mediana son iguales; ambos ubicados en el centro de la distribución

La media de la distribución normal determina su ubicación y la desviación estándar determina su propagación.

Por ejemplo, la siguiente gráfica muestra tres distribuciones normales con diferentes medias y desviaciones estándar:

La distribución normal estándar es un tipo específico de distribución normal donde la media es igual a 0 y la desviación estándar es igual a 1.

La siguiente gráfica muestra una distribución normal estándar:

Ejemplo de distribución normal estándar

Cómo convertir una distribución normal en una distribución normal estándar

Cualquier distribución normal se puede convertir en una distribución normal estándar convirtiendo los valores de los datos en puntuaciones z, utilizando la siguiente fórmula:

z = (x – μ) / σ

dónde:

  • x: valor de datos individuales
  • μ: Media de la distribución
  • σ: desviación estándar de la distribución

Por ejemplo, supongamos que tenemos el siguiente conjunto de datos con una media de 6 y una desviación estándar de 2,152:

Podemos convertir cada valor de datos individual en un puntaje z restando 6 de cada valor y dividiéndolo por 2.152:

Convertir normal a distribución normal estándar

La puntuación z nos dice cuántas desviaciones estándar se encuentra cada punto de datos de la media. Por ejemplo, el primer valor de datos de «3» se encuentra 1,39 desviaciones estándar por debajo de la media.

La media de esta distribución de puntuaciones z tiene una media de cero y una desviación estándar de uno.

Cómo utilizar la distribución normal estándar

Una distribución normal estándar tiene las siguientes propiedades:

  • Aproximadamente el 68% de los datos se encuentran dentro de una desviación estándar de la media
  • Aproximadamente el 95% de los datos se encuentran dentro de dos desviaciones estándar de la media.
  • Aproximadamente el 99,7% de los datos se encuentran dentro de tres desviaciones estándar de la media

Esto se conoce como la regla empírica y se utiliza para comprender la distribución de valores en un conjunto de datos.

Por ejemplo, suponga que la altura de las plantas en un determinado jardín se distribuye normalmente con una media de 47,4 pulgadas y una desviación estándar de 2,4 pulgadas.

Según la regla empírica, ¿qué porcentaje de plantas tienen menos de 54,6 pulgadas de altura?

La regla empírica establece que para un conjunto de datos dado con una distribución normal, el 99,7% de los valores de los datos se encuentran dentro de tres desviaciones estándar de la media. Esto significa que el 49,85% de los valores se encuentran entre la media y tres desviaciones estándar por encima de la media.

En este ejemplo, 54,6 se ubica tres desviaciones estándar por encima de la media. Como sabemos que el 50% de los valores de los datos caen por debajo de la media en una distribución normal, un total de 50% + 49,85% = 99,85% de los valores caen por debajo de 54,6.

Por lo tanto, el 99,85% de las plantas miden menos de 54,6 pulgadas de altura.

Recursos adicionales

Problemas de práctica de reglas
empíricas Calculadora de reglas empíricas
Cómo aplicar la regla empírica en Excel

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

A menudo, puede tener varios Pandas DataFrames que le gustaría escribir en varias hojas de Excel dentro del mismo libro…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!