Aproximación binomial

Actualizado por ultima vez el 26 de mayo de 2022, por Luis Benites.

Anterior : El significado limitado de la significancia estadística

Aproximación binomial con la distribución Z

La distribución z es importante porque es la fuente última de muchas de las fórmulas utilizadas en estadística . Las distribuciones de muestreo para variables binomiales son distribuciones discretas (valores discretos como 0, .01, .02, …, 1 en el eje horizontal y frecuencias discretas en el eje vertical), pero la ecuación que veremos en un momento define una distribución continua (valores continuos en la recta numérica real tanto para el eje horizontal como para el vertical).

Transformemos una distribución binomial discreta a la escala de error estándar , y luego a la distribución normal estándar continua , que con frecuencia se denomina distribución z . Primero, en el eje horizontal simplemente restamos .5 de cada valor (para centrar la distribución en cero) y dividimos cada uno por el error estándar determinado usando la siguiente fórmula: Listo, obtenemos la Figura 8.2. A continuación, conectamos la parte superior de todas las barras para hacer una distribución continua y reemplazamos la escala de frecuencia en el eje vertical con una escala de probabilidad (más sobre esto a continuación). Voila, obtenemos la Figura 8.3, la famosa distribución z. La letra z denota la escala de error estándar.
transformar una distribución binomial discreta

fórmula de error estándar
transformación de la distribución binomial discreta
haciendo una distribución continua La escala en el eje vertical de la figura 8.3 ahora es probabilidad . La probabilidad es una escala continua que va de 0 a 1. Una probabilidad de 1 significa que siempre sucederá algo y una probabilidad de 0 significa que algo nunca sucederá. Una probabilidad de 0,5 significa que algo sucederá la mitad de las veces.

La distribución z es una distribución de probabilidad que es normal, estandarizada y continua. Es una de las distribuciones de probabilidad estandarizadas más importantes en estadística, y no solo para la aproximación binomial. Dado que es una distribución de probabilidad , el área completa bajo la curva es 1. Y, dado que es una función continua , las probabilidades para valores específicos, como la probabilidad de que z sea exactamente igual a 1,96, son cero. Siempre necesitamos referirnos a la probabilidad de rangos , como la probabilidad de que z sea menor que -1.96 o mayor que 1.96.

Las líneas límite para el intervalo del 95 % en la distribución normal estándar son siempre -1,96 y 1,96, como se muestra en la figura 8.4. El área bajo la curva dentro de las líneas límite es 0,95 y el área total fuera es 0,05, con 0,025 a cada lado. Hay dos fórmulas principales para usar para la distribución z y la escala de error estándar. En la siguiente fórmula, multiplicar +1.96 por el error estándar nos da el intervalo del 95% expresado en proporciones. Y en la siguiente fórmula, dividir la diferencia entre una proporción y un valor de proporción fijo (como .5) por el error estándar nos da la diferencia expresada en errores estándar. Muchas fórmulas estadísticas son, o involucran, tales conversiones de escala. Vayamos a través de ejemplos complementarios.
Aproximación binomial
Fórmula de aproximación binomial 1
Fórmula de aproximación binomial 2

Ejemplos de conversiones de escala

Como ejemplos del uso de cada una de las dos fórmulas para la aproximación binomial, con ilustraciones, digamos que tomamos una muestra aleatoria de 100 y obtuvimos una proporción muestral de 0,62. Nuestra hipótesis es que la proporción de la población es 0,50. El cálculo del intervalo del 95 % nos da la Figura 8.1, anotada a continuación, que muestra la distribución muestral junto con el intervalo de confianza de 0,4 a 0,6 y el valor de la proporción muestral de 0,62 superpuesto. Con la segunda fórmula, obtenemos la Figura 8.4, anotada a continuación, que muestra la distribución z junto con su intervalo de confianza estándar de -1,96 a 1,96 y el valor de error estándar de 2,40 superpuesto.
dos fórmulas para la aproximación binomial
dos fórmulas para la aproximación binomial 2
segunda fórmula para la aproximación binomial
valor de error estándar Esto ilustra la equivalencia entre los dos: el resultado estadístico está fuera del intervalo del 95% en la misma ubicación relativa. Obtienes el mismo resultado si

  1. Calcule los límites del intervalo de confianza en términos de proporciones usando el multiplicador +1.96 de la distribución z y luego vea si el valor de la proporción de la muestra está fuera del intervalo, o
  2. calcule el error estándar para su proporción de muestra y luego vea si el valor del error estándar está fuera del intervalo estándar de ±1.96 de la distribución z.

De aquí en adelante, usaremos ambos tipos de cálculo e ilustración. La distribución z se puede utilizar para la aproximación binomial. No es una coincidencia exacta, porque la binomial es una distribución discreta , pero, siempre que el tamaño de la muestra sea lo suficientemente grande, es una aproximación muy útil. (Hay algunas excepciones. Consulte Supuestos estadísticos ).

Nota : A continuación se muestra la ecuación de la propia curva de distribución z continua. No hay ninguna necesidad práctica de que conozcas esta ecuación. Lo pongo aquí para que puedan ver que efectivamente hay una ecuación que define la curva de distribución z. donde, x es el error estándar (el eje horizontal).
ecuación que define la curva de distribución z

Para aquellos de ustedes familiarizados con el cálculo , saben que pueden encontrar el área debajo de regiones específicas de la curva usando la integración para determinar la probabilidad de tener valores dentro de esas regiones.

Siguiente : Supuestos estadísticos

Autor : JE Kotteman.

Referencias

JE Kotteman. Análisis Estadístico Ilustrado – Fundamentos .

El contenido de este artículo se publica a través de Copyleft . Eres libre de copiar y distribuir el contenido de este artículo.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es la regresión de Poisson? La familia de distribuciones de Poisson. La regresión de Poisson se utiliza para modelar…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!