Supuestos estadísticos

Actualizado por ultima vez el 16 de septiembre de 2021, por Luis Benites.

Anterior : Aproximación binomial

Casi todas las pruebas estadísticas hacen suposiciones estadísticas específicas sobre los datos que se analizan. Si no se cumplen los supuestos, la prueba dará resultados cuestionables y no se debe utilizar. Las suposiciones a menudo están relacionadas con los tamaños de las muestras y la naturaleza de las distribuciones de los valores de los datos en sí. Este artículo analiza estos tipos de suposiciones para binomios para darle una idea de lo que son y por qué son importantes.

Abordar supuestos estadísticos

En la práctica, los supuestos de cualquier método de análisis estadístico dado deben evaluarse cuidadosamente antes de su uso. Cuando no se puede justificar el uso de un método dado, entonces se debe elegir un método menos restrictivo, uno que haga menos suposiciones o diferentes, o los datos deben ser «masajeados» de manera transparente de una manera profesionalmente apropiada para que se adhieran mejor a las suposiciones de un método. Un profesional informará todo lo que se hizo como parte de cualquier análisis.

Para los datos binomiales, las dos suposiciones más importantes tienen que ver con el tamaño de la muestra y los valores de las proporciones extremas. Las distribuciones de muestreo binomial se pueden aproximar con la distribución z, pero solo cuando los tamaños de muestra son lo suficientemente grandes .

supuestos estadísticos

La distribución z.

Además, los valores de proporción no pueden estar demasiado cerca de cero o uno. Estas estipulaciones son críticas porque las fórmulas que hemos estado usando asumen que la distribución z es una aproximación adecuada.

Veamos estos temas con más detalle. Si el tamaño de la muestra es demasiado pequeño, la distribución z es una mala aproximación a la distribución binomial. Por ejemplo, si nuestro tamaño de muestra es solo 2, entonces la distribución z es obviamente una mala aproximación, como lo muestra la distribución de muestreo en esta imagen: La aproximación es tan mala que el intervalo de confianza del 95% calculado a través de la fórmula, que se muestra a continuación, va fuera de los límites en ambos lados con líneas de límite de proporción de -.2 y 1.2. ¡Estos son valores inviables para proporciones! Cuando p está demasiado cerca de cero o uno, la distribución binomial se distorsionará de la forma de campana normal . En tales casos, la distribución z también será una mala aproximación.
supuestos distribución z y aproximaciones
Supuestos estadísticos del intervalo de confianza del 95 %

La siguiente figura muestra que la distribución de muestreo para p de 0.9 con un tamaño de muestra de 30 está distorsionada de la forma de campana normal. El intervalo de confianza del 95 % calculado a través de la fórmula que se muestra a continuación tiene el valor de la línea límite de proporción extrema de 1 en el lado derecho (antes del redondeo, en realidad se calcula ligeramente mayor que 1).
supuestos muestreo distribución distorsionada
fórmula de intervalo de confianza calculado para supuestos estadísticos

Cumplir con los supuestos estadísticos con una regla empírica

¿Cómo podemos determinar si la distribución z será una buena aproximación para una distribución de muestreo binomial dada? Tanto p como n influyen en la naturaleza de la distribución muestral. Por lo tanto, los valores de n y p deben considerarse juntos. Una regla general de uso común para el tamaño de muestra mínimo, n, necesario para cualquier proporción dada, p, es asegurarse de que n sea lo suficientemente grande como para que
n * p > 10 y n ∗ (1 − p) > 10
. 9.1 (la primera distribución que se muestra arriba), al usar esta regla general para p de 0.5 podemos determinar que n de 2 es demasiado pequeño porque 2 * .5 solo es igual a 1. Por otro lado, con n de 20 obtener 20 * (.5) que es igual a 10.

La siguiente figura ilustra que con un tamaño de muestra de 20, la distribución de muestreo se ha llenado y reducido lo suficiente como para alcanzar una forma normal. El intervalo de confianza del 95 % calculado con la fórmula que se muestra a continuación parece ser exacto a la luz de la figura 9.3. Para la Figura 9.2 anterior, al usar esta regla general de supuestos estadísticos para p de 0.9, podemos determinar que n de 30 es demasiado pequeño porque 30*(1-0.9) solo es igual a 3. Por otro lado, con n de 100 obtenemos 100 * (1 – 0,9) que es igual a 10. La Figura 9.4 ilustra que con un tamaño de muestra de 100, la distribución de muestreo se ha reducido lo suficiente como para alcanzar una forma normal. Y el intervalo de confianza del 95% calculado con la fórmula, que se muestra a continuación, ahora parece ser exacto a la luz de la Figura 9.4.
distribución de muestreo en forma de campana
fórmula del intervalo de confianza
distribución de forma normal

intervalo de confianza del 95% Entonces, en resumen, la distribución z se aproxima a la distribución binomial, y los tamaños de muestra deben ser adecuados para que las fórmulas funcionen correctamente, y p no puede estar demasiado cerca de cero o uno. Con tamaños de muestra que son demasiado pequeños y p que están demasiado cerca de cero o uno, se pueden usar métodos alternativos llamados exactos.

Para ver más ejemplos, consulte: Aproximación normal a la binomial.

Puede encontrar muchos más artículos en el sitio que abordan suposiciones estadísticas para pruebas y procedimientos específicos, que incluyen:

Siguiente : Analizando la diferencia entre dos grupos usando proporciones binomiales

Autor : JE Kotteman.

Referencias

JE Kotteman. Análisis Estadístico Ilustrado – Fundamentos .

El contenido de este artículo ( Supuestos estadísticos ) se publica a través de Copyleft . Eres libre de copiar y distribuir el contenido de este artículo.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Los errores están directamente relacionados con el método de medición o cálculo. En general, el error verdadero es la diferencia…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!