Teorema del límite central: definición + ejemplos

El teorema del límite central establece que la distribución muestral de una media muestral es aproximadamente normal si el tamaño de la muestra es lo suficientemente grande, incluso si la distribución de la población no es normal .

El teorema del límite central también establece que la distribución muestral tendrá las siguientes propiedades:

1. La media de la distribución muestral será igual a la media de la distribución de la población:

x = μ

2. La varianza de la distribución muestral será igual a la varianza de la distribución poblacional dividida por el tamaño de la muestra:

s 2 = σ 2 / n

Ejemplos del teorema del límite central

Aquí hay algunos ejemplos para ilustrar el teorema del límite central en la práctica.

La distribución uniforme

Suponga que el ancho del caparazón de una tortuga sigue una distribución uniforme con un ancho mínimo de 2 pulgadas y un ancho máximo de 6 pulgadas. Es decir, si seleccionamos al azar una tortuga y medimos el ancho de su caparazón, es igualmente probable que tenga un ancho entre 2 y 6 pulgadas.

Si hiciéramos un histograma para representar la distribución de los anchos de caparazón de tortuga, se vería así:

Ejemplo de distribución uniforme del teorema del límite central
La media de una distribución uniforme es μ = (b + a) / 2 donde b es el valor más grande posible y a es el valor más pequeño posible. En este caso, es (6 + 2) / 2 = 4.

La varianza de una distribución uniforme es σ 2 = (BA) 2 / 12. En este caso, es (6-2) 2 /12 = 1,33

Tomando muestras aleatorias de 2 de la distribución uniforme

Ahora, imagina que tomamos una muestra aleatoria de 2 tortugas de esta población y medimos el ancho de cada caparazón de tortuga. Suponga que el caparazón de la primera tortuga tiene un ancho de 3 pulgadas y el segundo tiene un ancho de 6 pulgadas. El ancho medio de esta muestra de 2 tortugas es de 4,5 pulgadas.

Luego, imagina que tomamos otra muestra aleatoria de 2 tortugas de esta población y nuevamente medimos el ancho de cada caparazón de tortuga. Suponga que el caparazón de la primera tortuga tiene un ancho de 2.5 pulgadas y el segundo también tiene un ancho de 2.5 pulgadas. El ancho medio de esta muestra de 2 tortugas es de 2,5 pulgadas.

Imagina que seguimos tomando muestras aleatorias de 2 tortugas una y otra vez y seguimos encontrando el ancho medio del caparazón cada vez.

Si hiciéramos un histograma para representar el ancho medio del caparazón de todas estas muestras de 2 tortugas, se vería así:

Teorema del límite central para el tamaño de muestra 2 para distribución uniforme
Esto se conoce como distribución muestral para la media muestral porque muestra la distribución de las medias muestrales.

La media de esta distribución muestral es x = μ = 4

La varianza de esta distribución muestral es s 2 = σ 2 / n = 1.33 / 2 = .665

Tomando muestras aleatorias de 5 de la distribución uniforme

Ahora, imagine que repetimos el mismo experimento, pero esta vez tomamos muestras aleatorias de 5 tortugas una y otra vez y encontramos el ancho medio del caparazón cada vez.

Si hiciéramos un histograma para representar el ancho medio del caparazón de todas estas muestras de 5 tortugas, se vería así:

Teorema del límite central para la distribución uniforme del tamaño de la muestra 5
Observe cómo esta distribución tiene más forma de «campana» que se asemeja a la distribución normal . Esto se debe a que cuando tomamos muestras de 5, la varianza entre nuestras medias muestrales es mucho menor, por lo que es menos probable que obtengamos muestras donde la media es cercana a 2 pulgadas o cercana a 6 pulgadas y más probabilidades de obtener muestras donde la media está más cerca de la media real de la población de 4 pulgadas.

La media de esta distribución muestral es x = μ = 4

La varianza de esta distribución muestral es s 2 = σ 2 / n = 1.33 / 5 = .266

Tomando muestras aleatorias de 30 de la distribución uniforme

Ahora, imagine que repetimos el mismo experimento, pero esta vez tomamos muestras aleatorias de 30 tortugas una y otra vez y encontramos el ancho medio del caparazón cada vez.

Si hiciéramos un histograma para representar el ancho medio del caparazón de todas estas muestras de 30 tortugas, se vería así:

Teorema del límite central para el tamaño de muestra 30
Observe cómo esta distribución de muestreo tiene aún más forma de campana y es mucho más estrecha que las dos distribuciones anteriores.

La media de esta distribución muestral es x = μ = 4

La varianza de esta distribución muestral es s 2 = σ 2 / n = 1.33 / 30 = .044

La distribución chi-cuadrado

Suponga que el número de mascotas por familia en una ciudad determinada sigue una distribución de chi-cuadrado con tres grados de libertad. Si hiciéramos un histograma para representar la distribución de mascotas por familia, se vería así:

Teorema del límite central para la distribución de chi-cuadrado

La media de una distribución de chi-cuadrado es simplemente el número de grados de libertad (gl). En este caso, μ = 3 .

La varianza de una distribución de chi-cuadrado es 2 * gl. En este caso, σ 2 = 2 * 3 = 6 .

Tomando muestras aleatorias de 2

Imagine que tomamos una muestra aleatoria de 2 familias de esta población y contamos el número de mascotas en cada familia. Suponga que la primera familia tiene 4 mascotas y la segunda familia tiene 1 mascota. El número medio de mascotas para esta muestra de 2 familias es 2,5.

Luego, imagine que tomamos otra muestra aleatoria de 2 familias de esta población y nuevamente contamos el número de mascotas en cada familia. Suponga que la primera familia tiene 6 mascotas y la segunda familia tiene 4 mascotas. El número medio de mascotas para esta muestra de 2 familias es 5.

Imagina que seguimos tomando muestras aleatorias de 2 familias una y otra vez y seguimos encontrando el número medio de mascotas cada vez.

Si hiciéramos un histograma para representar el número medio de mascotas de todas estas muestras de 2 familias, se vería así:

Teorema del límite central con un tamaño de muestra de distribución de chi-cuadrado de 2

La media de esta distribución muestral es x = μ = 3

La varianza de esta distribución muestral es s 2 = σ 2 / n = 6/2 = 3

Tomando muestras aleatorias de 10

Ahora, imagine que repetimos el mismo experimento, pero esta vez tomamos muestras aleatorias de 10 familias una y otra vez y encontramos el número medio de mascotas por familia cada vez.

Si hiciéramos un histograma para representar el número medio de mascotas por familia en todas estas muestras de 10 familias, se vería así:

Teorema del límite central con distribución chi-cuadrado

La media de esta distribución muestral es x = μ = 3

La varianza de esta distribución muestral es s 2 = σ 2 / n = 6/10 = 0.6

Tomando muestras aleatorias de 30

Ahora, imagine que repetimos el mismo experimento, pero esta vez tomamos muestras aleatorias de 30 familias una y otra vez y encontramos el número medio de mascotas por familia cada vez.

Si hiciéramos un histograma para representar el número medio de mascotas por familia en todas estas muestras de 30 familias, se vería así:

Histograma del teorema del límite central con distribución de chi-cuadrado

La media de esta distribución muestral es x = μ = 3

La varianza de esta distribución muestral es s 2 = σ 2 / n = 6/30 = 0.2

Resumen

Aquí están las conclusiones clave de estos dos ejemplos:

  • La distribución muestral de una media muestral es aproximadamente normal si el tamaño de la muestra es lo suficientemente grande, incluso si la distribución de la población no es normal . En los dos ejemplos anteriores, ni la distribución uniforme ni la distribución de chi-cuadrado eran normales (no tenían forma de «campana» en absoluto), sin embargo, cuando tomamos un tamaño de muestra lo suficientemente grande, la distribución de la media de la muestra cambió fuera a ser normal.
  • Cuanto mayor sea el tamaño de la muestra, menor será la varianza de la media muestral.

Definición de «suficientemente grande»

Recuerde que el teorema del límite central establece que la distribución muestral de una media muestral es aproximadamente normal si el tamaño de la muestra es «suficientemente grande» , incluso si la distribución de la población no es normal.

No existe una definición exacta de cuán grande debe ser un tamaño de muestra para que se aplique el teorema del límite central, pero en general depende de la asimetría de la distribución de la población de la que proviene la muestra:

  • Si la distribución de la población es simétrica, a veces un tamaño de muestra tan pequeño como 15 es suficiente.
  • Si la distribución de la población está sesgada, generalmente se necesita un tamaño de muestra de al menos 30.
  • Si la distribución de la población es extremadamente sesgada, entonces puede ser necesario un tamaño de muestra de 40 o más.

Consulte este tutorial sobre la condición de muestra grande para obtener más información sobre este tema.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En cualquier experimento, hay dos variables principales: La variable independiente: la variable que un experimentador cambia o controla para que…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!