Distribución normal frente a distribución t: ¿Cuál es la diferencia?

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

La distribución normal es la distribución más utilizada en todas las estadísticas y es conocida por ser simétrica y con forma de campana.

Una distribución estrechamente relacionada es la distribución t , que también es simétrica y con forma de campana, pero tiene “colas” más pesadas que la distribución normal.

Es decir, más valores en la distribución se ubican en los extremos de la cola que en el centro en comparación con la distribución normal:

Distribución normal frente a distribución t

En la jerga estadística, usamos una métrica llamada curtosis para medir qué tan “pesada” es una distribución. Por lo tanto, diríamos que la curtosis de una distribución t es mayor que una distribución normal.

En la práctica, usamos la distribución t con mayor frecuencia cuando realizamos pruebas de hipótesis o construimos intervalos de confianza .

Por ejemplo, la fórmula para calcular un intervalo de confianza para una media poblacional es la siguiente:

Intervalo de confianza = x +/- t 1-α / 2, n-1 * (s / √ n )

dónde:

  • x : media muestral
  • t: el valor t crítico, basado en el nivel de significancia α y el tamaño de la muestra n
  • s: desviación estándar de la muestra
  • n: tamaño de la muestra

En esta fórmula, usamos el valor crítico de la tabla t en lugar del valor crítico de la tabla z cuando se cumple una de las siguientes condiciones:

  • No conocemos la desviación estándar de la población.
  • El tamaño de la muestra es menor o igual a 30.

El siguiente diagrama de flujo proporciona una forma útil de saber si debe utilizar el valor crítico de la tabla t o la tabla z:

Tabla Z vs tabla t

La principal diferencia entre usar la distribución t en comparación con la distribución normal al construir intervalos de confianza es que los valores críticos de la distribución t serán mayores, lo que conduce a intervalos de confianza más amplios .

Por ejemplo, supongamos que nos gustaría construir un intervalo de confianza del 95% para el peso medio de alguna población de tortugas, de modo que salgamos y recolectemos una muestra aleatoria de tortugas con la siguiente información:

  • Tamaño de muestra n = 25
  • Peso medio de la muestra x = 300
  • Desviación estándar muestral s = 18,5

El valor crítico z para un nivel de confianza del 95% es 1,96 mientras que un valor crítico t para un intervalo de confianza del 95% con gl = 25-1 = 24 grados de libertad es 2,0639 .

Por lo tanto, un intervalo de confianza del 95% para la media de la población que utiliza un valor crítico z es:

IC del 95% = 300 +/- 1,96 * (18,5 / √ 25 ) = [292,75, 307,25]

Mientras que un intervalo de confianza del 95% para la media de la población que utiliza un valor t crítico es:

IC del 95% = 300 +/- 2,0639 * (18,5 / √25) = [292,36, 307,64]

Observe que el intervalo de confianza con el valor t crítico es más amplio.

La idea aquí es que cuando tenemos tamaños de muestra pequeños, tenemos menos certeza acerca de la verdadera media de la población, por lo que se utiliza la distribución t para producir intervalos de confianza más amplios que tienen una mayor probabilidad de contener la verdadera media de la población.

Visualización de grados de libertad para la distribución t

Vale la pena señalar que a medida que aumentan los grados de libertad, la distribución t se acerca a la distribución normal.

Para ilustrar esto, considere el siguiente gráfico que muestra la forma de la distribución t con los siguientes grados de libertad:

  • gl = 3
  • gl = 10
  • gl = 30

Gráficas de distribución normal frente a t

Más allá de los 30 grados de libertad, la distribución t y la distribución normal se vuelven tan similares que las diferencias entre el uso de un valor t crítico frente a un valor z crítico en las fórmulas se vuelven insignificantes.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Un error estándar de medición , a menudo denominado SE m , estima la variación en torno a una puntuación…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!