Cómo encontrar intervalos de confianza en R (con ejemplos)

Un intervalo de confianza es un rango de valores que probablemente contenga un parámetro de población con un cierto nivel de confianza.

Se calcula utilizando la siguiente fórmula general:

Intervalo de confianza = (estimación puntual) +/- (valor crítico) * (error estándar)

Esta fórmula crea un intervalo con un límite inferior y un límite superior, que probablemente contiene un parámetro de población con un cierto nivel de confianza:

Intervalo de confianza = [límite inferior, límite superior]

Este tutorial explica cómo calcular los siguientes intervalos de confianza en R:

1. Intervalo de confianza para una media

2. Intervalo de confianza para una diferencia de medias

3. Intervalo de confianza para una proporción

4. Intervalo de confianza para una diferencia de proporciones

¡Saltemos!

Ejemplo 1: intervalo de confianza para una media

Usamos la siguiente fórmula para calcular un intervalo de confianza para una media :

Intervalo de confianza = x +/- t n-1, 1-α / 2 * (s / √n)

dónde:

  • x : media muestral
  • t: el valor t crítico
  • s: desviación estándar de la muestra
  • n: tamaño de la muestra

Ejemplo: supongamos que recolectamos una muestra aleatoria de tortugas con la siguiente información:

  • Tamaño de muestra n = 25
  • Peso medio de la muestra x = 300
  • Desviación estándar muestral s = 18,5

El siguiente código muestra cómo calcular un intervalo de confianza del 95% para el peso medio real de la población de tortugas:

# tamaño de la muestra de entrada, media de la muestra y desviación estándar de la muestra
 n <- 25
xbar <- 300 
s <- 18,5

# calcular el margen del margen de error
 <- qt (0.975, df = n-1) * s / sqrt (n)

# calcular los límites inferior y superior del intervalo de confianza
 bajo <- xbar - margen
bajo

[1] 292.3636

alto <- xbar + margen
elevado

[1] 307.6364

El intervalo de confianza del 95% para el peso medio de la población real de tortugas es [292,36, 307,64] .

Ejemplo 2: intervalo de confianza para una diferencia de medias

Usamos la siguiente fórmula para calcular un intervalo de confianza para una diferencia en las medias poblacionales :

Intervalo de confianza = ( x 1x 2 ) +/- t * √ ((s p 2 / n 1 ) + (s p 2 / n 2 ))

dónde:

  • x 1 , x 2 : media de la muestra 1, media de la muestra 2
  • t: el valor t-crítico basado en el nivel de confianza y (n 1 + n 2 -2) grados de libertad
  • s p 2 : varianza combinada, calculada como ((n 1 -1) s 1 2 + (n 2 -1) s 2 2 ) / (n 1 + n 2 -2)
  • t: el valor t crítico
  • n 1 , n 2 : tamaño de la muestra 1, tamaño de la muestra 2

Ejemplo: Suponga que queremos estimar la diferencia en el peso medio entre dos especies diferentes de tortugas, por lo que salimos y recolectamos una muestra aleatoria de 15 tortugas de cada población. Aquí están los datos resumidos de cada muestra:

Muestra 1:

  • x 1 = 310
  • s 1 = 18,5
  • n 1 = 15

Muestra 2:

  • x 2 = 300
  • s 2 = 16,4
  • n 2 = 15

El siguiente código muestra cómo calcular un intervalo de confianza del 95% para la verdadera diferencia en las medias poblacionales:

# tamaño de la muestra de entrada, media de la muestra y desviación estándar de la muestra
 n1 <- 15
xbar1 <- 310 
s1 <- 18,5

n2 <- 15
xbar2 <- 300
s2 <- 16,4

# calcular la varianza combinada
 sp = ((n1-1) * s1 ^ 2 + (n2-1) * s2 ^ 2) / (n1 + n2-2)

#calcular margen de error
margen <- qt (0.975, gl = n1 + n2-1) * sqrt (sp / n1 + sp / n2)

# calcular los límites inferior y superior del intervalo de confianza
 bajo <- (xbar1-xbar2) - margen
bajo

[1] -3.055445

alto <- (xbar1-xbar2) + margen
elevado

[1] 23.05544

El intervalo de confianza del 95% para la verdadera diferencia en las medias poblacionales es [-3,06, 23,06] .

Ejemplo 3: intervalo de confianza para una proporción

Usamos la siguiente fórmula para calcular un intervalo de confianza para una proporción :

Intervalo de confianza = p +/- z * (√ p (1-p) / n )

dónde:

  • p: proporción de la muestra
  • z: el valor z elegido
  • n: tamaño de la muestra

Ejemplo: suponga que queremos estimar la proporción de residentes en un condado que están a favor de una determinada ley. Seleccionamos una muestra aleatoria de 100 residentes y les preguntamos sobre su postura sobre la ley. Aquí están los resultados:

  • Tamaño de muestra n = 100
  • Proporción a favor de la ley p = 0,56

El siguiente código muestra cómo calcular un intervalo de confianza del 95% para la proporción real de residentes en todo el condado que están a favor de la ley:

# tamaño de muestra de entrada y proporción de muestra
 n <- 100
p <- .56

#calcular margen de error
margen <- qnorm (0.975) * sqrt (p * (1-p) / n)

# calcular los límites inferior y superior del intervalo de confianza
 bajo <- p - margen
bajo

[1] 0,4627099

alto <- p + margen
elevado

[1] 0,6572901

El intervalo de confianza del 95% para la proporción real de residentes en todo el condado que están a favor de la ley es [.463, .657] .

Ejemplo 4: intervalo de confianza para una diferencia de proporciones

Usamos la siguiente fórmula para calcular un intervalo de confianza para una diferencia en proporciones :

Intervalo de confianza = (p 1 –p 2 ) +/- z * √ (p 1 (1-p 1 ) / n 1 + p 2 (1-p 2 ) / n 2 )

dónde:

  • p 1 , p 2 : proporción de muestra 1, proporción de muestra 2
  • z: el valor crítico de z basado en el nivel de confianza
  • n 1 , n 2 : tamaño de la muestra 1, tamaño de la muestra 2

Ejemplo: Suponga que queremos estimar la diferencia en la proporción de residentes que apoyan una determinada ley en el condado A en comparación con la proporción que apoya la ley en el condado B. Aquí están los datos resumidos para cada muestra:

Muestra 1:

  • n 1 = 100
  • p 1 = 0,62 (es decir, 62 de cada 100 residentes apoyan la ley)

Muestra 2:

  • n 2 = 100
  • p 2 = 0.46 (es decir, 46 de cada 100 residentes apoyan la ley)

El siguiente código muestra cómo calcular un intervalo de confianza del 95% para la verdadera diferencia en la proporción de residentes que apoyan la ley entre los condados:

# tamaños de muestra de entrada y proporciones de muestra
 n1 <- 100
p1 <- .62

n2 <- 100
p2 <- .46

#calcular margen de error
margen <- qnorm (0.975) * sqrt (p1 * (1-p1) / n1 + p2 * (1-p2) / n2)

# calcular los límites inferior y superior del intervalo de confianza
 bajo <- (p1-p2) - margen
bajo

[1] 0.02364509


alto <- (p1-p2) + margen
elevado

[1] 0,2963549

El intervalo de confianza del 95% para la verdadera diferencia en la proporción de residentes que apoyan la ley entre los condados es [.024, .296] .

Puede encontrar más tutoriales de R aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En estadística, el error absoluto medio (MAE) es una forma de medir la precisión de un modelo dado. Se calcula…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!