Cómo trazar un intervalo de confianza en R

Un intervalo de confianza es un rango de valores que probablemente contenga un parámetro de población con un cierto nivel de confianza.

Este tutorial explica cómo trazar un intervalo de confianza para un conjunto de datos en R.

Ejemplo: trazar un intervalo de confianza en R

Supongamos que tenemos el siguiente conjunto de datos en R con 100 filas y 2 columnas:

#Haga que este ejemplo sea reproducible
set.seed (0)

#create conjunto de datos
x <- normal (100)
y <- x * 2 + rnorm (100)
df <- data.frame (x = x, y = y)

#ver las primeras seis filas del conjunto de datos
cabeza (df)

           xy
1 1.2629543 3.3077678
2 -0,3262334 -1,4292433
3 1.3297993 2.0436086
4 1,2724293 2,5914389
5 0,4146414 -0,3011029
6 -1,5399500 -2,5031813

Para crear un gráfico de la relación entre xey, primero podemos ajustar un modelo de regresión lineal:

modelo <- lm (y ~ x, datos = df)

A continuación, podemos crear una gráfica de la línea de regresión lineal estimada usando la función abline () y la función lines () para crear las bandas de confianza reales:

#obtener valores de y predichos usando la ecuación de regresión
newx <- seq (min (df $ x), max (df $ x), length.out = 100)
preds <- predecir (modelo, newdata = data.frame (x = newx), intervalo = 'confianza')

# crear una gráfica de x vs. y, pero no mostrar puntos individuales (tipo = 'n') 
plot (y ~ x, data = df, type = 'n')

#add línea de regresión ajustada
abline (modelo)

#add líneas discontinuas para las líneas de las bandas de confianza
 (newx, preds [, 3], lty = 'dashed', col = 'blue')
líneas (newx, precede [, 2], lty = 'guiones', col = 'azul')

Grafique un intervalo de confianza en R

La línea negra muestra la línea de regresión lineal ajustada, mientras que las dos líneas azules discontinuas muestran los intervalos de confianza.

Si lo desea, también puede completar el área entre las líneas del intervalo de confianza y la línea de regresión lineal estimada utilizando el siguiente código:

#crea una gráfica de x vs. y
plot (y ~ x, data = df, type = 'n')

# rellene el área entre la línea de regresión y el intervalo de confianza
polígono (c (rev (newx), newx), c (rev (antecede [, 3]), antecede [, 2]), col = 'gris', borde = NA)

#add línea de regresión ajustada
abline (modelo)

#add líneas discontinuas para las líneas de las bandas de confianza
 (newx, preds [, 3], lty = 'dashed', col = 'blue')
líneas (newx, precede [, 2], lty = 'guiones', col = 'azul')

Gráfico de intervalo de confianza en R

Aquí está el código completo de principio a fin:

#Haga que este ejemplo sea reproducible
 set.seed (0)

#create conjunto de datos
x <- rnorm (100) 
y <- x * 2 + rnorm (100) 
df <- data.frame (x = x, y = y)

#fit modelo de regresión lineal
modelo <- lm (y ~ x, datos = df) 

#obtener valores de y predichos usando la ecuación de regresión
newx <- seq (min (df $ x), max (df $ x), length.out = 100) 
preds <- predict (model, newdata = data.frame (x = newx), interval = 'confianza')

#crea una gráfica de x vs. y
plot (y ~ x, data = df, type = 'n')

# rellene el área entre la línea de regresión y el intervalo de confianza
polígono (c (rev (newx), newx), c (rev (antecede [, 3]), antecede [, 2]), col = 'gris', borde = NA)

#add línea de regresión ajustada
abline (modelo)

#add líneas discontinuas para las líneas de las bandas de confianza
 (newx, preds [, 3], lty = 'dashed', col = 'blue')
líneas (newx, precede [, 2], lty = 'guiones', col = 'azul')

Recursos adicionales

¿Qué son los intervalos de confianza?
Cómo usar la función abline () en R para agregar líneas rectas a los gráficos

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Ocasionalmente, es posible que desee crear un DataFrame de pandas a partir de una matriz NumPy. Afortunadamente, esto es fácil…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!