Cómo calcular un error estándar de Bootstrap en R

Bootstrapping es un método que se puede utilizar para estimar el error estándar de una media.

El proceso básico para calcular un error estándar de arranque es el siguiente:

  • Tome k muestras repetidas con reemplazo de un conjunto de datos dado.
  • Para cada muestra, calcule el error estándar: s / √ n
  • Esto da como resultado k estimaciones diferentes para el error estándar. Para encontrar el error estándar de arranque, tome la media de los k errores estándar.

Los siguientes ejemplos explican dos métodos diferentes que se pueden usar para calcular un error estándar de arranque en R.

Método 1: usar el paquete de arranque

Una forma de calcular un error estándar de arranque en R es usar la función boot () de la biblioteca de arranque .

El siguiente código muestra cómo calcular un error estándar de arranque para un conjunto de datos dado en R:

#Haga que este 
conjunto de ejemplo sea reproducible . semilla (10)

#cargar biblioteca de
 biblioteca de arranque (arranque)

#definir conjunto de datos
 x <- c (12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define la función para calcular la media
 meanFunc <- function (x, i) {mean (x [i])}

#calcular el error estándar usando 100 muestras de
 arranque boot (x, meanFunc, 100)

Estadísticas de Bootstrap:
    sesgo original std. error
t1 * 21,5 0,254 2,379263

El valor «original» de 21,5 muestra la media del conjunto de datos original. El “std. error ”de 2,379263 muestra el error estándar de arranque de la media.

Tenga en cuenta que usamos 100 muestras bootstrap para estimar el error estándar de la media en este ejemplo, pero podríamos haber usado 1,000 o 10,000 o cualquier número de muestras bootstrap que quisiéramos.

Método 2: escriba su propia fórmula

Otra forma de calcular un error estándar de arranque es escribir nuestra propia función.

El siguiente código muestra cómo hacerlo:

#Haga que este 
conjunto de ejemplo sea reproducible . semilla (10)

#cargar biblioteca de
 biblioteca de arranque (arranque)

#definir conjunto de datos
 x <- c (12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean (replicate (100, sd ( sample (x, replace = T )) / sqrt ( length (x))))

[1] 2.497414

El error estándar de arranque resulta ser 2.497414 .

Observe que este error estándar es bastante similar al calculado en el ejemplo anterior.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Dos términos que los estudiantes a menudo confunden en estadística son valor p y alfa . Ambos términos se utilizan…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!