Cómo calcular un error estándar de Bootstrap en R

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Bootstrapping es un método que se puede utilizar para estimar el error estándar de una media.

El proceso básico para calcular un error estándar de arranque es el siguiente:

  • Tome k muestras repetidas con reemplazo de un conjunto de datos dado.
  • Para cada muestra, calcule el error estándar: s / √ n
  • Esto da como resultado k estimaciones diferentes para el error estándar. Para encontrar el error estándar de arranque, tome la media de los k errores estándar.

Los siguientes ejemplos explican dos métodos diferentes que se pueden usar para calcular un error estándar de arranque en R.

Método 1: usar el paquete de arranque

Una forma de calcular un error estándar de arranque en R es usar la función boot () de la biblioteca de arranque .

El siguiente código muestra cómo calcular un error estándar de arranque para un conjunto de datos dado en R:

#Haga que este 
conjunto de ejemplo sea reproducible . semilla (10)

#cargar biblioteca de
 biblioteca de arranque (arranque)

#definir conjunto de datos
 x <- c (12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define la función para calcular la media
 meanFunc <- function (x, i) {mean (x [i])}

#calcular el error estándar usando 100 muestras de
 arranque boot (x, meanFunc, 100)

Estadísticas de Bootstrap:
    sesgo original std. error
t1 * 21,5 0,254 2,379263

El valor «original» de 21,5 muestra la media del conjunto de datos original. El “std. error ”de 2,379263 muestra el error estándar de arranque de la media.

Tenga en cuenta que usamos 100 muestras bootstrap para estimar el error estándar de la media en este ejemplo, pero podríamos haber usado 1,000 o 10,000 o cualquier número de muestras bootstrap que quisiéramos.

Método 2: escriba su propia fórmula

Otra forma de calcular un error estándar de arranque es escribir nuestra propia función.

El siguiente código muestra cómo hacerlo:

#Haga que este 
conjunto de ejemplo sea reproducible . semilla (10)

#cargar biblioteca de
 biblioteca de arranque (arranque)

#definir conjunto de datos
 x <- c (12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean (replicate (100, sd ( sample (x, replace = T )) / sqrt ( length (x))))

[1] 2.497414

El error estándar de arranque resulta ser 2.497414 .

Observe que este error estándar es bastante similar al calculado en el ejemplo anterior.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Dos términos que los estudiantes a menudo confunden en estadística son valor p y alfa . Ambos términos se utilizan…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!