Cómo calcular los residuos estudentizados en R

Un residuo estudentizado es simplemente un residuo dividido por su desviación estándar estimada.

En la práctica, normalmente decimos que cualquier observación en un conjunto de datos que tenga un residuo estudentizado mayor que un valor absoluto de 3 es un valor atípico.

Podemos obtener rápidamente los residuales studentizados de cualquier modelo de regresión en R usando la función studres () del paquete MASS, que usa la siguiente sintaxis:

studres (modelo)

donde modelo representa cualquier modelo lineal.

Ejemplo: cálculo de residuos estudentizados en R

Supongamos que construimos el siguiente modelo de regresión lineal simple en R, utilizando el conjunto de datos integrado de mtcars :

#build modelo de regresión lineal simple
modelo <- lm (mpg ~ disp, datos = mtcars)

Podemos usar la función studres () del paquete MASS para calcular los residuales studentizados para cada observación en el conjunto de datos:

biblioteca (MASA)

#calcular residuales estudentizados
stud_resids <- studres (modelo)

#ver los primeros tres residuales estudentizados
cabeza (stud_resids, 3)

    Mazda RX4 Mazda RX4 Wag Datsun 710 
   -0,6236250 -0,6236250 -0,7405315 

También podemos crear una gráfica rápida de los valores de la variable predictora frente a los residuos estudentizados correspondientes:

#plot predictor variable vs plotter de residuos
 estudentizados (mtcars $ disp, stud_resids, ylab = ' Residuales estudentizados ', xlab = ' Desplazamiento ')

#add línea horizontal en 0
 abline (0, 0)

Residuos estudentizados en R

En el gráfico podemos ver que ninguna de las observaciones tiene un residuo estudentizado con un valor absoluto mayor que 3, por lo que no hay valores atípicos claros en el conjunto de datos.

También podemos agregar los residuales estudentizados de cada observación nuevamente en el conjunto de datos original si quisiéramos:

#add residuos studentizados al conjunto de datos original
 final_data <- cbind (mtcars [c (' mpg ', ' disp ')], stud_resids)

#ver el encabezado del conjunto de datos final
 (final_data)

                   mpg disp stud_resids
Mazda RX4 21,0 160 -0,6236250
Mazda RX4 Wag 21,0 160 -0,6236250
Datsun 710 22,8 108 -0,7405315
Hornet 4 Drive 21,4 258 0,7556078
Hornet Sportabout 18.7 360 1.2658336
Valiente 18.1 225 -0.6896297

Luego, podemos ordenar cada observación de mayor a menor de acuerdo con su residuo estudentizado para tener una idea de qué observaciones están más cerca de ser valores atípicos:

#ordenar residuos studentizados descendentes
 final_data [ order (-stud_resids),]

                     mpg disp stud_resids
Toyota Corolla 33,9 71,1 2,52397102
Pontiac Firebird 19,2 400,0 2,06825391
Fiat 128 32,4 78,7 2,03684699
Lotus Europa 30,4 95,1 1,53905536
Honda Cívico 30,4 75,7 1,27099586
Hornet Sportabout 18.7 360.0 1.26583364
Chrysler Imperial 14,7 440,0 1,06486066
Hornet 4 Drive 21,4 258,0 0,75560776
Porsche 914-2 26,0 120,3 0,42424678
Fiat X1-9 27,3 79,0 0,30183728
Merc 240D 24,4 146,7 0,26235893
Ford Pantera L 15,8 351,0 0,20825609
Cadillac Fleetwood 10,4 472,0 0,08338531
Lincoln Continental 10,4 460,0 -0,07863385
Duster 360 14,3 360,0 -0,14476167
Merc 450SL 17,3 275,8 -0,28759769
Dodge Challenger 15,5 318,0 -0,30826585
Merc 230 22,8 140,8 -0,30945955
Merc 450SE 16,4 275,8 -0,56742476
Jabalina AMC 15,2 304,0 -0,58138205
Camaro Z28 13,3 350,0 -0,58848471
Mazda RX4 Wag 21,0 160,0 -0,62362497
Mazda RX4 21,0 160,0 -0,62362497
Maserati Bora 15.0 301.0 -0.68315010
Valiente 18.1 225.0 -0.68962974
Datsun 710 22,8 108,0 -0,74053152
Merc 450SLC 15,2 275,8 -0,94814699
Toyota Corona 21,5 120,1 -0,99751166
Volvo 142E 21,4 121,0 -1,01790487
Merc 280 19,2 167,6 -1,09979261
Ferrari Dino 19,7 145,0 -1,24732999
Merc 280C 17,8 167,6 -1,57258064

Recursos adicionales

Cómo realizar una regresión lineal simple en R
Cómo realizar una regresión lineal múltiple en R
Cómo crear una gráfica residual en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La regresión de crestas es un método que podemos utilizar para ajustar un modelo de regresión cuando la multicolinealidad está…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!