Resistencia y medidas resistentes en estadística

Actualizado por ultima vez el 7 de abril de 2022, por Luis Benites.

¿Qué es la Resistencia?

Las estadísticas resistentes no cambian (o cambian en una pequeña cantidad) cuando se agregan valores atípicos a la mezcla. La resistencia no significa que no se mueva en absoluto (eso sería «inamovible» en su lugar). Significa que puede haber un pequeño movimiento en sus resultados, pero no mucho.

Cuando una estadística cambia debido a un punto de datos «falso», su resultado puede estar lejos del valor real que está tratando de estimar. Este sesgo se puede evitar si elimina los valores atípicos o utiliza factores de ponderación para minimizar el daño que causan.

Estadísticas resistentes:

centro de una distribucion

La mediana es un estadístico resistente.

Por otro lado, algunas estadísticas están fuertemente influenciadas por valores atípicos. Esas estadísticas son:

Resistencia vs Robustez

Según algunos autores (por ejemplo, David C. LeBlanc en Estadística: conceptos y aplicaciones para la ciencia, volumen 2 ), resistente y robusto significan lo mismo. Otros autores (por ejemplo, Wilks) afirman que, a veces, robustez y resistencia tienen significados diferentes: un método resistente no se ve muy afectado por los valores atípicos, mientras que un método robusto funciona bien en la mayoría de las circunstancias. Algunos estadísticos utilizan resistente para describir la inmovilidad del valor de los datos (por ejemplo, el rango), mientras que la robustez se utiliza para describir la inmovilidad de un modelo de probabilidad.

Los dos términos a menudo se confunden porque tienen un significado muy similar y no parece haber un consenso sobre cuáles son exactamente esos significados. Si solo está interesado en el sentido general de las palabras, probablemente pueda olvidarse de la semántica (¡esta no es una clase de inglés!) y recuerde que todas las estadísticas robustas y/o resistentes no se ven muy afectadas por los valores atípicos. Ambos son «buenas opciones» si está trabajando con puntos de datos extremos. Por otro lado, si se trata de una pregunta de tarea o un examen, probablemente querrá prestar mucha atención a la definición dada en su libro de texto en particular.

Referencias :
Wilks, D. (1995) Métodos estadísticos en ciencia atmosférica, una introducción. Serie Internacional de Geofísica, vol 59. Prensa Académica. San Diego, CA. págs. 21-27.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Y hat (escrito ŷ) es el valor pronosticado de y (la variable dependiente ) en una ecuación de regresión .…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!