Actualizado por ultima vez el 2 de enero de 2022, por Luis Benites.
¿Qué es la prueba de Grubbs para valores atípicos?
La prueba de Grubbs se usa para encontrar un solo valor atípico en un conjunto de datos normalmente distribuido . La prueba encuentra si un valor mínimo o un valor máximo es un valor atípico.
Precauciones :
- La prueba solo se usa para encontrar un solo valor atípico en datos normalmente distribuidos (excluyendo el posible valor atípico). Si cree que su conjunto de datos tiene más de un valor atípico, utilice la prueba de desviación estudiantil extrema generalizada o la prueba de Tietjen-Moore .
- El uso de esta prueba en distribuciones no normales dará resultados falsos.
Ejecute una prueba de normalidad (como la prueba de Shapiro-Wilk ) antes de ejecutar la prueba de Grubbs. Si encuentra que su conjunto de datos no se distribuye normalmente, intente eliminar el posible valor atípico del conjunto de datos y ejecute la prueba de normalidad nuevamente. Si sus datos aún no son normales, no ejecute esta prueba.
Ejecución de la prueba de Grubbs
La prueba es engañosamente simple de ejecutar. Comprueba los valores atípicos buscando el máximo de las diferencias absolutas entre los valores y la media . Básicamente, los pasos son:
- Encuentre la estadística de prueba G.
- Encuentre el valor crítico de G.
- Compare el estadístico de prueba con el valor crítico de G.
- Rechace el punto como un valor atípico si la estadística de prueba es mayor que el valor crítico.
Las fórmulas utilizadas serán ligeramente diferentes, dependiendo de si desea verificar un valor atípico en cualquiera de los extremos de los datos (una prueba de una cola) o en ambos extremos al mismo tiempo (una prueba de dos colas). Para simplificar, recomendaría ejecutar una prueba de una cola para comenzar, ya que es una ecuación más fácil de trabajar a mano y simplifica la decisión de rechazar (o mantener) un solo punto mínimo o máximo.
1. Encuentre la estadística de prueba G
Paso 1: ordene los puntos de datos de menor a mayor.
Paso 2: encuentre la media (x̄) y la desviación estándar del conjunto de datos.
Paso 3: Calcule el estadístico de prueba G usando una de las siguientes ecuaciones:
El estadístico de prueba de Grubbs para una prueba de dos colas es: Donde: ȳ es la media de la muestra , s = desviación estándar de la muestra .
Una prueba de cola izquierda utiliza la estadística de prueba: Donde Y min es el valor mínimo.
Para una prueba de cola derecha , use: Donde Y max es el valor máximo.
2. Encuentre el valor crítico de G.
Existen varias tablas para encontrar el valor crítico para la prueba de Grubbs. La siguiente es una tabla parcial para varios valores críticos de G y niveles alfa . Puedes encontrar la tabla completa aquí . Cuando busque tablas para los valores críticos de G, asegúrese de estar usando el correcto (es decir, una o dos pruebas de una cola). Manualmente, puede encontrar el valor crítico de G con una fórmula. Donde: t α/(2N),N−2 es el valor crítico superior de una distribución t con N-2 grados de libertad .
Para la prueba de una cola, reemplace α/(2N) con α/N.
Aceptar o rechazar el valor atípico
Compare su estadística de prueba G con el valor crítico
G : prueba G < G crítico : mantenga el punto en el conjunto de datos; no es un caso atípico . Prueba
G > G crítica : rechazar el punto como atípico.