Contenido de este artículo
- 0
- 0
- 0
- 0
La prueba de Grubbs es una prueba estadística que se puede utilizar para identificar la presencia de un valor atípico en un conjunto de datos. Para usar esta prueba, el conjunto de datos que está analizando debe tener una distribución aproximadamente normal e, idealmente, debe tener al menos 7 observaciones.
Nota: Si sospecha que hay más de un valor atípico en el conjunto de datos, entonces debería utilizar la prueba de desviación studentizada extrema generalizada para los valores atípicos .
Si sospecha que el valor máximo en el conjunto de datos es un valor atípico, la estadística de prueba se calcula como:
G = (x máximo – x ) / s
Si sospecha que el valor mínimo en el conjunto de datos es un valor atípico, la estadística de prueba se calcula como:
G = ( x – x min ) / s
Y si no está seguro de si el valor máximo o el valor mínimo en el conjunto de datos es un valor atípico y desea realizar una prueba de dos caras, la estadística de prueba se calcula como:
G = máximo | x i – x | / s
donde x es la media de la muestra y s es la desviación estándar de la muestra.
El valor crítico para la prueba se calcula como:
G crítico = (n-1) t crítico / √ [n (n-2 + t 2 crítico )]
donde t crítico es el valor crítico de la distribución t con n-2 grados de libertad y el nivel de significancia es α / n para una prueba de una cola y α / (2n) para una prueba de dos colas.
Ejemplo: prueba de Grubbs en Excel
Determine si el valor 60 es un valor atípico en el siguiente conjunto de datos:
Paso 1: Primero, debemos asegurarnos de que los datos se distribuyan aproximadamente normalmente. Para hacerlo, podemos crear un histograma para verificar que la distribución tenga aproximadamente una forma de campana. La siguiente captura de pantalla muestra cómo crear un histograma en Excel usando el Paquete de herramientas de análisis de datos :
En el histograma, podemos ver que los datos se distribuyen aproximadamente normalmente. Esto significa que podemos seguir adelante y realizar la prueba de Grubbs.
Paso 2: A continuación, realizaremos la prueba de Grubbs para determinar si el valor 60 es realmente un valor atípico en el conjunto de datos. La captura de pantalla a continuación muestra las fórmulas que se utilizarán para realizar la prueba de Grubbs:
La estadística de prueba, G , en la celda D4 es 3.603219 .
El valor crítico, G crítico , en la celda D11 es 2.556581 . Dado que la estadística de prueba es mayor que el valor crítico, esto significa que el valor 60 es un valor atípico en este conjunto de datos.
Qué hacer si se identifica un valor atípico
Si la prueba de Grubbs identifica un valor atípico en su conjunto de datos, tiene algunas opciones:
- Verifique dos veces para asegurarse de que el valor no sea un error tipográfico o de entrada de datos. Ocasionalmente, los valores que aparecen como valores atípicos en los conjuntos de datos son simplemente errores tipográficos realizados por una persona al ingresar los datos. Regrese y verifique que el valor se haya ingresado correctamente antes de tomar más decisiones.
- Asigne un nuevo valor al valor atípico . Si el valor atípico resulta ser el resultado de un error tipográfico o de entrada de datos, puede decidir asignarle un nuevo valor, como la media o la mediana del conjunto de datos.
- Elimina el valor atípico.Si el valor es un valor atípico verdadero, puede optar por eliminarlo si tendrá un impacto significativo en su análisis general.
Independientemente de lo que decida hacer con el valor atípico, asegúrese de anotarlo cuando presente las conclusiones finales de su análisis.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: