Prueba Tau de Thompson modificada

Actualizado por ultima vez el 21 de agosto de 2021, por Luis Benites.

¿Qué es la prueba Tau de Thompson modificada?

La prueba modificada de Thompson Tau es una forma de encontrar valores atípicos en un conjunto de datos. El conjunto de datos debe ser una sola variable (por ejemplo, x 1 , x 2 ,…x n ). Se prueba un valor atípico potencial a la vez usando una versión de la prueba t . En términos generales, la prueba Tau elimina los valores atípicos a más de dos desviaciones estándar de la media .

Como la mayoría de las pruebas para valores atípicos, existe la posibilidad de que pueda eliminar buenos datos (especialmente si hay un grupo de valores atípicos), por lo que debe interpretar los resultados de la prueba con precaución.

Ejecución de la prueba

Para ejecutar la prueba, primero debe identificar un posible valor atípico.

Ejemplo de pregunta: ¿Alguno de los siguientes puntos es atípico? : 489, 490, 490, 491, 494, 499, 499, 500, 501 y 505.

Parte 1: identificar un posible valor atípico

Paso 1: Encuentre la media muestral . La media de este conjunto de datos es 495,8.

Paso 2: Resta la media del punto de datos más alto y más bajo para encontrar el valor absoluto de las diferencias. Como fórmula, eso es:
δ i = |x i – x̄|.
Asi que:

  • |489 – 495.8.| = 6,8
  • |505 – 495.8.| = 9,2

Se sospecha que el punto con la diferencia absoluta más alta (δ) es un valor atípico. Este es el que vas a probar. Para este ejemplo, eso es 9.2.

Parte 2: probar el punto de datos

Paso 1: Busque el tamaño de la muestra (n) en la siguiente tabla de Tau para obtener el valor de Tau (para conocer la fórmula detrás de los cálculos de la tabla, consulte la Fórmula de Tau a continuación):
Para un tamaño de muestra de 10, Tau es 1,7984.

Paso 2: Calcular la (s) desviación (es) estándar para la muestra. Para este conjunto de datos, s = 5,67.

Paso 3: Multiplique Tau (Paso 1) por s (Paso 2):
Tau * s = 1.7984 * 5.67 = 10.2

Paso 4: Compare la diferencia absoluta (δ) del valor atípico sospechoso (de la Parte 1) con Tau * s (Paso 3).
Si δ > Tau * s, el punto es un valor atípico.
9,2 no es mayor que 10,2, por lo que no es un valor atípico.

Repitiendo los pasos

En el ejemplo anterior, el punto con la diferencia absoluta más grande no era un valor atípico. Si el punto es un valor atípico, repita los pasos anteriores para el punto con la siguiente desviación más grande. Sin embargo, cuando repite los cálculos, debe eliminar el valor atípico que identificó antes de volver a calcular la media y encontrar la nueva Tau .

Tabla Tau

norte Tau norte Tau norte Tau
3 1.1511 21 1.8891 40 1.9240
4 1.4250 22 1.8926 42 1.9257
5 1.5712 23 1.8957 44 1.9273
6 1.6563 24 1.8985 46 1.9288
7 1.7110 25 1.9011 48 1.9301
8 1.7491 26 1.9035 50 1.9314
9 1.7770 27 1.9057 55 1.9340
10 1.7984 28 1.9078 60 1.9362
11 1.8153 29 1.9096 sesenta y cinco 1.9381
12 1.8290 30 1.9114 70 1.9397
13 1.8403 31 1.9130 80 1.9423
14 1.8498 32 1.9146 90 1.9443
15 1.8579 33 1.9160 100 1.9459
dieciséis 1.8649 34 1.9174 200 1.9530
17 1.8710 35 1.9186 500 1.9572
18 1.8764 36 1.9198 1000 1.9586
19 1.8811 37 1.9209 5000 1.9597
20 1.8853 38 1.9220 → ∞ 1.9600

fórmula tau


Si está utilizando la tabla, realmente no necesita la fórmula (a menos que esté calculando un tamaño de muestra específico que no figura en la lista). Tau se calcula a partir de los valores críticos T de la distribución T de Student, que identifican una región de rechazo. La fórmula es: Donde :

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es el sesgo de tendencia central? El sesgo de tendencia central (a veces llamado error de tendencia central) es…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!