Criterio de Chauvenet

Actualizado por ultima vez el 4 de octubre de 2021, por Luis Benites.

¿Qué es el Criterio de Chauvenet?

El criterio de Chauvenet es una forma de identificar valores atípicos . El método funciona creando una banda aceptable de datos alrededor de la media, especificando que se debe eliminar cualquier valor que quede fuera de esa banda. La fórmula para calcular la banda es: Donde n es el tamaño de la muestra. Las probabilidades de distribución normal se pueden usar para relacionar la fórmula con una desviación máxima de la media: τ = |X i – x̄|/ s . Esta fórmula es un poco más intuitiva de usar.
criterio de chauvenet

  • El procedimiento solo debe ejecutarse una vez en un conjunto de datos. Algunos autores abogan por dos carreras; los valores atípicos que se revelan en la segunda ejecución se denominan valores atípicos protegidos . Nota : otros autores dicen que nunca elimine los valores atípicos, por lo que este es un juicio basado en sus datos.
  • El procedimiento asume que sus datos se distribuyen normalmente .

Ejecutando Chauvenet’s

Probablemente querrá realizar estos cálculos en una hoja de cálculo, porque los cálculos pueden volverse numerosos si tiene múltiples valores atípicos potenciales (vea el Paso 3).

Para el siguiente conjunto de números, identifique cualquier valor atípico: 47, 50, 53, 55, 55, 56, 57, 57, 58, 58, 58, 58, 60, 60, 60, 61, 61, 61, 61, 61 , 61, 62, 62, 62, 63, 63, 64, 67, 68, 72.

Paso 1: Calcular la media muestral, x̄. La media muestral es 59,7.

Paso 2: encuentre la desviación estándar de la muestra, s. La desviación estándar de la muestra es 4.998.

Paso 3: Use la siguiente fórmula para encontrar la desviación estandarizada de la media para todos los valores atípicos sospechosos, valores de datos «i».
τ = |X i – x̄|/ s
Tenemos treinta elementos en el conjunto, por lo que querrá ejecutar la fórmula veinte veces (una para cada punto de datos, i). En aras de la brevedad, solo voy a mostrar dos de los cálculos de puntos de datos:
47: |47 – 59,7| / 4,998 = 2,541
67: |67 – 59,7| / 4,998 = 1,461

Paso 4: Compare los valores que obtuvo en el Paso 4 con una tabla de valores de criterio de Chauvenet (vea la siguiente sección) para ver si puede rechazar cada punto de datos. Para n=30, la tabla nos dice que la banda debe terminar en 2,394 desviaciones estándar.
47 tiene 2,541 desviaciones estándar y es superior a 2,394, por lo que debe eliminarse. Como 67 está por debajo de esta cifra, ese punto de datos se mantiene.

Si ha identificado una cantidad anormal de valores atípicos, es posible que desee ampliar la banda para incluir un determinado porcentaje de puntos de datos. La regla empírica nos dice que el 95% de los datos se encuentran dentro de dos desviaciones estándar de la media . Por lo tanto, una regla general dice que debe eliminar un máximo del 5% de sus puntos de datos.

Tabla de criterios de Chauvenet

norte τ
3 1.383
4 1.534
5 1.645
6 1.732
7 1.803
8 1.863
9 1.915
10 1.960
11 2.000
12 2.037
13 2.070
14 2.100
15 2.128
dieciséis 2.154
17 2.178
18 2.200
19 2.222
20 2.241
21 2.260
22 2.278
23 2.295
24 2.311
25 2.326
26 2.341
27 2.355
28 2.369
29 2.382
30 2.394
31 2.406
32 2.418
33 2.429
34 2.440
35 2.450
36 2.460
37 2.470
38 2.479
39 2.489
40 2.498
50 2.576
100 2.807
500 3.291
1000 3.481

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

El análisis por intención de tratar (ITT) es un método de análisis estadístico que se utiliza a menudo en la…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!