Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 4 de octubre de 2021, por Luis Benites.
¿Qué es el Criterio de Chauvenet?
El criterio de Chauvenet es una forma de identificar valores atípicos . El método funciona creando una banda aceptable de datos alrededor de la media, especificando que se debe eliminar cualquier valor que quede fuera de esa banda. La fórmula para calcular la banda es: Donde n es el tamaño de la muestra. Las probabilidades de distribución normal se pueden usar para relacionar la fórmula con una desviación máxima de la media: τ = |X i – x̄|/ s . Esta fórmula es un poco más intuitiva de usar.
- El procedimiento solo debe ejecutarse una vez en un conjunto de datos. Algunos autores abogan por dos carreras; los valores atípicos que se revelan en la segunda ejecución se denominan valores atípicos protegidos . Nota : otros autores dicen que nunca elimine los valores atípicos, por lo que este es un juicio basado en sus datos.
- El procedimiento asume que sus datos se distribuyen normalmente .
Ejecutando Chauvenet’s
Probablemente querrá realizar estos cálculos en una hoja de cálculo, porque los cálculos pueden volverse numerosos si tiene múltiples valores atípicos potenciales (vea el Paso 3).
Para el siguiente conjunto de números, identifique cualquier valor atípico: 47, 50, 53, 55, 55, 56, 57, 57, 58, 58, 58, 58, 60, 60, 60, 61, 61, 61, 61, 61 , 61, 62, 62, 62, 63, 63, 64, 67, 68, 72.
Paso 1: Calcular la media muestral, x̄. La media muestral es 59,7.
Paso 2: encuentre la desviación estándar de la muestra, s. La desviación estándar de la muestra es 4.998.
Paso 3: Use la siguiente fórmula para encontrar la desviación estandarizada de la media para todos los valores atípicos sospechosos, valores de datos «i».
τ = |X i – x̄|/ s
Tenemos treinta elementos en el conjunto, por lo que querrá ejecutar la fórmula veinte veces (una para cada punto de datos, i). En aras de la brevedad, solo voy a mostrar dos de los cálculos de puntos de datos:
47: |47 – 59,7| / 4,998 = 2,541
67: |67 – 59,7| / 4,998 = 1,461
Paso 4: Compare los valores que obtuvo en el Paso 4 con una tabla de valores de criterio de Chauvenet (vea la siguiente sección) para ver si puede rechazar cada punto de datos. Para n=30, la tabla nos dice que la banda debe terminar en 2,394 desviaciones estándar.
47 tiene 2,541 desviaciones estándar y es superior a 2,394, por lo que debe eliminarse. Como 67 está por debajo de esta cifra, ese punto de datos se mantiene.
Si ha identificado una cantidad anormal de valores atípicos, es posible que desee ampliar la banda para incluir un determinado porcentaje de puntos de datos. La regla empírica nos dice que el 95% de los datos se encuentran dentro de dos desviaciones estándar de la media . Por lo tanto, una regla general dice que debe eliminar un máximo del 5% de sus puntos de datos.
Tabla de criterios de Chauvenet
norte | τ |
---|---|
3 | 1.383 |
4 | 1.534 |
5 | 1.645 |
6 | 1.732 |
7 | 1.803 |
8 | 1.863 |
9 | 1.915 |
10 | 1.960 |
11 | 2.000 |
12 | 2.037 |
13 | 2.070 |
14 | 2.100 |
15 | 2.128 |
dieciséis | 2.154 |
17 | 2.178 |
18 | 2.200 |
19 | 2.222 |
20 | 2.241 |
21 | 2.260 |
22 | 2.278 |
23 | 2.295 |
24 | 2.311 |
25 | 2.326 |
26 | 2.341 |
27 | 2.355 |
28 | 2.369 |
29 | 2.382 |
30 | 2.394 |
31 | 2.406 |
32 | 2.418 |
33 | 2.429 |
34 | 2.440 |
35 | 2.450 |
36 | 2.460 |
37 | 2.470 |
38 | 2.479 |
39 | 2.489 |
40 | 2.498 |
50 | 2.576 |
100 | 2.807 |
500 | 3.291 |
1000 | 3.481 |
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: