Contenido de este artículo
- 0
- 0
- 0
- 0
Un valor atípico es una observación que se encuentra anormalmente alejada de otros valores en un conjunto de datos. Los valores atípicos pueden ser problemáticos porque pueden afectar los resultados de un análisis.
Una forma de identificar valores atípicos en un conjunto de datos es utilizar el Criterio de Chauvenet , que utiliza el siguiente proceso:
1. Para cada valor individual x i en el conjunto de datos, calcule la desviación de la media como:
Desviación = | x i – x | / s
donde x es la media de la muestra y s es la desviación estándar de la muestra.
2. Compare las desviaciones de cada valor individual con los valores críticos de la Tabla de Criterios de Chauvenet a continuación. Para valores de datos individuales con desviaciones mayores que las que se encuentran en la tabla, declare esos valores de datos como valores atípicos.
Criterio de Chauvenet: un ejemplo
Supongamos que tenemos el siguiente conjunto de datos de 15 valores:
La media de la muestra para este conjunto de datos es x = 17.067 y la desviación estándar de la muestra es s = 10.096 . Para cada valor de datos individual, podemos calcular su desviación como:
Desviación = | x i – x | / s
Por ejemplo:
- El primer valor de datos tendría una desviación de | 4 – 17.067 | / 10.096 = 1.294 .
- El primer valor de datos tendría una desviación de | 6 – 17.067 | / 10.096 = 1,096 .
Y así.
Podemos usar la misma fórmula para calcular la desviación de cada valor de datos individual:
Luego podemos referirnos a la Tabla de Criterios de Chauvenet y encontrar que el valor crítico que corresponde a un tamaño de muestra de n = 15 es 2.128 . Por lo tanto, cualquier valor con una desviación superior a 2,128 puede considerarse un valor atípico.
Resulta que el valor 42 tiene una desviación superior a 2.128:
Por lo tanto, el valor 42 es el único valor atípico en este conjunto de datos.
Precauciones sobre el uso del criterio de Chauvenet
El Criterio de Chauvenet supone que los valores de un conjunto de datos se distribuyen normalmente . Si no se cumple esta suposición, es probable que no sea válido utilizar el Criterio de Chauvenet para identificar valores atípicos.
Si usa este método y encuentra que un valor es un valor atípico, primero debe verificar que el valor no sea el resultado de un error de entrada de datos. A veces, los datos simplemente se ingresan incorrectamente.
Si el valor es un valor atípico verdadero, puede optar por eliminarlo si tendrá un impacto significativo en su análisis general. Solo asegúrese de mencionar que eliminó un valor atípico cuando informe sus resultados.
Además, este método solo debe usarse en un conjunto de datos determinado una vez. Por ejemplo, suponga que usamos este criterio para identificar el valor 42 como un valor atípico en el ejemplo anterior y eliminar este valor del conjunto de datos. Entonces no deberíamos volver a calcular la media de la muestra y la desviación estándar de la muestra y calcular las desviaciones una vez más para encontrar más valores atípicos.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: