Criterio de Peirce: Definición

Actualizado por ultima vez el 22 de octubre de 2021, por Luis Benites.

¿Qué es el Criterio de Peirce?

El Criterio de Peirce es un método, propuesto por Benjamin Peerce en 1852, que nos permite eliminar los valores atípicos de los conjuntos de datos .

Un valor atípico es una parte del conjunto de datos que es anormal y no representativa de la tendencia general . Encontrar y eliminar valores atípicos es una parte importante de gran parte de la investigación científica basada en mediciones de la vida real, y el Criterio de Peirce es una de las formas teóricamente más rigurosas de hacerlo .

También tiene una aplicación más general que otros métodos para eliminar valores atípicos, incluido el Criterio de Chauvenet, que se usa con más frecuencia . No hace suposiciones arbitrarias sobre el rechazo de datos. Y, para que sea aún más útil, se puede utilizar para eliminar más de un valor atípico.

Cómo utilizar el Criterio de Peirce

Usar el Criterio de Peirce en su forma original es engorroso, pero se ha condensado en un conjunto de tablas (ver Chauvenet & Peirce, 2018) y una fórmula fácil de usar que se puede aplicar fácilmente a conjuntos de datos.

R en estas tablas es una relación : la relación entre la desviación máxima permitida de la media del conjunto de muestras y la desviación estándar . Es decir,
criterio de perforacion 1

Conociendo R, entonces, podemos calcular el valor de |X i – X m | max de la desviación estándar.

Para usar esta forma moderna del Criterio de Peirce, uno

  1. Encuentre la media y la desviación estándar de la muestra para todo el conjunto.
  2. Busque el valor de R en una tabla de Peirce que corresponda al número de observaciones en su conjunto de muestra. Comience suponiendo un valor atípico, aunque puede repetir el proceso para descubrir más de uno.
  3. Utilice la fórmula |X i – X m | max = σ R para calcular la desviación máxima permitida .
  4. Calcule la desviación real de sus posibles valores atípicos. | Xi Xm |
  5. Comprobar si |X i – X m | > | Xi Xm | max , y si lo es, elimine ese valor atípico.
  6. Ahora suponga dos valores atípicos y vuelva a realizar los pasos 2-5. Mantenga el número original de mediciones, así como los valores originales de la desviación estándar y la media.
  7. Si sus cálculos en el paso 6 le dan otro valor atípico, puede repetir el proceso. Asuma un valor atípico adicional cada vez y use el número original de mediciones, la media y la desviación estándar cada vez.
  8. Una vez que se hayan probado todos los datos cuestionables, calcule nuevamente la media y la desviación estándar para su conjunto de datos final.

Referencias

Jones, A. (2018). Probabilidad, estadística y otras cosas aterradoras. Routledge
Chauvenet, W. y Peirce, B. (2018). Un tratado sobre el método de los mínimos cuadrados: o la aplicación de la teoría de las probabilidades en la combinación de observaciones . Franklin Clásicos.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Las distribuciones multivariadas muestran comparaciones entre dos o más medidas y las relaciones entre ellas. Para cada distribución univariante con…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!