Estadísticas de pedidos: definición simple, ejemplos

Actualizado por ultima vez el 26 de septiembre de 2021, por Luis Benites.

Definición de estadísticas de pedidos

Las estadísticas de pedidos son valores de muestra colocados en orden ascendente. El estudio de las estadísticas de pedidos se ocupa de las aplicaciones de estos valores ordenados y sus funciones.

Digamos que tienes tres pesos:
X 1 = 22 kg, X 2 = 44 kg y X 3 = 12 kg.
Para obtener las estadísticas de pedido (Y n ) , coloque los elementos en orden numérico creciente :

  • Y 1 = 12 kg
  • Y2 = 22 kg
  • Y 3 = 44 kg

El k-ésimo valor X más pequeño normalmente se denomina k -ésimo orden estadístico.

Más formalmente,

Si X 1 , X 2 ,…, X n son observaciones iid aleatorias tomadas de una población con n observaciones continuas, las variables aleatorias
Y 1 < Y ​​2 < …, < Yn
denotan las estadísticas de orden de la muestra.

El término también puede referirse a estadísticas que dependen solo del orden de los valores, y no de los valores mismos. Entonces, mientras que la mediana es una estadística de orden (es el valor medio cuando un conjunto de valores se ordena de menor a mayor), la media no lo es (ya que tiene que trabajar con los valores reales).

Nota : he usado Y n aquí para diferenciar el conjunto de valores ordenados de los valores de muestra originales. Sin embargo, algunos autores usan X n para denotar los valores originales y X (n) para las estadísticas de orden. Si usa Y n o X (n) es una cuestión de elección personal (y tal vez, los deseos de su profesor).

Estadísticas de primer y segundo orden

El estadístico de primer orden es el valor muestral más pequeño (es decir, el mínimo), una vez ordenados los valores. Por ejemplo, en la muestra 9, 2, 11, 5, 7, 4, la estadística de primer orden es 2. En notación, eso es x (1) = 2.
La estadística de segundo orden x( 2 ) es el siguiente valor más pequeño. En la misma muestra, el estadístico de segundo orden es 4.

De manera similar, Y n es el valor máximo en una muestra . “ n ” es una notación estadística para el número de elementos en una muestra. En otras palabras, una vez que haya colocado sus artículos de muestra en orden, el valor n es el máximo. Por ejemplo, supongamos que tiene estos elementos: 3, 4, 5, 6, 9, 10, 22. Hay 7 elementos, por lo que n = 7. El séptimo elemento en orden, 22, es el máximo.

Distribuciones continuas vs. discretas

Tenga en cuenta que la definición formal anterior solo funciona para variables continuas . Esto evita empates (por ejemplo, dos artículos que se colocan en segundo lugar). En teoría, podría tener un conjunto de valores X con vínculos (es decir, donde X 1 ≤ X 2 … ≤ X n ). Y, de hecho, algunos autores (por ejemplo, Chen, nd; Zhu nd) definen las estadísticas de orden de esa manera. Sin embargo, trabajar con estadísticas ordenadas con valores vinculados de una distribución discreta es mucho más complejo que los valores de una distribución continua (DasGupta, nd).

De manera similar, si bien ha habido algún avance en la obtención de estadísticas de orden a partir de datos independientes distribuidos de forma no idéntica, este campo está en su infancia y es mucho más complejo que el uso de variables iid.

Casos especiales

Algunas estadísticas que se pueden definir en términos de estadísticas de pedidos incluyen:

  • El mínimo de un conjunto de números: el primer número cuando los elementos se colocan en orden numérico ascendente. El mínimo, junto con el máximo, se utilizan en la teoría de los valores extremos . Son de particular importancia para el estudio de fallas de productos, sequías, inundaciones y otros eventos extremos.
  • El primer cuartil (a veces llamado cuartil inferior), Q1: el valor en el percentil 25.
  • La mediana : el número del medio. La mitad de las observaciones de la muestra estarán por debajo de la mediana y la otra mitad estarán por encima de la mediana. En términos de estadísticas de pedidos, la mediana se define como:
    estadísticas de pedidos
  • El tercer cuartil (a veces llamado el cuartil superior), Q3: el valor en el percentil 75.
  • El máximo : el último número ordenado (es decir, el más alto).
  • El rango intercuartílico : la diferencia entre el primer y el tercer cuartil (Q3 – Q1).

El rango de un conjunto de datos es una función del orden. Esto significa que el rango (máximo – mínimo o R = X n − X 1 )) depende de los números ordenados en el conjunto, y que diferirá para cada conjunto. El rango intercuartílico, la mediana, el rango medio y los cuartiles también son funciones del orden y, por lo tanto, diferirán según los números que haya en el conjunto.

Estadísticas de orden de clasificación

Mientras que las estadísticas de orden usan los valores originales en orden, las estadísticas de orden de rango solo usan los rangos de las observaciones ordenadas (David & Nagaraja, 2004). Por lo tanto, las dos estadísticas son bastante diferentes, aunque tengan etiquetas similares. Un ejemplo de estadísticas de orden de rango en uso es la prueba de rango con signo de Wilcoxon , que prueba si las medianas de dos muestras son iguales. La mayoría de las estadísticas de orden de clasificación conducen a procedimientos no paramétricos (sin distribución) , mientras que las estadísticas de orden dependen de la distribución de población subyacente.

Referencias

Chen, H. Orden Stat. Recuperado el 30 de octubre de 2017 de: http://www.math.ntu.edu.tw/~hchen/teaching/StatInference/notes/lecture37.pdf
DasGupta, A. 6 Finite Sample Theory of Order Stat. y extremos. Recuperado el 30 de octubre de 2017 de: http://www.stat.purdue.edu/~dasgupta/orderstats.pdf
David, H. & Nagaraja, H. (2004). Estadísticas de pedidos. John Wiley & Sons.
Hogg, RV y Craig, AT Introducción a la estadística matemática , 7ª ed. Nueva York: Macmillan, 2012.
Zhu, W. Order Stat. Artículo recuperado el 30 de octubre de 2017 de: http://www.ams.sunysb.edu/~zhu/ams570/Lecture9_570.pdf

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

El término “estadística U” puede tener varios significados: Estadísticas imparciales (U). Estadística U de Mann Whitney. Estadístico U en L-estimadores.…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!