Resumen de siete números

Actualizado por ultima vez el 23 de abril de 2022, por Luis Benites.

¿Qué es un resumen de siete números?

Un resumen de siete números es un conjunto de siete hechos sobre un conjunto de datos distribuidos normalmente . Puede ser una simple verificación del supuesto de normalidad , que es requerido por muchas pruebas estadísticas. El resumen suele estar compuesto por:

  1. El percentil 2 .
  2. El percentil 9.
  3. El percentil 25 (es decir, el cuartil inferior o Q1).
  4. El percentil 50 (la mediana ).
  5. El percentil 75 (es decir, el cuartil superior, o Q3)
  6. El percentil 91.
  7. El percentil 98.

Se usan los percentiles al principio (2/9) y al final (91/98) porque los siete números en el resumen estarán espaciados uniformemente si los datos provienen de una distribución normal.

Versiones alternativas

1. Una versión menos común del resumen, que también da como resultado un espaciado parejo, es en términos de la media (μ) y la desviación estándar (σ):

μ – 3σ, μ – 2σ, μ – σ, μ, μ + σ, μ + 2σ, μ + 3σ

2. El número siete también se informa ocasionalmente como un resumen relacionado con un » diagrama de caja «, con referencias al método de Tukey para encontrar valores atípicos (1.5 * IQR):

  • Mínimo,
  • Valla inferior (Q1 – (1,5 * IQR)),
  • Bisagra inferior (generalmente el primer cuartil ),
  • Mediana,
  • Bisagra superior (generalmente el tercer cuartil),
  • Tope superior,(Q1 + (1.5 * IQR)),
  • Máximo.

3. Rammensee et. al (2015) define un resumen de siete números de una manera completamente diferente: como la media , la mediana, la desviación estándar , los percentiles 95 y 5, mínimo y máximo. Otros ejemplos de esta definición aparecen en la literatura académica, como en esta tesis de maestría .

4. Otra versión más (Shoemaker, nd) contiene la media, el mínimo, el máximo, el primer y tercer cuartiles, la mediana, más “el número de observaciones que no faltan”. Shoemaker afirma que esto le permite «… ubicar el centro de la distribución y conocer su forma aproximada y densidad».

La conclusión es que, si se le pide que busque un resumen de siete números, consulte con su profesor y/o autor del libro de texto para asegurarse de que está obteniendo las estadísticas correctas. A diferencia del resumen de cinco números, que tiene un significado estándar, el resumen de siete números tiene muchos significados, según el autor y la situación.

Similitud con el resumen de cinco números

El resumen de siete números es similar al resumen de cinco números , que se compone de:

  1. Mínimo,
  2. Cuartil inferior,
  3. Mediana,
  4. Cuartilla superior,
  5. Máximo.

Si bien el resumen de cinco números puede aplicarse a cualquier distribución, el resumen de siete números generalmente solo se aplica a los datos que provienen de una distribución normal. En el resumen de siete números, el mínimo en el resumen de cinco números se reemplaza por los percentiles 2 y 9 y el máximo se reemplaza por los percentiles 91 y 98.

Versión no paramétrica

Si bien el resumen de siete números se aplica solo a la distribución normal, Bowley modificó el resumen para que, al igual que el resumen de cinco números, pudiera aplicarse a cualquier distribución. Este resumen, a veces llamado el resumen de siete cifras, no se usa muy a menudo, excepto quizás en alguna obra literaria ocasional, como esta.

  1. El mínimo.
  2. El percentil 10 (es decir, el primer decil).
  3. El percentil 25 (es decir, el cuartil inferior o Q1).
  4. El percentil 50 (la mediana).
  5. El percentil 75 (es decir, el cuartil superior, o Q3)
  6. El percentil 90.
  7. El maximo.

Referencias :
Bowley, A. (2019) Manual elemental de estadística , 3.ª ed., p.62.
DeVeaux, R. Velleman, P. y Bock, D. (2006). Estadísticas de introducción. 3ra Edición. Pearson/Addison-Wesley.
Mock, R. (2011) Análisis de calidad de datos para bases de datos de composición de alimentos. Consultado el 10/1/2017 de aquí : http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.463.5857&rep=rep1&type=pdf
Rammensee et. al (2015). Dinámica de la diferenciación de células madre neurales mecanosensibles. Células madre . 30 de agosto. Consultado el 10/01/2017 desde aquí . http://www.cchem.berkeley.edu/schaffer/2016%20Publications/Pub.2.pdf
Zapatero, J. (sin fecha). Verificación de contenido de campo utilizando tablas de diccionario SQL. Recuperado el 10/01/2007 de: http://www.lexjansen.com/nesug/nesug96/NESUG96010.pdf

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es una prueba de Chow? La prueba de Chow le dice si los coeficientes de regresión son diferentes para…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!