¿Qué es la regla de Sturges? (Definición y ejemplo)

Actualizado por ultima vez el 10 de mayo de 2022, por Luis Benites.

Un histograma es un gráfico que nos ayuda a visualizar la distribución de valores en un conjunto de datos.

Resulta que la cantidad de bins utilizados en un histograma puede tener un gran impacto en la forma en que interpretamos los datos.

Si usamos muy pocos bins, el verdadero patrón subyacente en los datos se puede ocultar:

Y si usamos demasiados bins, es posible que estemos visualizando el ruido en un conjunto de datos:

Afortunadamente, podemos usar un método conocido como regla de Sturges para determinar el número óptimo de contenedores para usar en un histograma.

La regla de Sturges usa la siguiente fórmula para determinar el número óptimo de contenedores para usar en un histograma:

Contenedores óptimos = ⌈log 2 n + 1⌉

dónde:

  • n: el número total de observaciones en el conjunto de datos.
  • ⌈ ⌉: Símbolos que significan «techo», es decir, redondean la respuesta al número entero más cercano.

Ejemplo de la Regla de Sturges

Supongamos que tenemos el siguiente conjunto de datos con n = 31 observaciones en total:

Podemos usar la regla de Sturges para determinar el número óptimo de bins a usar para visualizar estos valores en un histograma:

Bandejas óptimas = ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 .

De acuerdo con la regla de Sturges, deberíamos usar 6 contenedores en el histograma que usamos para visualizar esta distribución de valores.

Así es como se vería un histograma con 6 contenedores para este conjunto de datos:

Usar la regla de Sturges para determinar la cantidad de contenedores que se deben usar en un histograma

Observe cómo estos contenedores parecen ser suficientes para tener una buena idea de la distribución subyacente de valores sin ser demasiados que solo estamos visualizando el ruido en los datos.

Valores comunes de la regla de Sturges

La siguiente tabla muestra el número óptimo de bins para usar en un histograma basado en el número total de observaciones en un conjunto de datos, de acuerdo con la regla de Sturges:

Regla de Sturges para diferentes tamaños de muestra

Alternativas a la regla de Sturges

La regla de Sturges es el método más común para determinar el número óptimo de bins para usar en un histograma, pero existen varios métodos alternativos que incluyen:

La regla de la raíz cuadrada : número de contenedores = ⌈√ n

La regla del arroz: Número de contenedores = ⌈2 * 3n

La regla de Freedman-Diaconis: Número de contenedores = (2 * IQR) / 3n donde IQR es el rango intercuartílico.

Bono: Calculadora de reglas de Sturges

Utilice esta calculadora en línea gratuita para aplicar automáticamente la regla de Sturges para determinar la cantidad óptima de contenedores que se utilizarán para un histograma en función del tamaño de un conjunto de datos.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

I’m a Bachelor of Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages with aplications in Finance or Econometrics, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.

Deja un comentario

La siguiente tabla proporciona los valores críticos de la prueba de Kolmogorov-Smirnov para un tamaño de muestra y un nivel…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!