Estadística descriptiva vs estadística inferencial: ¿Cuál es la diferencia?

Actualizado por ultima vez el 7 de mayo de 2021, por .

Hay dos ramas principales en el campo de la estadística:

  • Estadísticas descriptivas
  • Estadística inferencial

Este tutorial explica la diferencia entre las dos ramas y por qué cada una es útil en determinadas situaciones.

Estadística descriptiva

En pocas palabras, la estadística descriptiva tiene como objetivo describir una parte de los datos sin procesar utilizando estadísticas de resumen, gráficos y tablas. Las estadísticas descriptivas son útiles porque le permiten comprender un grupo de datos de manera mucho más rápida y sencilla en comparación con solo mirar filas y filas de valores de datos sin procesar.

Por ejemplo, suponga que tenemos un conjunto de datos sin procesar que muestra los puntajes de las pruebas de 1,000 estudiantes en una escuela en particular. Podríamos estar interesados ​​en la puntuación media de las pruebas junto con la distribución de las puntuaciones de las pruebas.

Usando estadísticas descriptivas, podríamos encontrar la puntuación media y crear un gráfico que nos ayude a visualizar la distribución de puntuaciones. Esto nos permite comprender los puntajes de las pruebas de los estudiantes mucho más fácilmente en comparación con solo mirar los datos sin procesar.

Formas comunes de estadística descriptiva

Hay tres formas comunes de estadística descriptiva:

1. Resumen de estadísticas.Estas son estadísticas que resumen los datos usando un solo número. Hay dos tipos populares de estadísticas resumidas:

  • Medidas de tendencia central : estos números describen dónde se encuentra el centro de un conjunto de datos. Los ejemplos incluyen la media y la mediana .
  • Medidas de dispersión : estos números describen qué tan dispersos están los valores en el conjunto de datos. Los ejemplos incluyen el rango ,el rango intercuartílico , la desviación estándar y la varianza .

2. Gráficos . Los gráficos nos ayudan a visualizar datos. Los tipos comunes de gráficos que se utilizan para visualizar datos incluyen diagramas de caja , histogramas , diagramas de tallo y hojas y diagramas de dispersión .

3. Tablas . Las tablas pueden ayudarnos a comprender cómo se distribuyen los datos. Un tipo común de tabla es una tabla de frecuencia , que nos dice cuántos valores de datos se encuentran dentro de ciertos rangos.

Ejemplo de uso de estadísticas descriptivas

El siguiente ejemplo ilustra cómo podríamos usar estadísticas descriptivas en el mundo real.

Suponga que 1000 estudiantes de una determinada escuela realizan el mismo examen. Estamos interesados ​​en comprender la distribución de los puntajes de las pruebas, por lo que utilizamos las siguientes estadísticas descriptivas:

1. Resumen de estadísticas

Media: 82,13 . Esto nos dice que el puntaje promedio de la prueba entre los 1,000 estudiantes es 82.13.

Mediana: 84. Esto nos dice que la mitad de todos los estudiantes obtuvieron calificaciones superiores a 84 y la mitad obtuvieron calificaciones inferiores a 84.

Máx .: 100. Mín .: 45. Esto nos dice que la puntuación máxima que obtuvo cualquier estudiante fue 100 y la puntuación mínima fue 45. El rango , que nos dice la diferencia entre el máximo y el mínimo, es 55.

2. Gráficos

Para visualizar la distribución de los puntajes de las pruebas, podemos crear un histograma, un tipo de gráfico que usa barras rectangulares para representar frecuencias.

Con base en este histograma, podemos ver que la distribución de los puntajes de las pruebas tiene una forma aproximada de campana. La mayoría de los estudiantes puntuaron entre 70 y 90, mientras que muy pocos puntuaron por encima de 95 y menos todavía puntuaron por debajo de 50.

3. Tablas

Otra forma sencilla de comprender la distribución de puntuaciones es crear una tabla de frecuencias. Por ejemplo, la siguiente tabla de frecuencias muestra qué porcentaje de estudiantes obtuvieron puntajes entre varios rangos:

Podemos ver que solo el 4% del total de estudiantes obtuvo una puntuación superior a 95. También podemos ver que (12% + 9% + 4% =) el 25% de todos los estudiantes obtuvo una puntuación de 85 o superior.

Una tabla de frecuencias es particularmente útil si queremos saber qué porcentaje de los valores de los datos caen por encima o por debajo de un determinado valor. Por ejemplo, supongamos que la escuela considera que una puntuación de prueba «aceptable» es cualquier puntuación superior a 75. Al observar la tabla de frecuencias, podemos ver fácilmente que (20% + 22% + 12% + 9% + 4% =) El 67% de los estudiantes recibió una calificación de prueba aceptable.

Estadística inferencial

En pocas palabras, la estadística inferencial utiliza una pequeña muestra de datos para hacer inferencias sobre la población más grande de la que proviene la muestra.

Por ejemplo, podríamos estar interesados ​​en comprender las preferencias políticas de millones de personas en un país. Sin embargo, llevaría demasiado tiempo y sería demasiado caro encuestar a todas las personas del país. Por lo tanto, en su lugar, tomaríamos una encuesta más pequeña de, digamos, 1,000 estadounidenses, y usaríamos los resultados de la encuesta para hacer inferencias sobre la población en su conjunto.

Esta es toda la premisa detrás de la estadística inferencial: queremos responder alguna pregunta sobre una población, por lo que obtenemos datos para una pequeña muestra de esa población y usamos los datos de la muestra para hacer inferencias sobre la población.

La importancia de una muestra representativa

Para tener confianza en nuestra capacidad de utilizar una muestra para hacer inferencias sobre una población, debemos asegurarnos de tener una muestra representativa , es decir, una muestra en la que las características de los individuos de la muestra coincidan estrechamente con las características. de la población total.

Idealmente, queremos que nuestra muestra sea como una «mini versión» de nuestra población. Entonces, si queremos hacer inferencias sobre una población de estudiantes compuesta por 50% de niñas y 50% de niños, nuestra muestra no sería representativa si incluyera 90% de niños y solo 10% de niñas.

Si nuestra muestra no es similar a la población general, entonces no podemos generalizar los hallazgos de la muestra a la población general con confianza.

Cómo obtener una muestra representativa

Para maximizar las posibilidades de obtener una muestra representativa, debe centrarse en dos cosas:

1. Asegúrese de utilizar un método de muestreo aleatorio.

Existen varios métodos de muestreo aleatorio diferentes que puede utilizar y que probablemente produzcan una muestra representativa, que incluyen:

  • Una muestra aleatoria simple
  • Una muestra aleatoria sistemática
  • Una muestra aleatoria de conglomerados
  • Una muestra aleatoria estratificada

Los métodos de muestreo aleatorio tienden a producir muestras representativas porque cada miembro de la población tiene la misma probabilidad de ser incluido en la muestra.

2. Asegúrese de que el tamaño de la muestra sea lo suficientemente grande .

Además de utilizar un método de muestreo adecuado, es importante asegurarse de que la muestra sea lo suficientemente grande para que tenga suficientes datos para generalizar a la población más amplia.

Para determinar qué tan grande debe ser su muestra, debe considerar el tamaño de la población que está estudiando, el nivel de confianza que le gustaría usar y el margen de error que considera aceptable. Afortunadamente, puede usar calculadoras en línea como esta para ingresar estos valores y ver qué tan grande debe ser su muestra.

Formas comunes de estadística inferencial

Hay tres formas comunes de estadística inferencial:

1. Pruebas de hipótesis.

A menudo estamos interesados ​​en responder preguntas sobre una población como:

  • ¿Es el porcentaje de personas en Ohio que apoyan al candidato A superior al 50%?
  • ¿Es la altura media de una determinada planta igual a 14 pulgadas?
  • ¿Existe una diferencia entre la altura media de los estudiantes de la escuela A en comparación con la escuela B?

Para responder a estas preguntas podemos realizar una prueba de hipótesis , que nos permite utilizar datos de una muestra para sacar conclusiones sobre poblaciones.

2. Intervalos de confianza .

A veces nos interesa estimar algún valor para una población. Por ejemplo, podríamos estar interesados ​​en la altura media de una determinada especie de planta en Australia.

En lugar de medir cada planta del país, podríamos recolectar una pequeña muestra de plantas y medir cada una. Luego, podemos usar la altura media de las plantas de la muestra para estimar la altura media de la población.

Sin embargo, es poco probable que nuestra muestra proporcione una estimación perfecta para la población. Afortunadamente, podemos dar cuenta de esta incertidumbre mediante la creación de un intervalo de confianza , que proporciona un rango de valores en los que estamos seguros de que se encuentra el verdadero parámetro de población.

Por ejemplo, podríamos producir un intervalo de confianza del 95% de [13.2, 14.8], que dice que estamos 95% seguros de que la verdadera altura media de esta especie de planta está entre 13.2 pulgadas y 14.8 pulgadas.

3. Regresión .

A veces nos interesa comprender la relación entre dos variables en una población.

Por ejemplo, supongamos que queremos saber si las horas que se dedican a estudiar a la semana están relacionadas con los resultados de las pruebas . Para responder a esta pregunta, podríamos realizar una técnica conocida como análisis de regresión .

Entonces, podemos observar el número de horas estudiadas junto con los puntajes de las pruebas para 100 estudiantes y realizar un análisis de regresión para ver si existe una relación significativa entre las dos variables. Si el valor p de la regresión resulta ser significativo , entonces podemos concluir que existe una relación significativa entre estas dos variables en la población general de estudiantes.

La diferencia entre estadística descriptiva e inferencial

En resumen, la diferencia entre estadística descriptiva e inferencial se puede describir de la siguiente manera:

Las estadísticas descriptivas utilizan estadísticas de resumen, gráficos y tablas para describir un conjunto de datos. Esto es útil para ayudarnos a obtener una comprensión rápida y sencilla de un conjunto de datos sin tener que pasar por todos los valores de datos individuales.

La estadística inferencial usa muestras para hacer inferencias sobre poblaciones más grandes. Dependiendo de la pregunta que desee responder sobre una población, puede decidir utilizar uno o más de los siguientes métodos: pruebas de hipótesis, intervalos de confianza y análisis de regresión. Si elige utilizar uno de estos métodos, tenga en cuenta que su muestra debe ser representativa de su población , o las conclusiones que extraiga no serán confiables.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Uno de los principales supuestos en la regresión lineal es que no existe correlación entre residuos consecutivos . En otras…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!