Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 17 de julio de 2024, por Luis Benites.
Hay dos ramas principales en el campo de la estadística:
- Estadísticas descriptivas
- Estadística inferencial
Este tutorial explica la diferencia entre las dos ramas y por qué cada una es útil en determinadas situaciones.
Estadística descriptiva
En pocas palabras, la estadística descriptiva tiene como objetivo describir una parte de los datos sin procesar utilizando estadísticas de resumen, gráficos y tablas. Las estadísticas descriptivas son útiles porque le permiten comprender un grupo de datos de manera mucho más rápida y sencilla en comparación con solo mirar filas y filas de valores de datos sin procesar.
Por ejemplo, suponga que tenemos un conjunto de datos sin procesar que muestra los puntajes de las pruebas de 1,000 estudiantes en una escuela en particular. Podríamos estar interesados en la puntuación media de las pruebas junto con la distribución de las puntuaciones de las pruebas.
Usando estadísticas descriptivas, podríamos encontrar la puntuación media y crear un gráfico que nos ayude a visualizar la distribución de puntuaciones. Esto nos permite comprender los puntajes de las pruebas de los estudiantes mucho más fácilmente en comparación con solo mirar los datos sin procesar.
Formas comunes de estadística descriptiva
Hay tres formas comunes de estadística descriptiva:
1. Resumen de estadísticas.Estas son estadísticas que resumen los datos usando un solo número. Hay dos tipos populares de estadísticas resumidas:
- Medidas de tendencia central : estos números describen dónde se encuentra el centro de un conjunto de datos. Los ejemplos incluyen la media y la mediana .
- Medidas de dispersión : estos números describen qué tan dispersos están los valores en el conjunto de datos. Los ejemplos incluyen el rango ,el rango intercuartílico , la desviación estándar y la varianza .
2. Gráficos . Los gráficos nos ayudan a visualizar datos. Los tipos comunes de gráficos que se utilizan para visualizar datos incluyen diagramas de caja , histogramas , diagramas de tallo y hojas y diagramas de dispersión .
3. Tablas . Las tablas pueden ayudarnos a comprender cómo se distribuyen los datos. Un tipo común de tabla es una tabla de frecuencia , que nos dice cuántos valores de datos se encuentran dentro de ciertos rangos.
Ejemplo de uso de estadísticas descriptivas
El siguiente ejemplo ilustra cómo podríamos usar estadísticas descriptivas en el mundo real.
Suponga que 1000 estudiantes de una determinada escuela realizan el mismo examen. Estamos interesados en comprender la distribución de los puntajes de las pruebas, por lo que utilizamos las siguientes estadísticas descriptivas:
1. Resumen de estadísticas
Media: 82,13 . Esto nos dice que el puntaje promedio de la prueba entre los 1,000 estudiantes es 82.13.
Mediana: 84. Esto nos dice que la mitad de todos los estudiantes obtuvieron calificaciones superiores a 84 y la mitad obtuvieron calificaciones inferiores a 84.
Máx .: 100. Mín .: 45. Esto nos dice que la puntuación máxima que obtuvo cualquier estudiante fue 100 y la puntuación mínima fue 45. El rango , que nos dice la diferencia entre el máximo y el mínimo, es 55.
2. Gráficos
Para visualizar la distribución de los puntajes de las pruebas, podemos crear un histograma, un tipo de gráfico que usa barras rectangulares para representar frecuencias.
Con base en este histograma, podemos ver que la distribución de los puntajes de las pruebas tiene una forma aproximada de campana. La mayoría de los estudiantes puntuaron entre 70 y 90, mientras que muy pocos puntuaron por encima de 95 y menos todavía puntuaron por debajo de 50.
3. Tablas
Otra forma sencilla de comprender la distribución de puntuaciones es crear una tabla de frecuencias. Por ejemplo, la siguiente tabla de frecuencias muestra qué porcentaje de estudiantes obtuvieron puntajes entre varios rangos:
Podemos ver que solo el 4% del total de estudiantes obtuvo una puntuación superior a 95. También podemos ver que (12% + 9% + 4% =) el 25% de todos los estudiantes obtuvo una puntuación de 85 o superior.
Una tabla de frecuencias es particularmente útil si queremos saber qué porcentaje de los valores de los datos caen por encima o por debajo de un determinado valor. Por ejemplo, supongamos que la escuela considera que una puntuación de prueba «aceptable» es cualquier puntuación superior a 75. Al observar la tabla de frecuencias, podemos ver fácilmente que (20% + 22% + 12% + 9% + 4% =) El 67% de los estudiantes recibió una calificación de prueba aceptable.
Estadística inferencial
En pocas palabras, la estadística inferencial utiliza una pequeña muestra de datos para hacer inferencias sobre la población más grande de la que proviene la muestra.
Por ejemplo, podríamos estar interesados en comprender las preferencias políticas de millones de personas en un país. Sin embargo, llevaría demasiado tiempo y sería demasiado caro encuestar a todas las personas del país. Por lo tanto, en su lugar, tomaríamos una encuesta más pequeña de, digamos, 1,000 estadounidenses, y usaríamos los resultados de la encuesta para hacer inferencias sobre la población en su conjunto.
Esta es toda la premisa detrás de la estadística inferencial: queremos responder alguna pregunta sobre una población, por lo que obtenemos datos para una pequeña muestra de esa población y usamos los datos de la muestra para hacer inferencias sobre la población.
La importancia de una muestra representativa
Para tener confianza en nuestra capacidad de utilizar una muestra para hacer inferencias sobre una población, debemos asegurarnos de tener una muestra representativa , es decir, una muestra en la que las características de los individuos de la muestra coincidan estrechamente con las características. de la población total.
Idealmente, queremos que nuestra muestra sea como una «mini versión» de nuestra población. Entonces, si queremos hacer inferencias sobre una población de estudiantes compuesta por 50% de niñas y 50% de niños, nuestra muestra no sería representativa si incluyera 90% de niños y solo 10% de niñas.
Si nuestra muestra no es similar a la población general, entonces no podemos generalizar los hallazgos de la muestra a la población general con confianza.
Cómo obtener una muestra representativa
Para maximizar las posibilidades de obtener una muestra representativa, debe centrarse en dos cosas:
1. Asegúrese de utilizar un método de muestreo aleatorio.
Existen varios métodos de muestreo aleatorio diferentes que puede utilizar y que probablemente produzcan una muestra representativa, que incluyen:
- Una muestra aleatoria simple
- Una muestra aleatoria sistemática
- Una muestra aleatoria de conglomerados
- Una muestra aleatoria estratificada
Los métodos de muestreo aleatorio tienden a producir muestras representativas porque cada miembro de la población tiene la misma probabilidad de ser incluido en la muestra.
2. Asegúrese de que el tamaño de la muestra sea lo suficientemente grande .
Además de utilizar un método de muestreo adecuado, es importante asegurarse de que la muestra sea lo suficientemente grande para que tenga suficientes datos para generalizar a la población más amplia.
Para determinar qué tan grande debe ser su muestra, debe considerar el tamaño de la población que está estudiando, el nivel de confianza que le gustaría usar y el margen de error que considera aceptable. Afortunadamente, puede usar calculadoras en línea como esta para ingresar estos valores y ver qué tan grande debe ser su muestra.
Formas comunes de estadística inferencial
Hay tres formas comunes de estadística inferencial:
1. Pruebas de hipótesis.
A menudo estamos interesados en responder preguntas sobre una población como:
- ¿Es el porcentaje de personas en Ohio que apoyan al candidato A superior al 50%?
- ¿Es la altura media de una determinada planta igual a 14 pulgadas?
- ¿Existe una diferencia entre la altura media de los estudiantes de la escuela A en comparación con la escuela B?
Para responder a estas preguntas podemos realizar una prueba de hipótesis , que nos permite utilizar datos de una muestra para sacar conclusiones sobre poblaciones.
2. Intervalos de confianza .
A veces nos interesa estimar algún valor para una población. Por ejemplo, podríamos estar interesados en la altura media de una determinada especie de planta en Australia.
En lugar de medir cada planta del país, podríamos recolectar una pequeña muestra de plantas y medir cada una. Luego, podemos usar la altura media de las plantas de la muestra para estimar la altura media de la población.
Sin embargo, es poco probable que nuestra muestra proporcione una estimación perfecta para la población. Afortunadamente, podemos dar cuenta de esta incertidumbre mediante la creación de un intervalo de confianza , que proporciona un rango de valores en los que estamos seguros de que se encuentra el verdadero parámetro de población.
Por ejemplo, podríamos producir un intervalo de confianza del 95% de [13.2, 14.8], que dice que estamos 95% seguros de que la verdadera altura media de esta especie de planta está entre 13.2 pulgadas y 14.8 pulgadas.
3. Regresión .
A veces nos interesa comprender la relación entre dos variables en una población.
Por ejemplo, supongamos que queremos saber si las horas que se dedican a estudiar a la semana están relacionadas con los resultados de las pruebas . Para responder a esta pregunta, podríamos realizar una técnica conocida como análisis de regresión .
Entonces, podemos observar el número de horas estudiadas junto con los puntajes de las pruebas para 100 estudiantes y realizar un análisis de regresión para ver si existe una relación significativa entre las dos variables. Si el valor p de la regresión resulta ser significativo , entonces podemos concluir que existe una relación significativa entre estas dos variables en la población general de estudiantes.
La diferencia entre estadística descriptiva e inferencial
En resumen, la diferencia entre estadística descriptiva e inferencial se puede describir de la siguiente manera:
Las estadísticas descriptivas utilizan estadísticas de resumen, gráficos y tablas para describir un conjunto de datos. Esto es útil para ayudarnos a obtener una comprensión rápida y sencilla de un conjunto de datos sin tener que pasar por todos los valores de datos individuales.
La estadística inferencial usa muestras para hacer inferencias sobre poblaciones más grandes. Dependiendo de la pregunta que desee responder sobre una población, puede decidir utilizar uno o más de los siguientes métodos: pruebas de hipótesis, intervalos de confianza y análisis de regresión. Si elige utilizar uno de estos métodos, tenga en cuenta que su muestra debe ser representativa de su población , o las conclusiones que extraiga no serán confiables.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:
Muy buena página, con pocas palabras describe un concepto, logrando fácilmente entenderlo