Intervalo de confianza para la diferencia de proporciones

Un intervalo de confianza (IC) para una diferencia en proporciones es un rango de valores que probablemente contenga la verdadera diferencia entre dos proporciones de población con un cierto nivel de confianza.

Este tutorial explica lo siguiente:

  • La motivación para crear este intervalo de confianza.
  • La fórmula para crear este intervalo de confianza.
  • Un ejemplo de cómo calcular este intervalo de confianza.
  • Cómo interpretar este intervalo de confianza.

IC para la diferencia en proporciones: motivación

A menudo, los investigadores están interesados ​​en estimar la diferencia entre dos proporciones de población. Para estimar esta diferencia, saldrán y recolectarán una muestra aleatoria de cada población y calcularán la proporción para cada muestra. Luego, pueden comparar la diferencia entre las dos proporciones.

Sin embargo, no pueden saber con certeza si la diferencia en las proporciones de la muestra coincide con la verdadera diferencia en las proporciones de la población, por lo que pueden crear un intervalo de confianza para la diferencia entre las dos proporciones. Esto proporciona un rango de valores que probablemente contenga la verdadera diferencia entre las proporciones de población.

Por ejemplo, supongamos que queremos estimar la diferencia en la proporción de residentes que apoyan una determinada ley en el condado A en comparación con la proporción que apoya la ley en el condado B.

Dado que hay miles de residentes en cada condado, llevaría demasiado tiempo y sería demasiado costoso recorrer y encuestar a cada residente individual en cada condado.

En cambio, podríamos tomar una muestra aleatoria simple de residentes de cada condado y usar la proporción a favor de la ley en cada muestra para estimar la verdadera diferencia en proporciones entre los dos condados:

Dado que nuestras muestras son aleatorias, no se garantiza que la diferencia de proporciones entre las dos muestras coincida exactamente con la diferencia de proporciones entre las dos poblaciones. Entonces, para capturar esta incertidumbre, podemos crear un intervalo de confianza que contenga un rango de valores que probablemente contengan la verdadera diferencia en las proporciones entre las dos poblaciones.

CI para la diferencia en proporciones: fórmula

Usamos la siguiente fórmula para calcular un intervalo de confianza para una diferencia entre dos proporciones de población:

Intervalo de confianza = (p 1 –p 2 ) +/- z * √ (p 1 (1-p 1 ) / n 1 + p 2 (1-p 2 ) / n 2 )

dónde:

  • p 1 , p 2 : proporción de muestra 1, proporción de muestra 2
  • z: el valor crítico de z basado en el nivel de confianza
  • n 1 , n 2 : tamaño de la muestra 1, tamaño de la muestra 2

El valor z que utilizará depende del nivel de confianza que elija. La siguiente tabla muestra el valor z que corresponde a las opciones de nivel de confianza más populares:

Nivel de confianza valor z
0,90 1.645
0,95 1,96
0,99 2,58

Tenga en cuenta que los niveles de confianza más altos corresponden a valores z más grandes, lo que conduce a intervalos de confianza más amplios. Esto significa que, por ejemplo, un intervalo de confianza del 95% será más amplio que un intervalo de confianza del 90% para el mismo conjunto de datos.

CI para la diferencia de proporciones: ejemplo

Suponga que queremos estimar la diferencia en la proporción de residentes que apoyan una determinada ley en el condado A en comparación con la proporción que apoya la ley en el condado B. Aquí están los datos resumidos para cada muestra:

Muestra 1:

  • n 1 = 100
  • p 1 = 0,62 (es decir, 62 de cada 100 residentes apoyan la ley)

Muestra 2:

  • n 2 = 100
  • p 2 = 0.46 (es decir, 46 de cada 100 residentes apoyan la ley)

A continuación, se muestra cómo encontrar varios intervalos de confianza para la diferencia en las proporciones de población:

Intervalo de confianza del 90%:

(.62-.46) +/- 1.645 * √ (.62 (1-.62) / 100 + .46 (1-.46) / 100) = [.0456, .2744]

Intervalo de confianza del 95%:

(.62-.46) +/- 1.96 * √ (.62 (1-.62) / 100 + .46 (1-.46) / 100) = [.0236, .2964]

Intervalo de confianza del 99%:

(.62-.46) +/- 2.58 * √ (.62 (1-.62) / 100 + .46 (1-.46) / 100) = [-0.0192, 0.3392]

Nota: También puede encontrar estos intervalos de confianza utilizando el intervalo de confianza para la calculadora de diferencias en proporciones .

CI para la diferencia de proporciones : interpretación

La forma en que interpretaríamos un intervalo de confianza es la siguiente:

Existe una probabilidad del 95% de que el intervalo de confianza de [.0236, .2964] contenga la verdadera diferencia en la proporción de residentes que están a favor de la ley entre los dos condados.

Dado que este intervalo no contiene el valor «0», significa que es muy probable que exista una verdadera diferencia en la proporción de residentes que apoyan esta ley en el condado A en comparación con el condado B.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La función CONTAR.SI () en Hojas de cálculo de Google se puede utilizar para contar el número de filas en…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!