Intervalo de confianza para un coeficiente de correlación

Un intervalo de confianza para un coeficiente de correlación es un rango de valores que probablemente contenga un coeficiente de correlación poblacional con un cierto nivel de confianza.

Este tutorial explica lo siguiente:

  • La motivación para crear este tipo de intervalo de confianza.
  • La fórmula para crear este tipo de intervalo de confianza.
  • Un ejemplo de cómo crear este tipo de intervalo de confianza.
  • Cómo interpretar este tipo de intervalo de confianza.

Intervalo de confianza para un coeficiente de correlación: motivación

La razón para crear un intervalo de confianza para un coeficiente de correlación es capturar nuestra incertidumbre al estimar un coeficiente de correlación de población.

Por ejemplo, supongamos que queremos estimar el coeficiente de correlación entre la altura y el peso de los residentes de un determinado condado. Dado que hay miles de residentes en el condado, sería demasiado costoso y llevaría mucho tiempo buscar información sobre la altura y el peso de cada residente.

En su lugar, podríamos seleccionar una muestra aleatoria simple de residentes y simplemente recopilar información sobre ellos.

Ejemplo de estimación de proporción de población

Dado que seleccionamos una muestra aleatoria de residentes, no hay garantía de que el coeficiente de correlación entre la altura y el peso de estos residentes en la muestra coincida exactamente con el coeficiente de correlación en la población más grande. Entonces, para capturar esta incertidumbre, podemos crear un intervalo de confianza que contenga un rango de valores que probablemente contengan el verdadero coeficiente de correlación entre la altura y el peso de los residentes en este condado.

Intervalo de confianza para un coeficiente de correlación: fórmula

Usamos los siguientes pasos para calcular un intervalo de confianza para un coeficiente de correlación de población, basado en el tamaño de muestra n y el coeficiente de correlación de muestra r .

Paso 1: realizar la transformación de Fisher.

Sea z r = ln (1 + r / 1-r) / 2

Paso 2: Encuentre los límites superior e inferior del registro.

Deje L = z r – (z 1-α / 2 / √ (n-3))

Sea U = z r + (z 1-α / 2 / √ (n-3))

Paso 3: Encuentre el intervalo de confianza.

El intervalo de confianza final se puede encontrar mediante la siguiente fórmula:

Intervalo de confianza = [(e 2L -1) / (e 2L +1), (e 2U -1) / (e 2U +1)]

Intervalo de confianza para un coeficiente de correlación: ejemplo

Suponga que queremos estimar el coeficiente de correlación entre la altura y el peso de los residentes de un determinado condado. Seleccionamos una muestra aleatoria de 30 residentes y encontramos la siguiente información:

  • Tamaño de muestra n = 30
  • Coeficiente de correlación entre talla y peso r = 0,56

A continuación, se explica cómo encontrar un intervalo de confianza del 95% para el coeficiente de correlación de la población:

Paso 1: realizar la transformación de Fisher.

Sea z r = ln (1 + r / 1-r) / 2 = ln (1 + .56 / 1-.56) / 2 = 0.6328

Paso 2: Encuentre los límites superior e inferior del registro.

Deje L = z r – (z 1-α / 2 / √ (n-3)) = .6328 – (1.96 / √ (30-3)) = .2556

Sea U = z r + (z 1-α / 2 / √ (n-3)) = .6328 + (1.96 / √ (30-3)) = 1.01

Paso 3: Encuentre el intervalo de confianza.

Intervalo de confianza = [(e 2L -1) / (e 2L +1), (e 2U -1) / (e 2U +1)]

Intervalo de confianza = [(e 2 (.2556) -1) / (e 2 (.2556) +1), (e 2 (1.01) -1) / (e 2 (1.01) +1)] = [.2502 , .7658]

Nota: También puede encontrar este intervalo de confianza utilizando el intervalo de confianza para una calculadora de coeficiente de correlación .

Intervalo de confianza para un coeficiente de correlación: interpretación

La forma en que interpretaríamos un intervalo de confianza es la siguiente:

Existe una probabilidad del 95% de que el intervalo de confianza de [.2502, .7658] contenga el verdadero coeficiente de correlación de la población entre la altura y el peso de los residentes de este condado.

Otra forma de decir lo mismo es que hay solo un 5% de probabilidad de que el coeficiente de correlación de la población real se encuentre fuera del intervalo de confianza del 95%. Es decir, hay solo un 5% de probabilidad de que el verdadero coeficiente de correlación poblacional entre la altura y el peso de los residentes de este condado sea menor que .2502 o mayor que .7658.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

1 comentario en «Intervalo de confianza para un coeficiente de correlación»

Deja un comentario

Una tabla de frecuencias es una tabla que muestra las frecuencias de diferentes categorías. Este tipo de tabla es particularmente…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!