- 0
- 0
- 0
- 0
Actualizado el 17 de julio de 2024, por Luis Benites.
Cuando dos variables tienen una relación lineal, a menudo puede utilizar la regresión lineal simple para cuantificar su relación.
Sin embargo, cuando dos variables tienen una relación cuadrática, puede utilizar la regresión cuadrática para cuantificar su relación.
Este tutorial explica cómo realizar una regresión cuadrática en Stata.
Ejemplo: regresión cuadrática en Stata
Supongamos que estamos interesados en comprender la relación entre el número de horas trabajadas y la felicidad. Tenemos los siguientes datos sobre la cantidad de horas trabajadas por semana y el nivel de felicidad informado (en una escala de 0-100) para 16 personas diferentes:
Puede replicar este ejemplo escribiendo estos datos exactos en Stata usando Datos> Editor de datos> Editor de datos (Editar) en el menú superior.
Utilice los siguientes pasos para realizar una regresión cuadrática en Stata.
Paso 1: Visualice los datos.
Antes de que podamos usar la regresión cuadrática, debemos asegurarnos de que la relación entre la variable explicativa (horas) y la variable de respuesta (felicidad) sea realmente cuadrática. Entonces, visualicemos los datos usando un diagrama de dispersión escribiendo lo siguiente en el cuadro de Comando:
esparcir horas de felicidad
Esto produce el siguiente diagrama de dispersión:
Podemos ver que la felicidad tiende a aumentar a medida que aumenta el número de horas trabajadas desde cero hasta cierto punto, pero luego comienza a descender a medida que el número de horas trabajadas supera las 30.
Esta forma de “U” invertida en la gráfica de dispersión indica que existe una relación cuadrática entre las horas trabajadas y la felicidad, lo que significa que debemos usar la regresión cuadrática para cuantificar esta relación.
Paso 2: Realice una regresión cuadrática.
Antes de ajustar el modelo de regresión cuadrática a los datos, necesitamos crear una nueva variable para los valores al cuadrado de nuestra variable predictora horas . Podemos hacerlo escribiendo lo siguiente en el cuadro de Comando:
gen hours2 = horas * horas
Podemos ver esta nueva variable yendo a Datos> Editor de datos> Editor de datos (Examinar) en el menú superior.
Podemos ver que horas2 son simplemente horas al cuadrado. Ahora podemos realizar una regresión cuadrática usando horas y horas2 como nuestras variables explicativas y la felicidad como nuestra variable de respuesta. Para realizar una regresión cuadrática, escriba lo siguiente en el cuadro Comando:
Regresar felicidad horas hours2
A continuación se explica cómo interpretar los números más interesantes en la salida:
Problema> F: 0,000. Este es el valor p de la regresión general. Dado que este valor es menor que 0.05, significa que las variables predictoras horas y horas 2 combinadas tienen una relación estadísticamente significativa con la variable de respuesta felicidad .
R cuadrado: 0,9092. Esta es la proporción de la varianza en la variable de respuesta que se puede explicar por la variable explicativa. En este ejemplo, el 90,92% de la variación en la felicidad se puede explicar por horas y horas 2 .
Ecuación de regresión: podemos formar una ecuación de regresión utilizando los valores de los coeficientes que se informan en la tabla de salida. En este caso, la ecuación sería:
felicidad predicha = -30.25287 + 7.173061 (horas) – .1069887 (horas 2 )
Podemos usar esta ecuación para encontrar la felicidad prevista de un individuo, dada la cantidad de horas que trabaja por semana.
Por ejemplo, se predice que una persona que trabaja 60 horas a la semana tendrá un nivel de felicidad de 14,97:
felicidad predicha = -30.25287 + 7.173061 (60) – .1069887 (60 2 ) = 14.97 .
Por el contrario, se predice que una persona que trabaja 30 horas por semana tendrá un nivel de felicidad de 88,65:
felicidad predicha = -30.25287 + 7.173061 (30) – .1069887 (30 2 ) = 88.65 .
Paso 3: Informe los resultados.
Por último, queremos informar los resultados de nuestra regresión cuadrática. A continuación, se muestra un ejemplo de cómo hacerlo:
Se realizó una regresión cuadrática para cuantificar la relación entre el número de horas trabajadas por un individuo y su correspondiente nivel de felicidad (medido de 0 a 100). En el análisis se utilizó una muestra de 16 individuos.
Los resultados mostraron que hubo una relación estadísticamente significativa entre las variables explicativas horas y horas 2 y la variable respuesta felicidad (F (2, 13) = 65.09, p <0.0001).
Combinadas, estas dos variables explicativas explicaron el 90,92% de la variabilidad explicada en la felicidad.
Se encontró que la ecuación de regresión es:
felicidad predicha = -30.25287 + 7.173061 (horas) – .1069887 (horas 2 )
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: