Cómo realizar una regresión cuadrática en Stata

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

Cuando dos variables tienen una relación lineal, a menudo puede utilizar la regresión lineal simple para cuantificar su relación.

Ejemplo de relación lineal

Sin embargo, cuando dos variables tienen una relación cuadrática, puede utilizar la regresión cuadrática para cuantificar su relación.

Ejemplo de relación cuadrática

Este tutorial explica cómo realizar una regresión cuadrática en Stata.

Ejemplo: regresión cuadrática en Stata

Supongamos que estamos interesados ​​en comprender la relación entre el número de horas trabajadas y la felicidad. Tenemos los siguientes datos sobre la cantidad de horas trabajadas por semana y el nivel de felicidad informado (en una escala de 0-100) para 16 personas diferentes:

Conjunto de datos de regresión cuadrática en Stata

Puede replicar este ejemplo escribiendo estos datos exactos en Stata usando Datos> Editor de datos> Editor de datos (Editar) en el menú superior.

Utilice los siguientes pasos para realizar una regresión cuadrática en Stata.

Paso 1: Visualice los datos.

Antes de que podamos usar la regresión cuadrática, debemos asegurarnos de que la relación entre la variable explicativa (horas) y la variable de respuesta (felicidad) sea realmente cuadrática. Entonces, visualicemos los datos usando un diagrama de dispersión escribiendo lo siguiente en el cuadro de Comando:

esparcir horas de felicidad

Esto produce el siguiente diagrama de dispersión:

Diagrama de dispersión cuadrático en Stata

Podemos ver que la felicidad tiende a aumentar a medida que aumenta el número de horas trabajadas desde cero hasta cierto punto, pero luego comienza a descender a medida que el número de horas trabajadas supera las 30.

Esta forma de “U” invertida en la gráfica de dispersión indica que existe una relación cuadrática entre las horas trabajadas y la felicidad, lo que significa que debemos usar la regresión cuadrática para cuantificar esta relación.

Paso 2: Realice una regresión cuadrática.

Antes de ajustar el modelo de regresión cuadrática a los datos, necesitamos crear una nueva variable para los valores al cuadrado de nuestra variable predictora horas . Podemos hacerlo escribiendo lo siguiente en el cuadro de Comando:

gen hours2 = horas * horas

Podemos ver esta nueva variable yendo a Datos> Editor de datos> Editor de datos (Examinar) en el menú superior.

Regresión cuadrática en Stata

Podemos ver que horas2 son simplemente horas al cuadrado. Ahora podemos realizar una regresión cuadrática usando horas y horas2 como nuestras variables explicativas y la felicidad como nuestra variable de respuesta. Para realizar una regresión cuadrática, escriba lo siguiente en el cuadro Comando:

Regresar felicidad horas hours2

Salida de regresión cuadrática en Stata

A continuación se explica cómo interpretar los números más interesantes en la salida:

Problema> F: 0,000. Este es el valor p de la regresión general. Dado que este valor es menor que 0.05, significa que las variables predictoras horas y horas 2 combinadas tienen una relación estadísticamente significativa con la variable de respuesta felicidad .

R cuadrado: 0,9092. Esta es la proporción de la varianza en la variable de respuesta que se puede explicar por la variable explicativa. En este ejemplo, el 90,92% de la variación en la felicidad se puede explicar por horas y horas 2 .

Ecuación de regresión: podemos formar una ecuación de regresión utilizando los valores de los coeficientes que se informan en la tabla de salida. En este caso, la ecuación sería:

felicidad predicha = -30.25287 + 7.173061 (horas) – .1069887 (horas 2 )

Podemos usar esta ecuación para encontrar la felicidad prevista de un individuo, dada la cantidad de horas que trabaja por semana.

Por ejemplo, se predice que una persona que trabaja 60 horas a la semana tendrá un nivel de felicidad de 14,97:

felicidad predicha = -30.25287 + 7.173061 (60) – .1069887 (60 2 ) = 14.97 .

Por el contrario, se predice que una persona que trabaja 30 horas por semana tendrá un nivel de felicidad de 88,65:

felicidad predicha = -30.25287 + 7.173061 (30) – .1069887 (30 2 ) = 88.65 .

Paso 3: Informe los resultados.

Por último, queremos informar los resultados de nuestra regresión cuadrática. A continuación, se muestra un ejemplo de cómo hacerlo:

Se realizó una regresión cuadrática para cuantificar la relación entre el número de horas trabajadas por un individuo y su correspondiente nivel de felicidad (medido de 0 a 100). En el análisis se utilizó una muestra de 16 individuos.

Los resultados mostraron que hubo una relación estadísticamente significativa entre las variables explicativas horas y horas 2 y la variable respuesta felicidad (F (2, 13) = 65.09, p <0.0001).

Combinadas, estas dos variables explicativas explicaron el 90,92% de la variabilidad explicada en la felicidad.

Se encontró que la ecuación de regresión es:

felicidad predicha = -30.25287 + 7.173061 (horas) – .1069887 (horas 2 )

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

A menudo, es posible que desee filtrar las filas de un DataFrame de pandas por fechas. Afortunadamente, esto es bastante…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!