¿Qué es la regresión curvilínea? (Definición y ejemplos)

Actualizado por ultima vez el 7 de mayo de 2021, por .

La regresión curvilínea es el nombre que se le da a cualquier modelo de regresión que intente ajustar una curva en lugar de una línea recta.

Los ejemplos comunes de modelos de regresión curvilínea incluyen:

Regresión cuadrática: se utiliza cuando existe una relación cuadrática entre una variable predictora y una variable de respuesta . Cuando se grafica, este tipo de relación se ve como una «U» o una «U» invertida en un diagrama de dispersión:

Regresión cúbica: se utiliza cuando existe una relación cúbica entre una variable predictora y una variable de respuesta. Cuando se grafica, este tipo de relación tiene dos curvas distintas en un diagrama de dispersión:

Ambos contrastan con la regresión lineal simple en la que la relación entre la variable predictora y la variable de respuesta es lineal:

La fórmula de los modelos de regresión curvilínea

Un modelo de regresión lineal simple intenta ajustar un conjunto de datos mediante la siguiente fórmula:

ŷ = β 0 + β 1 x

dónde:

  • ŷ: La variable de respuesta
  • β 0 , β 1 : Los coeficientes de regresión
  • x: la variable predictora

Por el contrario, un modelo de regresión cuadrática utiliza la siguiente fórmula:

ŷ = β 0 + β 1 x + β 2 x 2

Y un modelo de regresión cúbica usa la siguiente fórmula:

ŷ = β 0 + β 1 x + β 2 x 2 + β 3 x 3

Un nombre más general dado a los modelos de regresión que incluyen exponentes es regresión polinomial , que adopta la siguiente fórmula:

ŷ = β 0 + β 1 x + β 2 x 2 +… + β k x k

El valor de k indica el grado del polinomio. Aunque el grado puede ser cualquier número positivo, en la práctica rara vez ajustamos modelos de regresión polinomial con un grado superior a 3 o 4.

Al usar exponentes en la fórmula del modelo de regresión, los modelos de regresión polinomial pueden ajustar curvas a conjuntos de datos en lugar de líneas rectas.

Cuándo utilizar la regresión curvilínea

La forma más sencilla de saber si debe utilizar la regresión curvilínea es crear un diagrama de dispersión de la variable predictora y la variable de respuesta.

Si la gráfica de dispersión muestra una relación lineal entre las dos variables, es probable que sea apropiado utilizar la regresión lineal simple.

Sin embargo, si la gráfica de dispersión muestra un patrón cuadrático, cúbico o algún otro patrón curvilíneo entre el predictor y la variable de respuesta, entonces es probable que sea más apropiado usar la regresión curvilínea.

También puede ajustar un modelo de regresión lineal simple y un modelo de regresión curvilínea y comparar los valores de R cuadrado ajustados de cada modelo para determinar qué modelo ofrece un mejor ajuste a los datos.

La R-cuadrada ajustada es útil porque le indica la proporción de la varianza en la variable de respuesta que puede ser explicada por la (s) variable (s) predictoras, ajustada por el número de variables predictoras en el modelo.

En general, el modelo con el valor R cuadrado ajustado más alto ofrece un mejor ajuste al conjunto de datos.

Recursos adicionales

Los siguientes tutoriales explican cómo realizar la regresión polinomial en diferentes software estadísticos:

Introducción a la regresión polinomial
Cómo realizar una regresión polinomial en Excel
Cómo realizar una regresión polinomial en Python
Cómo realizar una regresión polinomial en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La prueba de Shapiro-Wilk es una prueba de normalidad. Se utiliza para determinar si una muestra proviene o no de…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!