Regresión polinomial en hojas de Google (paso a paso)

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

El análisis de regresión se utiliza para cuantificar la relación entre una o más variables predictoras y una variable de respuesta .

El tipo más común de análisis de regresión es la regresión lineal simple , que se usa cuando una variable predictora y una variable de respuesta tienen una relación lineal.

Relación lineal entre dos variables

Sin embargo, a veces la relación entre una variable predictora y una variable de respuesta no es lineal.

Ejemplo de relación cuadrática

Ejemplo de relación cúbica

En estos casos, tiene sentido utilizar la regresión polinomial , que puede explicar la relación no lineal entre las variables.

Este tutorial proporciona un ejemplo paso a paso de cómo realizar una regresión polinomial en Google Sheets

Paso 1: crear los datos

Primero, creemos un conjunto de datos falso con los siguientes valores:

Paso 2: crear un diagrama de dispersión

A continuación, crearemos un diagrama de dispersión para visualizar los datos.

Primero, resalte las celdas A2: B11 de la siguiente manera:

A continuación, haga clic en la pestaña Insertar y luego haga clic en Gráfico en el menú desplegable:

De forma predeterminada, Google Sheets insertará un diagrama de dispersión:

Paso 3: Encuentre la ecuación de regresión polinomial

A continuación, haga doble clic en cualquier lugar del diagrama de dispersión para abrir la ventana del editor de gráficos a la derecha:

A continuación, haga clic en Serie . Luego, desplácese hacia abajo y marque la casilla junto a Trendline y cambie el Tipo a Polynomial . Para Etiqueta, elija Usar ecuación y luego marque la casilla junto a Mostrar R 2 .

Esto hará que la siguiente fórmula se muestre encima del diagrama de dispersión:

Regresión polinomial en Google Sheets

Podemos ver que la ecuación de regresión polinomial ajustada es:

y = 9,45 + 2,1x – 0,0188x 2

El R cuadrado de este modelo es 0,718 .

Recuerde que R-cuadrado nos dice el porcentaje de variación en la variable de respuesta que puede ser explicado por las variables predictoras. Cuanto mayor sea el valor, mejor será el modelo.

A continuación, cambie el grado de polinomio a 3 en el editor de gráficos:

Cambiar el grado del polinomio en Google Sheets

Esto hará que la siguiente fórmula se muestre encima del diagrama de dispersión:

Regresión cúbica en Google Sheets

Esto hace que la ecuación de regresión polinomial ajustada cambie a:

y = 37,2 – 14,2x + 2,64x 2 – 0,126x 3

El R cuadrado de este modelo es 0,976 .

Observe que el R-cuadrado para este modelo es significativamente más alto que el modelo de regresión polinomial con un grado de 2. Esto sugiere que este modelo de regresión es significativamente mejor para capturar la tendencia en los datos subyacentes.

Si cambia el grado del polinomio a 4, el R-cuadrado aumenta apenas a 0,981 . Esto sugiere que un modelo de regresión polinomial con un grado de 3 es suficiente para capturar la tendencia de estos datos.

Podemos usar la ecuación de regresión ajustada para encontrar el valor esperado para la variable de respuesta en base a un valor dado para la variable predictora. Por ejemplo, si x = 4, el valor esperado para y sería:

y = 37,2 – 14,2 (4) + 2,64 (4) 2 – 0,126 (4) 3 = 14,576

Puede encontrar más tutoriales de Google Sheets en esta página .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

A menudo, es posible que desee calcular el promedio de valores en varias columnas en R. Afortunadamente, esto es fácil…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!