Cómo realizar una regresión lineal simple en Excel

Actualizado el 26 de agosto de 2022, por Dereck Amesquita.

La regresión lineal simple es un método que podemos utilizar para comprender la relación entre una variable explicativa, x, y una variable de respuesta, y.

Este tutorial explica cómo realizar una regresión lineal simple en Excel.

Ejemplo: regresión lineal simple en Excel

Supongamos que estamos interesados ​​en comprender la relación entre la cantidad de horas que un estudiante estudia para un examen y la calificación del examen que recibe. Para explorar esta relación, podemos realizar una regresión lineal simple utilizando las horas estudiadas como variable explicativa y la puntuación del examen como variable de respuesta.

Realice los siguientes pasos en Excel para realizar una regresión lineal simple.

Paso 1: Ingrese los datos.

Ingrese los siguientes datos para el número de horas estudiadas y el puntaje del examen recibido para 20 estudiantes:

Datos brutos en Excel

Paso 2: Visualiza los datos.

Antes de realizar una regresión lineal simple, es útil crear un diagrama de dispersión de los datos para asegurarse de que realmente existe una relación lineal entre las horas estudiadas y la puntuación del examen.

Resalte los datos en las columnas A y B. A lo largo de la cinta superior en Excel, vaya a la pestaña Insertar . Dentro del grupo Gráficos , haga clic en Insertar dispersión (X, Y) y haga clic en la primera opción titulada Dispersión . Esto producirá automáticamente el siguiente diagrama de dispersión:

Diagrama de dispersión en Excel

El número de horas estudiadas se muestra en el eje xy los puntajes del examen se muestran en el eje y. Podemos ver que existe una relación lineal entre las dos variables: más horas estudiadas se asocian con puntajes más altos en los exámenes.

Para cuantificar la relación entre estas dos variables, podemos realizar una regresión lineal simple.

Paso 3: Realice una regresión lineal simple.

A lo largo de la cinta superior en Excel, vaya a la pestaña Datos y haga clic en Análisis de datos . Si no ve esta opción, primero debe instalar el paquete de herramientas de análisis gratuito .

Opción de análisis de datos en Excel

Una vez que haga clic en Análisis de datos, aparecerá una nueva ventana. Seleccione Regresión y haga clic en Aceptar.

Opción de regresión en el paquete de herramientas de análisis de datos de Excel

Para Input Y Range , complete la matriz de valores para la variable de respuesta. Para Input X Range , complete la matriz de valores para la variable explicativa. Marque la casilla junto a Etiquetas para que Excel sepa que incluimos los nombres de las variables en los rangos de entrada. Para Rango de salida , seleccione una celda donde le gustaría que aparezca la salida de la regresión. Luego haga clic en Aceptar .

Regresión en Excel

La siguiente salida aparecerá automáticamente:

Salida de regresión lineal simple en Excel

Paso 4: Interprete el resultado.

A continuación, se explica cómo interpretar los números más relevantes en la salida:

Cuadrado R: 0,7273 . Esto se conoce como coeficiente de determinación. Es la proporción de la varianza en la variable de respuesta que se puede explicar por la variable explicativa. En este ejemplo, el 72,73% de la variación en los puntajes del examen se puede explicar por el número de horas estudiadas.

Error estándar: 5.2805 . Esta es la distancia promedio que los valores observados caen desde la línea de regresión. En este ejemplo, los valores observados caen un promedio de 5.2805 unidades de la línea de regresión.

F: 47,9952 . Este es el estadístico F general para el modelo de regresión, calculado como MS de regresión / MS residual.

Significado F: 0,0000 . Este es el valor p asociado con el estadístico F general. Nos dice si el modelo de regresión es estadísticamente significativo o no. En otras palabras, nos dice si la variable explicativa tiene una asociación estadísticamente significativa con la variable de respuesta. En este caso, el valor p es menor que 0.05, lo que indica que existe una asociación estadísticamente significativa entre las horas estudiadas y la puntuación del examen recibida.

Coeficientes: Los coeficientes nos dan los números necesarios para escribir la ecuación de regresión estimada. En este ejemplo, la ecuación de regresión estimada es:

puntuación del examen = 67,16 + 5,2503 * (horas)

Interpretamos que el coeficiente de horas significa que por cada hora adicional estudiada, se espera que el puntaje del examen aumente en 5.2503 , en promedio. W e interpretar el coeficiente para el intercepto en el sentido de que la calificación del examen se esperaba para un estudiante que estudia las cero horas es 67,16 .

Podemos usar esta ecuación de regresión estimada para calcular el puntaje esperado del examen para un estudiante, en función de la cantidad de horas que estudian. Por ejemplo, se espera que un estudiante que estudia durante tres horas reciba una puntuación en el examen de 82,91 :

puntuación del examen = 67,16 + 5,2503 * (3) = 82,91

Recursos adicionales

Cómo crear una gráfica residual en Excel
Cómo construir un intervalo de predicción en Excel
Cómo crear una gráfica QQ en Excel

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Directo & CEO de Statologos LSI

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

Deja un comentario

Un intervalo de confianza para un coeficiente de correlación es un rango de valores que probablemente contenga un coeficiente de…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!