Cómo calcular RMSE en Python

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

El error cuadrático medio (RMSE) es una métrica que nos dice qué tan lejos están nuestros valores predichos de nuestros valores observados en un modelo, en promedio. Se calcula como:

RMSE = √ [Σ (P i – O i ) 2 / n]

dónde:

  • Σ es un símbolo elegante que significa «suma»
  • P i es el valor predicho para la i- ésima observación
  • O i es el valor observado para la i- ésima observación
  • n es el tamaño de la muestra

Este tutorial explica un método simple para calcular RMSE en Python.

Ejemplo: calcular RMSE en Python

Supongamos que tenemos las siguientes matrices de valores reales y pronosticados:

real = [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24]
pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]

Para calcular el RMSE entre los valores reales y predichos, simplemente podemos tomar la raíz cuadrada de la función mean_squared_error () de la biblioteca sklearn.metrics:

#importar las bibliotecas necesarias 
desde sklearn.metrics importar mean_squared_error
 desde math import sqrt

#calcular RMSE
 sqrt (mean_squared_error (actual, pred))

2.4324199198

El RMSE resulta ser 2.4324 .

Cómo interpretar RMSE

RMSE es una forma útil de ver qué tan bien un modelo puede ajustarse a un conjunto de datos. Cuanto mayor sea el RMSE, mayor será la diferencia entre los valores predichos y observados, lo que significa que peor se ajusta un modelo a los datos. Por el contrario, cuanto más pequeño sea el RMSE, mejor podrá un modelo ajustar los datos.

Puede ser particularmente útil comparar el RMSE de dos modelos diferentes entre sí para ver qué modelo se ajusta mejor a los datos.

Recursos adicionales

Calculadora RMSE
Cómo calcular el error cuadrático medio (MSE) en Python
Cómo calcular MAPE en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Para trazar una distribución de chi-cuadrado en Python, puede usar la siguiente sintaxis: # El eje x varía de 0…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!