Cómo eliminar la tendencia de los datos (con ejemplos)

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

“Detender” los datos de series de tiempo significa eliminar una tendencia subyacente en los datos. La razón principal por la que quisiéramos hacer esto es para ver más fácilmente las subtendencias en los datos que son estacionales o cíclicas.

Por ejemplo, considere los siguientes datos de series de tiempo que representan las ventas totales de alguna empresa durante 20 períodos consecutivos:

Detendencia de datos de series de tiempo

Claramente, las ventas tienen una tendencia al alza con el tiempo, pero también parece haber una tendencia cíclica o estacional en los datos, que se puede ver en las pequeñas “colinas” que ocurren con el tiempo.

Para obtener una mejor visión de esta tendencia cíclica, podemos reducir la tendencia de los datos. En este caso, esto implicaría eliminar la tendencia general al alza a lo largo del tiempo para que los datos resultantes representen solo la tendencia cíclica.

Ejemplo de datos de series temporales de eliminación de tendencia

Hay dos métodos comunes que se utilizan para eliminar la tendencia de los datos de series de tiempo:

1. Reducir la tendencia por diferenciación

2. Reducir la tendencia por ajuste del modelo

Este tutorial proporciona una breve explicación de cada método.

Método 1: Detrend por diferenciación

Una forma de eliminar la tendencia de los datos de series de tiempo es simplemente crear un nuevo conjunto de datos en el que cada observación sea la diferencia entre ella misma y la observación anterior.

Por ejemplo, la siguiente imagen muestra cómo utilizar la diferenciación para reducir la tendencia de una serie de datos.

Para obtener el primer valor de los datos de la serie de tiempo sin tendencia, calculamos 13 – 8 = 5. Luego, para obtener el siguiente valor, calculamos 18-13 = 5, y así sucesivamente.

Reducir la tendencia de los datos de series temporales mediante la diferenciación

El siguiente gráfico muestra los datos de la serie temporal original:

Detendencia de datos de series de tiempo

Y esta gráfica muestra los datos sin tendencia:

Ejemplo de datos de series temporales de eliminación de tendencia

Observe que es mucho más fácil ver la tendencia estacional en los datos de la serie temporal en este gráfico porque se ha eliminado la tendencia general al alza.

Método 2: Detrend por ajuste del modelo

Otra forma de eliminar la tendencia de los datos de series de tiempo es ajustar un modelo de regresión a los datos y luego calcular la diferencia entre los valores observados y los valores predichos del modelo.

Por ejemplo, supongamos que tenemos el mismo conjunto de datos:

Si ajustamos un modelo de regresión lineal simple a los datos, podemos obtener un valor predicho para cada observación en el conjunto de datos.

Luego podemos encontrar la diferencia entre el valor real y el valor predicho para cada observación. Estas diferencias representan los datos sin tendencia.

Detendencia de datos por ajuste de modelo

Si creamos una gráfica de los datos sin tendencia, podemos visualizar la tendencia estacional o cíclica en los datos mucho más fácilmente:

Tenga en cuenta que usamos la regresión lineal en este ejemplo, pero es posible usar un método más complejo como la regresión exponencial si hay más de una tendencia de aumento o disminución exponencial en los datos.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Supongamos que tenemos el siguiente marco de datos en R: #create marco de datos df <- data.frame (equipo = c…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!