Cómo crear subconjuntos por rango de fechas en R (con ejemplos)

La forma más fácil de crear subconjuntos de un marco de datos por un rango de fechas en R es usar la siguiente sintaxis:

df [df $ date > = " alguna fecha " & df $ date <= " alguna fecha ",]

Este tutorial proporciona varios ejemplos de cómo utilizar esta función en la práctica.

Ejemplo 1: subconjunto entre dos fechas

El siguiente código muestra cómo seleccionar las filas de un marco de datos que se encuentran entre dos fechas, inclusive:

#Haga que este ejemplo sea reproducible
 set.seed (0)

#create data frame
 df <- data.frame (date = as . Date (" 2021-01-01 ") - 0:19,
                 ventas = runif (20, 10, 500) + seq (50, 69) ^ 2)

#ver las primeras seis filas
cabeza (df)

        ventas de fecha
1 2021-01-01 2949.382
2 2020-12-31 2741.099
3 2020-12-30 2896.341
4 2020-12-29 3099.698
5 2020-12-28 3371.022
6 2020-12-27 3133.824

#subconjunto entre dos fechas, inclusive 
df [df $ date > = " 2020-12-25 " & df $ date <= " 2020-12-28 ",]

        ventas de fecha
5 2020-12-28 3371.022
6 2020-12-27 3133.824
7 2020-12-26 3586.211
8 2020-12-25 3721.891

Solo necesita modificar los signos mayor y menor que para seleccionar las filas que caen entre dos fechas, exclusivo:

#Haga que este ejemplo sea reproducible
 set.seed (0)

#create data frame
 df <- data.frame (date = as . Date (" 2021-01-01 ") - 0:19,
                 ventas = runif (20, 10, 500) + seq (50, 69) ^ 2)

#subconjunto entre dos fechas, exclusivo 
df [df $ date > " 2020-12-25 " & df $ date < " 2020-12-28 ",]

        ventas de fecha
6 2020-12-27 3133.824
7 2020-12-26 3586.211

Ejemplo 2: subconjunto después de una fecha determinada

El siguiente código muestra cómo seleccionar las filas de un marco de datos que ocurren después de una fecha determinada:

#Haga que este ejemplo sea reproducible
 set.seed (0)

#create data frame
 df <- data.frame (date = as . Date (" 2021-01-01 ") - 0:19,
                 ventas = runif (20, 10, 500) + seq (50, 69) ^ 2)

#subconjunto después de una fecha determinada 
df [df $ date > = " 2020-12-22 ",]

         ventas de fecha
1 2021-01-01 2949.382
2 2020-12-31 2741.099
3 2020-12-30 2896.341
4 2020-12-29 3099.698
5 2020-12-28 3371.022
6 2020-12-27 3133.824
7 2020-12-26 3586.211
8 2020-12-25 3721.891
9 2020-12-24 3697.791
10 2020-12-23 3799.266
11 2020-12-22 3640.275

Ejemplo 3: subconjunto antes de una fecha determinada

El siguiente código muestra cómo seleccionar las filas de un marco de datos que ocurren antes de una fecha determinada:

#Haga que este ejemplo sea reproducible
 set.seed (0)

#create data frame
 df <- data.frame (date = as . Date (" 2021-01-01 ") - 0:19,
                 ventas = runif (20, 10, 500) + seq (50, 69) ^ 2)

#subconjunto antes de una fecha determinada 
df [df $ date < " 2020-12-22 ",]

         ventas de fecha
12 2020-12-21 3831.928
13 2020-12-20 3940.513
14 2020-12-19 4315.641
15 2020-12-18 4294.211
16 2020-12-17 4612.222
17 2020-12-16 4609.873
18 2020-12-15 4850.633
19 2020-12-14 5120.034
20 2020-12-13 4957.217

Recursos adicionales

Cómo trazar una serie de tiempo en R
Cómo extraer el año de la fecha en R
Cómo agregar datos diarios a mensuales y anuales en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La distancia de Cook se utiliza para identificar observaciones influyentes en un modelo de regresión. La fórmula para la distancia…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!