katakanlah saya memiliki kumpulan data sederhana yang disebut data:
customer_id <- c("1","1","1","2","2","2","2","3","3","3")
account_id <- as.character(c(11,11,11,55,55,55,55,38,38,38))
obs_date <- c(as.Date("2017-01-01","%Y-%m-%d"), as.Date("2017-02-01","%Y-%m-%d"), as.Date("2017-03-01","%Y-%m-%d"),
as.Date("2017-12-01","%Y-%m-%d"), as.Date("2018-01-01","%Y-%m-%d"), as.Date("2018-02-01","%Y-%m-%d"),
as.Date("2018-03-01","%Y-%m-%d"), as.Date("2018-04-01","%Y-%m-%d"), as.Date("2018-05-01","%Y-%m-%d"),
as.Date("2018-06-01","%Y-%m-%d"))
variable <- c(87,90,100,120,130,150,12,13,15,14)
data <- data.table(customer_id,account_id,obs_date,variable)
dan saya ingin menambahkan variabel lain yang disebut indikator, yang sama dengan 1 untuk pasangan id_pelanggan, id_akun yang memiliki variabel ‹= 90 untuk dua atau lebih tanggal pengamatan berturut-turut (tanggal_obs) dan nol sebaliknya. Oleh karena itu, indikatornya akan sama dengan 1 untuk pasangan id_pelanggan pertama dan ketiga, id_akun dan akan menjadi seperti:
indicator <- c(1,1,1,0,0,0,0,1,1,1)
data <- data.table(customer_id,account_id,obs_date,variable, indicator)
Apakah Anda punya ide bagaimana membuat variabel yang disebut indikator ini? Saya perlu mengelompokkan berdasarkan customer_id, account_id dan mengidentifikasi mereka yang memiliki variabel ‹= 90 untuk setidaknya dua periode waktu berturut-turut. Terima kasih banyak.