Скопируйте последнее значение за дневной период

У меня есть многодневный объект XTS, и я пытаюсь создать индикатор, который, однажды верный, остается верным до конца дня. Подход, который я пытаюсь (но он не работает), сочетает функцию na.locf с ежедневным применением:

output <- apply.daily(x, na.locf)

Воспроизводимый код:

y <- as.xts(c(NA,NA,1,NA,NA,NA,NA,NA,NA),as.POSIXct(c(
                                   "2010-01-05 00:00:00", "2010-01-05 00:04:00", "2010-01-05 00:08:00", 
                                   "2010-01-05 00:12:00", "2010-01-05 00:16:00", "2010-01-05 00:20:00",
                                   "2010-01-06 00:00:00", "2010-01-06 00:04:00", "2010-01-06 00:08:00")))

Желаемый результат - скопировать «1» до конца этого дня. так:

y <- as.xts(c(NA,NA,1,1,1,1,NA,NA,NA),as.POSIXct(c(
                                   "2010-01-05 00:00:00", "2010-01-05 00:04:00", "2010-01-05 00:08:00", 
                                   "2010-01-05 00:12:00", "2010-01-05 00:16:00", "2010-01-05 00:20:00",
                                   "2010-01-06 00:00:00", "2010-01-06 00:04:00", "2010-01-06 00:08:00")))

r xts
person Ed Wilson    schedule 12.05.2016    source источник


Ответы (2)


Один из вариантов

y1 <- ave(y, as.Date(index(y)), FUN= function(x) na.locf(x, na.rm=FALSE))
y1
#                      [,1]
#2010-01-05 00:00:00   NA
#2010-01-05 00:04:00   NA
#2010-01-05 00:08:00    1
#2010-01-05 00:12:00    1
#2010-01-05 00:16:00    1
#2010-01-05 00:20:00    1
#2010-01-06 00:00:00   NA
#2010-01-06 00:04:00   NA
#2010-01-06 00:08:00   NA

str(y1)
# An ‘xts’ object on 2010-01-05/2010-01-06 00:08:00 containing:
#  Data: num [1:9, 1] NA NA 1 1 1 1 NA NA NA
#  Indexed by objects of class: [POSIXct,POSIXt] TZ: 
#  Original class: 'double'  
# xts Attributes:  
# NULL

str(y)
#An ‘xts’ object on 2010-01-05/2010-01-06 00:08:00 containing:
#  Data: num [1:9, 1] NA NA 1 NA NA NA NA NA NA
#  Indexed by objects of class: [POSIXct,POSIXt] TZ: 
#  Original class: 'double'  
#  xts Attributes:  
# NULL
person akrun    schedule 12.05.2016
comment
Это прекрасно работает. Вы используете функцию ave только для подмножества? Или есть другая причина? - person Ed Wilson; 12.05.2016
comment
@EdWilson Функция ave используется для применения na.locf к каждой «Дате». - person akrun; 13.05.2016

Я думаю, что period.apply, вызванный apply.daily, не нравится значение, возвращаемое na.locf. Тщательно не исследовал почему. Во всяком случае, я попытался сделать то, что он должен делать, обходным путем. Я вижу, что ответ Акруна определенно лучше этого. Просто оставь это здесь.

R> y <- as.xts(c(NA,NA,1,NA,NA,NA,NA,NA,NA),
+             as.POSIXct(c("2010-01-05 00:00:00", "2010-01-05 00:04:00",
+                          "2010-01-05 00:08:00", "2010-01-05 00:12:00",
+                          "2010-01-05 00:16:00", "2010-01-05 00:20:00",
+                          "2010-01-06 00:00:00", "2010-01-06 00:04:00",
+                          "2010-01-06 00:08:00")))
R> endpoints(y, "days")
[1] 0 6 9
R> ep <- endpoints(y, "days")
R> diff(ep)
[1] 6 3
R> dep <- diff(ep)
R> rep.int(1:length(dep), times=dep)
[1] 1 1 1 1 1 1 2 2 2
R> runs <- rep.int(1:length(dep), times=dep)
R> lapply(split(y, runs), na.locf, na.rm=FALSE)
$`1`

2010-01-05 00:00:00 NA
2010-01-05 00:04:00 NA
2010-01-05 00:08:00  1
2010-01-05 00:12:00  1
2010-01-05 00:16:00  1
2010-01-05 00:20:00  1

$`2`

2010-01-06 00:00:00 NA
2010-01-06 00:04:00 NA
2010-01-06 00:08:00 NA

R> splits <- lapply(split(y, runs), na.locf, na.rm=FALSE)
R> do.call('rbind', splits)

2010-01-05 00:00:00 NA
2010-01-05 00:04:00 NA
2010-01-05 00:08:00  1
2010-01-05 00:12:00  1
2010-01-05 00:16:00  1
2010-01-05 00:20:00  1
2010-01-06 00:00:00 NA
2010-01-06 00:04:00 NA
2010-01-06 00:08:00 NA
R> ynew <- do.call('rbind', splits)
person asb    schedule 12.05.2016
comment
Этот подход является разумным и типичным xts подходом. Хотя можно было бы добиться полных результатов, просто используя do.call(rbind, lapply(split(y, "days"), na.locf)) - person FXQuantTrader; 27.10.2016