Инициализация прогноза с помощью пакета fable

Предположим, я оцениваю с помощью пакета fable следующую модель, используя ежедневные данные за 2019 год, где x - экзогенная независимая переменная. Термины pdq(p = 1, d = 0, q = 0) и PDQ(P = 0, D = 0, Q = 0) означают, что это авторегрессивная модель.

library(tidyverse)
library(fable)

load(file, "Some data.RData")

fit <- dta_2019 %>%
  tsibble() %>%
  model(ar = ARIMA(y ~ x + pdq(p = 1, d = 0, q = 0) + PDQ(P = 0, D = 0, Q = 0)))

Теперь мне нужно использовать эту модель для прогнозирования ежедневных данных на 2020 год, но предположим, что данные начнутся в феврале 2020 года.

forecast_2020 <- fit %>%
  forecast(new_data = tsibble(dta_2020))

Насколько я понимаю, значение запаздывания y для прогноза, которое требуется, учитывая, что это авторегрессивная модель, будет последним значением, наблюдаемым в наборе данных оценки (dta_2019). Могу ли я инициализировать значение y чем-нибудь другим? Я попытался включить строку в dta_2020, которая в данном конкретном примере содержит наблюдение за 31 января, но это приводит к тому, что прогноз начинается 31 января.


person Seb_ISU    schedule 17.02.2020    source источник


Ответы (1)


Для модели ARIMA (с использованием fable::ARIMA()) вам также потребуется сделать прогноз на январь 2020 года, чтобы получить интересующие прогнозы на февраль 2020 года. Если экзогенный регрессор доступен для обоих месяцев, тогда прогнозы могут быть рассчитаны. Предоставление будущих значений вашего экзогенного регрессора x требуется, но будущие значения y не нужны для прогнозирования.

person Mitchell O'Hara-Wild    schedule 26.02.2020