Я наблюдаю за сменой продавцов на распродаже выпечки, пытаясь понять, есть ли существенная разница между продажами продавцов в разные часы их смены. В частности, я пытаюсь оценить: а) является ли тенденция значимой между отдельными часами смены, и б) как она соотносится с несколькими другими потенциальными объясняющими переменными.
Набор данных содержит несколько смен на одного продавца одинаковой продолжительности, разделенных по часам.
E.g.
model = sm.MixedLM.from_formula("Cookies ~ C(Hour) + CustomerArrivals + Oventemp", BakeSaleData, groups=BakeSaleData["Salesperson"])
result = model.fit()
print(result.summary())
Кто-то, просматривавший мое исследование и обладавший значительно большим опытом в статистике, сказал мне, что в моей модели присутствует существенная автокорреляция, но мне непонятно, как ее компенсировать.
Я знаю, что в традиционном наборе данных временных рядов мы можем использовать AR (1) и Cochrane-Orcutt для учета условий автокорреляции, но эти расчеты временных рядов обычно выполняются для наборов данных, где есть один временной ряд.
cor(e_t, e_{t+1}) != 0
. В МЛМ мы предполагаем, что наблюдения внутри групп (в вашем случаеSalesperson
) коррелируютcor(e_{i,j}, e{i,k}) != 0)
, гдеj != k
. Или вы также пытаетесь контролировать коррелированные ошибки внутри смены? Не могли бы вы перефразировать/уточнить свой вопрос? - person Alex W   schedule 22.03.2017