У меня есть фрейм данных с переменными subject
, wd
и group
и переменная ответа value
. Каждый испытуемый разделен на одну группу, и каждый будний день выполняет 7 измерений. Поскольку каждый субъект полностью вложен в группу, я хочу использовать модель вложенных случайных эффектов с subject
и group
, а также добавить третий случайный эффект для wd
. В настоящее время я использую это для этого:
model = lmer(value ~ 1+ (1|wd) + (1|group) + (1|subject),
data = dframe, REML = 0)
Я нашел код, на котором основано это, на странице 40 этого руководства а>. Я использовал и REML = TRUE
, и REML = 0
. Однако когда я использую VarCorr(model)$variances
, я получаю
Groups Name Std.Dev.
subject (Intercept) 94.9534363
wd (Intercept) 42.5931401
group (Intercept) 0.0015608
Residual 0.9589836
Эта групповая дисперсия конфликтует с кодом, который я использовал для генерации данных, который имеет групповые средние 36,9, 28,78 и -15,269. Когда я смотрю на «остатки» для предсказанных случайных эффектов (с использованием ranef
) по сравнению с истинными случайными эффектами, я получаю остатки с очень высокой корреляцией с группой, в которой они находятся (если бы я моделировал residuals ~ group
, значение R-квадрата было бы более 0,9 ).
Как правильно подогнать вложенную модель случайных эффектов в R? Я предпочитаю использовать lme4, но подойдет любой пакет.
Вот код, который я использовал для генерации данных:
library(dplyr)
generate_data <- function(n = 10, g = 3, seed = 1, mean.overall = 300,
sigma.g = 50, sigma.wd = 50,
sigma.subject = 100, sigma. = 30) {
set.seed(seed)
means.wd = rnorm(7) * sigma.wd
means.g = rnorm(g) * sigma.g
means.subject = rnorm(n*g) * sigma.subject
dframe = data.frame(subject = rep(1:(g*n), each = 7),
wd = rep(1:7, g*n),
group = rep(1:g, each = (7*n)))
dframe = mutate(dframe,
value = mean.overall + means.wd[wd] +
means.subject[subject] + means.g[group] + rnorm(7*g*n),
subject = factor(subject, levels = 1:(n*g)),
wd = factor(wd),
group = factor(group, levels = 1:g))
dframe$value = round(pmax(5,dframe$value))
truefx = list(wd = means.wd, group = means.g,
subject = means.subject)
list(data = dframe, effects = truefx)
}
dframe = generate_data()$data