Матрица ковариации оцененных параметрических коэффициентов и оцененных параметров сглаживания в GAM (пакет: mgcv)?

Рассмотрим приведенный ниже код для соответствия обобщенной аддитивной модели, включающей два члена x0, который является линейным, и x1, который является нелинейным:

library(mgcv)
set.seed(2) ## simulate some data...
dat <- gamSim(1,n=400,dist="normal",scale=2, method="REML")
b <- gam(y~x1+s(x2, k=5),data=dat)

Модель b оценивает 3 параметра: точку пересечения, один параметрический коэффициент для x1 и один параметр сглаживания для x2. Как я могу извлечь оценочную матрицу ковариации этих трех параметров? Я использовал vcov(b), который дает следующие результаты:

             (Intercept)           x0      s(x1).1      s(x1).2      s(x1).3      s(x1).4
(Intercept)  0.104672470 -0.155791753  0.002356237  0.001136459  0.001611635  0.001522158
x0          -0.155791753  0.322528093 -0.004878003 -0.002352757 -0.003336490 -0.003151250
s(x1).1      0.002356237 -0.004878003  0.178914602  0.047701707  0.078393786  0.165195739
s(x1).2      0.001136459 -0.002352757  0.047701707  0.479869768  0.606310668  0.010704075
s(x1).3      0.001611635 -0.003336490  0.078393786  0.606310668  0.933905535  0.025816649
s(x1).4      0.001522158 -0.003151250  0.165195739  0.010704075  0.025816649  0.184471259

Кажется, что vcov(b) дает ковариацию, относящуюся к каждому узлу гладкого члена s(x1), поскольку результаты содержат s(x1).1, s(x1).2, s(x1).3, s(x1).4 (это то, что я думаю). Мне нужна ковариация между предполагаемым параметром сглаживания и другими параметрическими коэффициентами, которые должны быть только одним для (Intercept) и только одним для x0. Это вообще доступно?

Изменить: я установил метод оценки REML в коде. Я согласен с тем, что я мог использовать неправильные фразы, чтобы объяснить свою идею, как сказал Гэвин Симпсон, и я понимаю все, что он сказал. Однако идея вычисления ковариации между параметрическими коэффициентами (точка пересечения и коэффициент x1) и их параметром сглаживания исходит из метода оценки. Если мы установим его в ML или REML, то, я думаю, может быть ковариация. В этом случае оценочная ковариационная матрица для оценок параметров логарифмического сглаживания предоставляется sp.vcov. Поэтому я думаю, что такое значение может существовать аналогично для параметрических коэффициентов и параметра сглаживания.


person M. Er    schedule 17.09.2017    source источник
comment
Я не думаю, что ты сможешь это понять; как я уже сказал, оценки параметров и их ковариационная матрица условны от значения параметра (ов) гладкости. Т.е. значение параметра гладкости считается фиксированным и известным. Вы можете учесть эффект выбора параметра (ов) сглаживания (unconditional = TRUE), но вы не можете включить это значение в vcov, поскольку оно все еще фиксировано и известно. Вы можете делать то, что хотите, с полностью байесовской реализацией модели, где параметры сглаживания связаны с параметрами дисперсии смешанной модели.   -  person Gavin Simpson    schedule 23.09.2017


Ответы (1)


Ваше заявление

Модель b оценивает 3 параметра: точку пересечения, один параметрический коэффициент для x1 и один параметр сглаживания для x2.

это неверно.

Модель оценивает гораздо больше коэффициентов, чем эти три. Также обратите внимание на то, что говорить о параметре сглаживания для x2 сбивает с толку, поскольку модель также оценивает один из них, но я сомневаюсь, что вы имеете в виду именно это. Параметр сглаживания, оцененный для x2, - это значение, которое контролирует волнистость подобранного сплайна. Он также оценивается вместе с другими коэффициентами, которые вы видите, хотя он обычно не рассматривается как часть основных оценочных параметров модели, потому что то, что вы видите в VCOV, на самом деле является дисперсией и ковариацией коэффициентов модели условным при этом значении параметра гладкости.

Подходящий здесь GAM - это тот, в котором эффект x2 представлен расширением базиса сплайна x2. Для используемого базиса и ограничений идентифицируемости, примененных к нему, это означает, что истинный эффект x2, f(x2) оценивается с помощью k-1 базисных функций. Это функция hat(f(x2)) = \sum \beta_i b_i(x2), оцененная путем суммирования взвешенных (по beta_i, коэффициентов модели для i-й базисной функции, b) базисных функций, оцененных при наблюдаемых значениях x2 (b_i(x2)).

Следовательно, как только базис выбран и когда у нас есть параметр гладкости (моя версия, тот, который контролирует волнистость), эта модель представляет собой просто GLM с x1 и четырьмя базовыми функциями, оцененными как x2. Следовательно, он параметрический, и в VCOV нет ни одного элемента, относящегося к гладкому f(x2) - модель просто так не работает.

person Gavin Simpson    schedule 20.09.2017
comment
Мой комментарий слишком длинный, чтобы оставлять его здесь, поэтому я добавил его как правку в свой вопрос. - person M. Er; 21.09.2017