Таблица коэффициентов не отображает результаты для обеих независимых переменных после запуска GEE

У меня тут простой вопрос. Я использую пакет gee для запуска регрессии gee по приведенным ниже данным. Я использовал тот же набор данных в spss и взял эту таблицу в качестве результата.

введите здесь описание изображения

набор данных

round<-c( 0.125150,  0.045800, -0.955299, -0.232007,  0.120880, -0.041525,  0.290473, -0.648752,  0.113264, -0.403685)
    square<-c(-0.634753,  0.000492, -0.178591, -0.202462, -0.592054, -0.583173, -0.632375, -0.176673, -0.680557, -0.062127)
    ideo<-c(0,1,0,1,0,1,0,0,1,1)
    ex<-data.frame(round,square,ideo)

Когда я запускаю тот же анализ в r

library(gee)  
    exmen<-summary(gee(round ~ square,
                        data = ex, id = ideo,
                        corstr = "independence"))
    exmen

Я получил:

Coefficients:
            Estimate Naive S.E. Naive z Robust S.E. Robust z
(Intercept)   -0.510      0.181   -2.82       0.229    -2.23
square        -0.939      0.399   -2.36       0.404    -2.32

То же самое происходит с пакетом geepack

library(geepack)
    exmen<-summary(geeglm(round ~ square,
                        data = ex, id = ideo,
                        corstr = "independence"))
    exmen

 Coefficients:
            Estimate Std.err Wald Pr(>|W|)  
(Intercept)   -0.510   0.229 4.95    0.026 *
square        -0.939   0.404 5.40    0.020 *
---

Поэтому мне интересно 2 вещи. 1. Почему я получаю результаты только для квадрата? 2.(опционально) Можно ли воссоздать точно такую ​​же таблицу с gee или geepack как с spss?


person firmo23    schedule 26.07.2018    source источник


Ответы (1)


Потому что вы указали квадрат как единственную независимую переменную. Зависимая переменная LeftvsRight не существует в R. При ее добавлении укажите модель следующим образом:

gee(LeftvsRight ~ square + round,data = ex, id = ideo,
                    corstr = "independence")
person papgeo    schedule 26.07.2018
comment
Он должен совпадать с идентификатором (идео). Имеет ли это смысл? - person firmo23; 26.07.2018
comment
В идео я вижу 0 и 1. Это указывает на то, что наблюдения производятся на 2 независимых кластерах, один из которых идентифицируется нулями, а другой - единицами. В руководстве сказано, что id — это вектор, который идентифицирует кластеры. В нем также говорится, что: предполагается, что данные отсортированы таким образом, что наблюдения в кластере представляют собой непрерывные строки для всех объектов в формуле [Однако ideo не отсортировано]. Кроме того, если в данных есть зависимость, corstr = независимость не имеет особого смысла. corstr = unstructured имеет больше смысла, хотя это зависит от проблемы. Введите ?gee, чтобы увидеть больше вариантов. ХТН - person papgeo; 26.07.2018
comment
Я не могу сказать, какие параметры использовались в spss из вывода. - person papgeo; 26.07.2018
comment
Я уже проверил корреляцию в исходном наборе данных, поэтому использовал независимость. - person firmo23; 26.07.2018
comment
В любом случае, это работает с независимостью, я жду, найду ли я ответ на дополнительный вопрос, который я задал, или я приму ваш ответ. - person firmo23; 26.07.2018
comment
Что касается необязательного вопроса, мне как минимум понадобятся варианты, которые вы использовали в spss. В целом, я думаю, что R намного шире, чем SPSS, и поэтому я считаю, что это должно быть возможно. - person papgeo; 26.07.2018
comment
Насколько близко или далеко находятся коэффициенты на данный момент? - person papgeo; 26.07.2018