У меня есть переменная результата x
и три независимые переменные a, b, c
, которые являются категориальными переменными. В моем примере a
имеет 8 уровней, b
имеет 4 уровня и c
имеет 35 уровней, но не все комбинации трех переменных имеют наблюдения (это, вероятно, неважно).
Если я запустил следующую аддитивную модель дисперсионного анализа в Stata
anova x a b c
adjust, by(a b) gen(y)
затем я получаю прогнозы переменной x
, скорректированные с помощью переменных a
и b
. Команда adjust выводит следующую таблицу в окне результатов, а также генерирует переменную y
с скорректированными прогнозами.
| b
a | 2 4 8 16
----------+-----------------------------------
50 | .016655 .018487
75 | .008286 .011237
100 | .005937 .006677 .012467
150 | .001905 .004038 .009454
200 | .001774 .003107 .007592 .010081
400 | .004982 .006853 .009342
800 | .002126 .00521
1000 | .002732 .005221
----------------------------------------------
Key: Linear Prediction
Моя проблема в том, что переменная y
имеет значение для каждой комбинации a, b
и c
, тогда как в приведенной выше таблице есть значения только для каждой комбинации a
и b
. Как мне сохранить результаты из таблицы, чтобы я мог с ними работать? Какая связь между значениями в таблице и значениями в y
?
Заранее спасибо.
Обновление: я нашел это в help adjust
:
Переменные, используемые в команде оценки, но не включенные ни в список переменных by (), ни в список регулируемых переменных, остаются в своих текущих значениях, наблюдение за наблюдением. Здесь adjust отображает средний оценочный прогноз (или соответствующую вероятность, или экспоненциальный прогноз), подставляя среднее значение этих неопределенных переменных в каждой группе, определенной переменными в опции by ().
Это верно и для моих данных. Например, если a=75
и b=2
, тогда c
принимает значения 12,13,14,15,16. Значение y
, соответствующее c=14
(которое является средним), в точности соответствует тому, что отображается в таблице. Но что, если среднее значение не является значением, которое оно принимает?
c
? Таблица ничего не оставляет в списке возврата, поэтому я думаю, что мне нужно использовать параметры генерации с настройкой. Но использование gen, как я сказал, оставляет только прогнозы для исходных значений. - person Stefan Hansen   schedule 16.01.2013margins
.adjust
по-прежнему работает, но был заменен наmargins
. (Если у вас устаревшая версия Stata, у вас не будетmargins
, но рекомендуется указать, какая версия у вас установлена, в сообщениях здесь.) - person Nick Cox   schedule 16.01.2013adjust, by(a b)
не дает такого же результата, какmargins a#b
. Разве не должно? - person Stefan Hansen   schedule 16.01.2013