Полиномиальная регрессия Stata - тест Вальда после оценки

Я провел полиномиальный логистический регрессионный анализ в Stata, за которым последовал тест Вальда, и надеялся, что кто-нибудь подтвердит, что мой код делает то, что я думаю.

NB: для иллюстрации я использую некоторые примеры данных Stata. Анализ, который я выполняю для этой иллюстрации, совершенно бессмысленен, но использует ту же процедуру, что и мой «реальный» анализ, за ​​исключением того факта, что мой реальный анализ также включает некоторые весовые коэффициенты вероятности и другие ковариаты.

sysuse auto.dta

Во-первых, я запускаю полиномиальную логистическую регрессию, предсказывая «Запись ремонта» на основе «Иностранный» и «Цена»:

mlogit rep78 i.foreign price, base(1) rrr nolog

Multinomial logistic regression                 Number of obs     =         69
                                                LR chi2(8)        =      31.15
                                                Prob > chi2       =     0.0001
Log likelihood = -78.116372                     Pseudo R2         =     0.1662

------------------------------------------------------------------------------
       rep78 |        RRR   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
1            |  (base outcome)
-------------+----------------------------------------------------------------
2            |
     foreign |
    Foreign  |   .7822853   1672.371    -0.00   1.000            0           .
       price |   1.000414   .0007027     0.59   0.556     .9990375    1.001792
       _cons |   .5000195   1.669979    -0.21   0.836      .000718    348.2204
-------------+----------------------------------------------------------------
3            |
     foreign |
    Foreign  |     686842   1.30e+09     0.01   0.994            0           .
       price |   1.000462   .0006955     0.66   0.507     .9990996    1.001826
       _cons |   1.254303   4.106511     0.07   0.945     .0020494    767.6863
-------------+----------------------------------------------------------------
4            |
     foreign |
    Foreign  |    6177800   1.17e+10     0.01   0.993            0           .
       price |   1.000421   .0006999     0.60   0.547     .9990504    1.001794
       _cons |   .5379627     1.7848    -0.19   0.852     .0008067    358.7452
-------------+----------------------------------------------------------------
5            |
     foreign |
    Foreign  |   2.79e+07   5.29e+10     0.01   0.993            0           .
       price |   1.000386   .0007125     0.54   0.587     .9989911    1.001784
       _cons |    .146745   .5072292    -0.56   0.579     .0001676    128.4611
------------------------------------------------------------------------------

Во-вторых, я хочу знать, значительно ли отличается коэффициент «Иностранный» для категории исхода 4 от коэффициента «Иностранный» для категории исхода 5. Итак, я запускаю тест Вальда:

test [4]1.foreign = [5]1.foreign

 ( 1)  [4]1.foreign - [5]1.foreign = 0

           chi2(  1) =    2.72
         Prob > chi2 =    0.0988

Из этого я делаю вывод, что коэффициент «Чужой» для категории исхода 4 НЕ отличается существенно от коэффициента «Чужой» для категории исхода 5. Проще говоря, связь между «Иностранным» и «Ремонтом 4» (по сравнению с «Ремонтом 4»). 1') соответствует ассоциации между "Иностранным" и "Ремонтом 5" (по сравнению с "Ремонтом 1").

Верен ли мой код для теста Вальда и мои выводы о том, что он делает и показывает?


person Alice    schedule 11.11.2020    source источник
comment
Тест Вальда заключает, что, основываясь на произвольном альфа 0,05, нет никаких доказательств разницы между двумя эффектами. Однако отсутствие доказательств различия между эффектами не эквивалентно доказательству того, что эффекты одинаковы. Проверьте Greenland et al. (2016) Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations для хорошего обзора.   -  person Cybernike    schedule 12.11.2020
comment
Спасибо, да, я согласен, я был несколько неосторожен в том, как я выразил свои интерпретации в отношении проверки нулевой гипотезы. Но правильный ли код?   -  person Alice    schedule 12.11.2020
comment
Да, код действительно подходит для выполнения теста Вальда.   -  person Álvaro A. Gutiérrez-Vargas    schedule 12.11.2020


Ответы (1)


В дополнение к тому, что обсуждалось в комментариях, вы также можете выполнить тест отношения правдоподобия, используя следующий код.

sysuse auto.dta

qui mlogit rep78 i.foreign price, base(1) rrr nolog 
estimate store unrestricted

constraint 1 [4]1.foreign = [5]1.foreign

qui mlogit rep78 i.foreign price, base(1) rrr nolog constraints(1)
estimate store restricted

lrtest unrestricted restricted

Результат теста показывает тот же вывод, что и тест Вальда, но имеет лучшие свойства, как объяснено ниже.

Likelihood-ratio test                                 LR chi2(1)  =      3.13
(Assumption: restricted nested in unrestricted)       Prob > chi2 =    0.0771

Цитирование официальной документации от mlogit

Результаты, полученные с помощью test, являются приближением, основанным на оценочной ковариационной матрице коэффициентов. Поскольку вероятность незастрахованности низка, логарифмическая вероятность может быть нелинейной для незастрахованных. Традиционная статистическая мудрость состоит в том, чтобы не доверять асимптотическому ответу в этих обстоятельствах, а вместо этого выполнять тест отношения правдоподобия.

person Álvaro A. Gutiérrez-Vargas    schedule 12.11.2020
comment
Спасибо за это предложение! Мой анализ включает некоторые веса вероятности, и когда я попробовал это, Stata выдала следующую ошибку: LR test likely invalid for models with robust vce. Есть ли у вас какие-либо дополнительные предложения? Если тест Вальда не является полностью «заслуживающим доверия», значит ли это, что я тоже не могу его выполнить? - person Alice; 17.11.2020
comment
Это интересная проблема, которая возникает время от времени. Действительно, нас так часто спрашивают, что StataCorp предоставила официальное объяснение, которое вы можете найти здесь. Короче говоря, происходит то, что при кластеризации или использовании весов наблюдения перестают быть независимыми, поэтому это не является истинной вероятностью. В таких случаях предпочтение следует отдавать тестам Вальда. Это решает твой вопрос @Alice? - person Álvaro A. Gutiérrez-Vargas; 18.11.2020