Как рассчитать срок взаимодействия как отношение шансов в логистической регрессии?

Я использую логистическую регрессию с фиксированными эффектами в R, используя функцию glm. Я прочитал кое-что об интерпретации терминов взаимодействия в обобщенных линейных моделях. При использовании логарифма шансов модель является линейной, и член (ы) взаимодействия можно интерпретировать так же, как регрессию OLS. Когда коэффициенты возводятся в степень в отношения шансов, это уже не так. Поскольку моя аудитория более знакома с отношениями шансов, я хотел бы сообщать о своих результатах, используя эту метрику.

Есть ли готовый способ вычисления условий взаимодействия как отношения шансов с использованием R? Если нет, может ли кто-нибудь объяснить мне, как это должно быть сделано?

Изменить 1: я привожу воспроизводимый пример ниже.

set.seed(1234)

dat <- data.frame(
    Y = factor(round(runif(60))),
    x1 = rnorm(60, 10, 3),
    sex = sample(c("male", "female"), size = 60, prob = c(.4, .6), replace = TRUE),
    population = sample(c("France", "Kenya", "Thailand"), size = 60, prob = c(.3, .45, .25), replace = TRUE)
    )

fm1 <- glm(Y ~ x1 + sex * population, family = binomial(link = "logit"), data = dat)
summary(fm1)

# odds ratios
exp(coef(fm1))

Изменить 2: дополнительные пояснения.

Мотивация, стоящая за моим вопросом, исходит из следующего объяснения взаимодействий логистической регрессии со статистического сайта UCLA:

http://www.ats.ucla.edu/stat/stata/seminars/interaction_sem/interaction_sem.htm

Насколько я понимаю, читая это, я понимаю, что интерпретация терминов взаимодействия, которые были преобразованы либо в отношения шансов, либо в вероятности, не такая же, как для тех же терминов в логарифмических единицах шансов. Думаю, я пытаюсь понять, нужно ли мне просто изменить мою интерпретацию термина взаимодействия при преобразовании в отношения шансов или мне нужно выполнить некоторые вычисления в дополнение к возведению в степень?


person Chris    schedule 23.06.2014    source источник
comment
Рассмотрите возможность включения небольшого воспроизводимого примера, чтобы мы могли лучше понять и легче ответить на ваш вопрос.   -  person Ben Bolker    schedule 23.06.2014
comment
Вы спрашиваете, как возвести в степень коэффициенты?   -  person rawr    schedule 23.06.2014
comment
@rawr Нет, я понимаю, что экспоненциальные коэффициенты для условий взаимодействия не могут интерпретироваться так же, как условия взаимодействия в OLS (тогда как коэффициенты в логарифмических коэффициентах могут). Я пытаюсь правильно рассчитать условия взаимодействия в соотношении шансов.   -  person Chris    schedule 23.06.2014
comment
p/q = product of exp(beta_i), где бета-версии - это коэффициенты линейного предиктора эта (это не зависит от того, исходят ли бета-версии из условия взаимодействия или нет).   -  person James King    schedule 23.06.2014
comment
@ user3114046, вы хотите сказать, что это не проблема? Экспоненциальный член взаимодействия в приведенной выше модели обеспечит эффект разницы в разнице в шансах между sex и population?   -  person Chris    schedule 23.06.2014
comment
Я просмотрел вашу ссылку несколько минут и не могу понять, о чем говорит автор. Возможно, вам повезет больше на stats.stackexchange.com.   -  person James King    schedule 23.06.2014


Ответы (1)


Если вы говорите об интерпретации вывода glm() и остаетесь на шкале логарифма шансов, то это в точности аналогично тому, как вы интерпретировали бы вывод lm(). В обоих случаях лучше говорить о прогнозах, чем пытаться интерпретировать коэффициенты по отдельности. Когда вы просите «заранее приготовленный способ вычисления условий взаимодействия как отношения шансов с использованием R», не совсем ясно, что вы действительно запрашиваете. Знаете ли вы такой «заранее приготовленный способ расчета условий взаимодействия» для lm() выходных данных модели?

В учебном пособии UCLA говорится, что вы должны попросить метод рассмотрения вероятностей, и в функциях регрессии R ответ будет «предсказать»:

?predict.glm

Это набор суммы линейных предикторов, то есть суммы перехвата и коэффициентов для лиц с уникальными комбинациями категориальных характеристик в выборочном среднем для x1 в этом наборе данных:

> data.frame( expand.grid(sex=unique(dat$sex), population=unique(dat$population)), x1=mean(dat$x1))
     sex population       x1
1 female      Kenya 9.380473
2   male      Kenya 9.380473
3 female     France 9.380473
4   male     France 9.380473
5 female   Thailand 9.380473
6   male   Thailand 9.380473
> predict( fm1, newdata=data.frame( expand.grid(sex=unique(dat$sex), population=unique(dat$population)), x1=mean(dat$x1)))
         1          2          3          4          5          6 
-0.1548962  0.4757249 -0.5963092 -0.3471242  0.8477717  0.2029501 

Их можно возводить в степень, если желательны отношения шансов, но тогда вы должны знать, что находится в знаменателе для отношений шансов. И это вероятности (полученные с помощью type = 'response'):

> predict( fm1, newdata=data.frame( expand.grid(sex=unique(dat$sex), population=unique(dat$population)), x1=mean(dat$x1)), type="response")
        1         2         3         4         5         6 
0.4613532 0.6167379 0.3551885 0.4140800 0.7000995 0.5505641 
person IRTFM    schedule 23.06.2014
comment
Спасибо, это определенно помогает. Думаю, я все еще не понимаю, как мне узнать, каков знаменатель для отношений шансов в приведенном выше примере (если бы первый набор прогнозируемых значений был возведен в степень)? Если я использую exp(coef(fm1)), коэффициент 1,46 для sexmale:populationKenya говорит мне (я думаю), что разница в разнице между мужчинами и женщинами во Франции и Кении составляет 46%. Я не получаю того же значения из прогнозов отношения шансов (1,61 - 0,86) - (0,71 - 0,55) = 0,59 - person Chris; 24.06.2014
comment
Верно. Базовый уровень (для коэффициентов) - это среднее значение x1 в эталонной категории или категориях составных факторов, в данном случае женщины: Франция из-за лексического упорядочения уровней факторов по умолчанию. - person IRTFM; 24.06.2014
comment
Для меня имеет смысл эта женщина: Франция будет базовым показателем по умолчанию. Я все еще не понимаю, как эта базовая линия [exp (-0,596) = 0,551] соотносится с другими отношениями шансов? Мне нужно выполнить какое-то преобразование? - person Chris; 24.06.2014