Мне нужна помощь, чтобы понять, как работает функция coxph () в R, и как правильно интерпретировать вывод.
Я пытаюсь запустить модель пропорциональных рисков Кокса на наборе данных «анализа выживаемости» с двумя факторами: полом и генотипом. Фактор пола имеет две категориальные переменные: «m» для мужчин и «f» для женщин. Фактор генотипа имеет три категориальные переменные: «Ctrl», «nKO», «CRE_Ctrl». Я хочу увидеть, есть ли взаимодействие, поэтому я сделал:
library(survival)
Survival = Surv(time = D$Age, event = D$outcome) #D is my dataframe, Age is time of death, outcome is the column for censored individuals.
Кроме того, я хочу увидеть следующие контрасты: «nKO vs Ctrl» и «nKO vs CRE_Ctrl». Таким образом, я установил nKO в качестве базовой линии для моих контрастов, используя эту строку:
D$Genotype = relevel(D$Genotype, ref = "nKO")
colnames(contrasts(D$Genotype)) = c(' (nKO vs CRE_Ctrl)', ' (nKO vs Ctrl)')
Итак, в конце я запускаю эту последнюю строку:
coxph(data = mydata, formula = Survival ~ Sex * Genotype)
Результат выглядит так:
coef exp(coef) se(coef) z p
Sexm -0.5769 0.5616 0.2294 -2.514 0.011925
Genotype (nKO vs CRE_Ctrl) -0.9983 0.3685 0.2593 -3.850 0.000118
Genotype (nKO vs Ctrl) -0.4072 0.6655 0.2461 -1.654 0.098034
Sexm:Genotype (nKO vs CRE_Ctrl) 0.5940 1.8111 0.3483 1.705 0.088147
Sexm:Genotype (nKO vs Ctrl) 0.5607 1.7520 0.3444 1.628 0.103539
Ладно, похоже, у меня есть все, что я хочу. Однако я заметил одну вещь! Когда я меняю базовую линию для фактора пола на «m» вместо «f», как указано выше, я получаю другой результат:
D$Sex = relevel(D$Sex, ref = "m")
coxph(data = D, formula = Survival ~ Sex * Genotype)
coef exp(coef) se(coef) z p
Sexf 0.5769 1.7805 0.2294 2.514 0.0119
Genotype (nKO vs CRE_Ctrl) -0.4044 0.6674 0.2438 -1.658 0.0972
Genotype (nKO vs Ctrl) 0.1536 1.1660 0.2406 0.638 0.5232
Sexf:Genotype (nKO vs CRE_Ctrl) -0.5940 0.5521 0.3483 -1.705 0.0881
Sexf:Genotype (nKO vs Ctrl) -0.5607 0.5708 0.3444 -1.628 0.1035
Вы можете видеть, что у меня есть противоположный вывод для Sexf, Sexf: Genotype (nKO vs CRE_Ctrl) и Sexf: Genotype (nKO vs Ctrl), что я понимаю. Но не для Genotype (nKO vs CRE_Ctrl), Genotype (nKO vs Ctrl), что я не понимаю. Итак, я не понимаю, что здесь происходит. Почему мои контрасты для фактора генотипа без взаимодействий, кажется, зависят от исходного уровня из фактора пола? В самом деле, вы даже можете видеть, что значения p значимы с 'f' в качестве базовой линии (первый вывод coxph) для контрастов моих генотипов, тогда как значения p не значимы, когда 'm' является базовой линией (второй вывод coxph). Итак, какому из них доверять?
Вы можете объяснить мне, почему это происходит? Это мой первый анализ выживания, и я могу не знать многих вещей, касающихся этого типа анализов.
Заранее благодарим за ответы,