Что представляет собой взаимодействие непрерывной и категориальной переменной (Stata)?

Вот цитата из онлайн-руководства Stata: Если вы хотите взаимодействовать между непрерывной переменной и факторной переменной, просто поставьте перед непрерывной переменной префикс c. http://www.stata.com/features/overview/factor-variables/.

Они приводят следующий пример: smoker#c.bmi.

smoker - категориальная переменная, кодируемая как 1 некурящий, 2 курильщик, 3 заядлый курильщик.

bmi - это непрерывная переменная, индекс массы тела.

Когда они создают термин взаимодействия smoker#c.bmi, что он показывает и как его следует интерпретировать?


person Buras    schedule 17.04.2013    source источник


Ответы (1)


Мне кажется, что smoker - фиктивная переменная (1/0) [см. Примечание ниже]. Пожалуйста, дважды проверьте следующее предложение:

Мы запускаем линейную регрессию уровня холестерина на полном факториале возрастной группы и курит ли человек вместе с непрерывным индексом массы тела (bmi) и его взаимодействием с курит ли человек [курсив]

cholesterol = -0.517 smoker + 0.03455 bmi + 0.0245 bmi*smoker + other parts

Коэффициент при bmi указывает на влияние bmi на некурящих, тогда как коэффициент на bmi*smoker дает нарастающее влияние bmi на курильщика (то есть для курильщика это 0,03455 + 0,0245 против 0,03455 для некурящих). Значение термина взаимодействия указывает на то, что воздействие на уровень холестерина bmi выше у курильщиков, чем у некурящих.

Примечание. Существуют три возрастные категории, а не три категории курильщиков.

person Metrics    schedule 17.04.2013