Я тестую змішану модель із 4-ма предикторами: 2 категоричні предиктори (з 6 та 7 рівнями відповідно) та 2 кількісні прогнози.
Мені хотілося б знати, чи мені дозволяється під час тестування своєї моделі створювати умови взаємодії, в яких я змішую категоричні та кількісні прогнози.
Припустимо Y = f(a, b)
це модель, яку я хочу протестувати, a
є кількісним предиктором і b
є категоричним провісником.
Чи дозволено мені шукати (наприклад, R):
linfit <- lm(Y ~ a +b +a:b, data=mydata)
Інтерпретація результатів схожа на ту, яку я маю при змішуванні кількісних предикторів?
Відповіді:
0 для відповіді № 1По-перше, правильно написаний вами код, R дасть результат. І якщо клас b вже встановлений як фактор, R зробить регресію, розглядаючи b як категоричний предиктор.
По-друге, я припускаю, що ви запитуєте про цестатистичне тлумачення терміна взаємодії. Статистичне значення наведених нижче трьох ситуацій не однакове, (1) a і b - кількісні предиктори. В результаті регресії з R буде чотири рядки, a, b, aб, перехоплення. Процес регресії займає ab як інша кількісна величина і роблять лінійну регресію.
y = β0 + β1⋅a + β2⋅b + β3⋅a*b
(2) a і b є категоричними провісниками. Припустимо, а має 3 рівні, а b має 2. Накресліть проектну матрицю, яка складається з 1 або 0;
y = β0 + β1⋅a2 + β2⋅a3 + β3⋅b2 + β4⋅a2*b2 + β5⋅a3*b2
(3) a категоричний і b - кількісний предиктор. Припустимо, а має 3 рівні.
y = β0 + β1⋅a2 + β2⋅a3 + β3⋅b + β4⋅a2*b + β5⋅a3*b
Більш детально про термін взаємодії та матрицю проектування узагальнена лінійна модель розповість про це докладніше. Крім того, це легко випробувати в R за результатами регресії.