Потеря информации об испытательном номере как непрерывной переменной для линейных моделей? - DataScientist
1 голос
/ 03 октября 2019

Если я создаю линейную модель, в которой число испытаний является одним из предикторов, теряю ли я какую-либо информацию, рассматривая ее как непрерывную (когда на самом деле она на самом деле дискретная + порядковая)? Я считаю, что ответ - нет, но мой гугл-фу не может найти хорошее объяснение, почему.

РЕДАКТИРОВАТЬ, чтобы добавить: в текущем наборе анализов от 16 до 48 попыток на блок.

БОЛЬШЕ РЕДАКТИРОВ добавить: блоки прекращаются после минимального количества испытаний (16) и достижения критерия (10 из 12 предыдущих испытаний правильны) или после 48 испытаний, в зависимости от того, что наступит раньше.

Есть дватипы анализов, которые я выполняю:

(1) кривые прямого обучения от начала блока, которые идут только до испытания 16 (и, следовательно, отсутствуют пропущенные данные).

(2) кривые обратного обучения, где номер испытания нормализуется до точки, в которой был достигнут критерий (не совпадает с критерием завершения блока, но достаточно близко) в конкретном испытании, которое мы называем точкой обучения (LP). Затем идут испытания LP-2, LP-1, LP, LP + 1 и т. Д. Проблема в том, что чем дальше вы получаете от LP, тем меньше испытаний остается в наборе данных (технически это может быть LP-23,но есть очень мало участников, у которых есть один). Поэтому я пытаюсь запустить анализ, ориентированный на обучение, который учитывает пропущенные данные (следовательно, с использованием линейных смешанных моделей вместо ANOVA и т. Д.).

Я использую функцию fitlme mat labs и результаты моей моделиотличаются, если я скажу, что триал - это порядковый номер, если я оставлю его как непрерывную переменную (по умолчанию). Ни в коем случае это не имеет значения для качественной структуры результатов, но я хотел бы быть статистически строгим по этому поводу.

РЕДАКТИРОВАТЬ: я использую смешанную модель с Subject в качестве случайного эффекта и Trial какисправлено. Я склонен рассматривать Триал как непрерывный, а не порядковый, потому что разница, например, 3 теста, составляет половину расстояния между 6 испытаниями, что не так, если я рассматриваю его как порядковый.

...